Telegram Group Search
#人工智能
#开源项目
前两天的Deepseek v3发布,效果有点震惊,看论文所说,只用了2048张H800显卡,2个月不到时间训练完毕,计算预算只有不到600万美元就训练出来了新的模型。

与其他大模型玩家不同的是,deepseek背后是一家叫幻方量化的公司,不是传统的互联网企业,前几个月看到的采访《揭秘DeepSeek:一个更极致的中国技术理想主义故事》,更早的一篇采访《疯狂的幻方:一家隐形AI巨头的大模型之路》。
#Rust
#C++
2024年了,C++项目解决库依赖管理还是一坨XX
#新年
2025年了,我隐约预感到未来不少于我很重要的事情,都会在今年有一个开始。
#分布式
开写我的分布式原理教程,初步想好的名字是《图解分布式系统原理》。想写这个教程,是因为重读DDIA的过程中,发现在分布式这块,有很多地方没有展开写。例如happen before关系,例如共识算法(作者一笔带过,我严重怀疑他可能不会:)。

目前先在Latex上写,后续写好了会逐章公布在网站上。
#数据库
看到一个很有意思的视角(出处): 把数据库当做一个VM(Virtual Machine)的话,SQL就是操作这个VM的高级语言。
#数据库
#sqlite
前两天和一位同行聊起来:给传统的tp型数据库,增加列式数据处理能力,比如存取parquet数据、比如增加时序型数据的处理,好像还有点搞头。

有不少给postgresql增加了这些能力的项目了(例如pg_duckdb),我在想:也许也可以把这些做法照搬到sqlite上面。

另外,他也提到另一个观点:对于大部分企业来说,时序类+文本搜索类场景,应该覆盖了90%以上的AP需求了。
#Rust
国内知名Rust社区贡献者Folyd,之前曾经给Rust贡献了一个优化的二分查找实现:《优化 Rust 标准库的 binary_search》。

但是这个实现,会导致在有多个重复元素的情况下,返回是不确定的,最终导致了币圈某产品的翻车,这里可以看到作者的后续推文
我们回到这个问题本身:除了撤销这个修改,下一步应该在Rust标准库里增加多个重复元素的测试用例了吧?
#杂
一个国家的最高领导人,明目张胆发币敛财,叹为观止、闻所未闻。

(本来不想发这顿吐槽,实在是这几天被评论区的spam搞烦了)
distributed system illustrate(cn).pdf
1.3 MB
#分布式
从2025年开年后开始写一本分布式教程,到现在过去了20天(中间还花了小一周时间准备面试,最后还不合适),初步写好了两章,大家可以看看。由于只是初稿,错漏在所难免,就是给大家看看目前的完成度。两章内容里,自己手画了20多张图,按照我预估全部完成可能有8章的内容,所以最后可能要画200+张的图。我挺喜欢画图解释原理的,一图胜千言。
我特别喜欢在技术文章中画图,有两个原因:对作者而言,如果能用图表达思路,侧面说明是真的掌握了;对读者而言,图形也比一维的文字更容易理解、信息量更大,图形中可以增加联系、颜色、形状等多维度信息。

所以一方面要让自己真的掌握一个知识点,另一方面要锻炼自己的画图表达的能力,以画图来反向验证自己对知识的掌握。画图的一些心得,参考我以前写的文章:《技术配图的一些心得》。

至于我用的画图工具,现在如果是随手画的图,就用excalidraw;一些更为正式的图,就用Mac上的OmniGraffle,可以很方便得对齐、调整颜色、字号大小等等,大几百买断的单机单平台软件,但是超值。
Please open Telegram to view this post
VIEW IN TELEGRAM
#人工智能
#投资
周五英伟达跌了三个点,周一(2025.01.27)盘前接着跌9个点。

随着DeepSeek的火爆,验证了可以不用这么多GPU就可以达到良好的效果,这就动摇了英伟达做为人工智能硬通货的逻辑了,前阵子李开复的访谈也谈及这个问题:对于大模型公司,也要开始考虑资本回报率了。

也许对于英伟达来说,“思科时刻”就要来了。对于一个垂直的行业而言,底层基建的效率提升、成本降低,带来的就会是上层应用的爆发,正如2000时代思科之于互联网一样,所以很多人都说“2025年会是AI应用爆发的元年”。

两年前在Chatgpt出现的时候,果断买入了英伟达,现在回报已经足够,套现以后可以考虑新的投资标的:AI应用类的市场。
2025/06/15 20:05:04
Back to Top
HTML Embed Code: