#人工智能
我最近的一个感想,人工智能时代,知识的获取不再困难,但是获取经验仍然很难。就是说,很容易变成一个“知道分子”,但是一提具体问题的思路,就无从下手。
我最近的一个感想,人工智能时代,知识的获取不再困难,但是获取经验仍然很难。就是说,很容易变成一个“知道分子”,但是一提具体问题的思路,就无从下手。
#人工智能
从我的观察(朋友圈、微博、微信群)来看,今天GPT4.5发布的讨论度,甚至还不如DeepSeek今天公布的开源项目3FS。GPT 4.5没有什么讨论度,说明产品并不惊艳,距离当初的GPT 4发布已经过去了两年多了,这中间OpenAI只是发布了一个演示性质的Sora而已,两年多的时间过去,再没有交出实打实的好产品,领先的优势基本被追平了。
从我的观察(朋友圈、微博、微信群)来看,今天GPT4.5发布的讨论度,甚至还不如DeepSeek今天公布的开源项目3FS。GPT 4.5没有什么讨论度,说明产品并不惊艳,距离当初的GPT 4发布已经过去了两年多了,这中间OpenAI只是发布了一个演示性质的Sora而已,两年多的时间过去,再没有交出实打实的好产品,领先的优势基本被追平了。
Openai
Introducing GPT-4.5
We’re releasing a research preview of GPT‑4.5—our largest and best model for chat yet. GPT‑4.5 is a step forward in scaling up pre-training and post-training.
#人工智能
最近在朋友圈看到大量的腾讯元宝广告。毫无意外,在大量的广告投入以后,腾讯元宝也一下超越豆包、DeepSeek官方App来到第一名。
在DeepSeek完成市场用户教育,打好基建(将模型开源)以后,凭借社交媒体的优势,腾讯元宝只要能够支持好普通人使用DeepSeek模型,摘下这个桃子一点都不意外,也早就驾轻就熟了。
可换一个角度来想,DeepSeek同样也是需要腾讯的社交来帮助自己更广泛传播的。这就好比果实要通过被鸟吃下,才能完成种子的传播一样。DeepSeek志在建立一个更广泛的开源模型生态,而搭上腾讯的便车,让更多一般老百姓就能使用上它的模型,才是后续建立生态的基础。
从这个角度而言,两者相互需要,因为诉求不一样但却互补:鸟想果腹,而果实希望被传播。
最近在朋友圈看到大量的腾讯元宝广告。毫无意外,在大量的广告投入以后,腾讯元宝也一下超越豆包、DeepSeek官方App来到第一名。
在DeepSeek完成市场用户教育,打好基建(将模型开源)以后,凭借社交媒体的优势,腾讯元宝只要能够支持好普通人使用DeepSeek模型,摘下这个桃子一点都不意外,也早就驾轻就熟了。
可换一个角度来想,DeepSeek同样也是需要腾讯的社交来帮助自己更广泛传播的。这就好比果实要通过被鸟吃下,才能完成种子的传播一样。DeepSeek志在建立一个更广泛的开源模型生态,而搭上腾讯的便车,让更多一般老百姓就能使用上它的模型,才是后续建立生态的基础。
从这个角度而言,两者相互需要,因为诉求不一样但却互补:鸟想果腹,而果实希望被传播。
#开源项目
krep - 一个C写的高性能的字符串搜索工具
github.com/davidesantangelo/krep
krep 的设计以性能为主要目标:
🌟内存映射 I/O:避免昂贵的 read() 系统调用
🌟优化算法:默认使用 Boyer-Moore-Horspool 算法
🌟SIMD 加速: 在可用时利用 SSE4.2 或 AVX2
🌟多线程: 并行处理大文件的块
🌟最小化内存分配: 减少内存开销和碎片化
感觉可以拿来学一学SIMD编程,正好不会。
krep - 一个C写的高性能的字符串搜索工具
github.com/davidesantangelo/krep
krep 的设计以性能为主要目标:
🌟内存映射 I/O:避免昂贵的 read() 系统调用
🌟优化算法:默认使用 Boyer-Moore-Horspool 算法
🌟SIMD 加速: 在可用时利用 SSE4.2 或 AVX2
🌟多线程: 并行处理大文件的块
🌟最小化内存分配: 减少内存开销和碎片化
感觉可以拿来学一学SIMD编程,正好不会。
GitHub
GitHub - davidesantangelo/krep: Fast text search tool with advanced algorithms, SIMD acceleration, multi-threading, and regex support.…
Fast text search tool with advanced algorithms, SIMD acceleration, multi-threading, and regex support. Designed for rapid, large-scale pattern matching with memory-mapped I/O and hardware optimizat...
#方法论
写技术博客时,我很喜欢画图来表达原理。也因为自己画的图多了,有了一层感悟:但凡能把技术原理通过画图清晰表达出来的,一般文章内容也不会太差。这是因为,画图不同于文字和简单的贴代码,是经过作者理解了原理再翻译成图形语言的。
按照这个推论,得到一个搜索优质技术文章的技巧:使用Google搜索技术文章时,以前是根据关键字搜索相信搜索引擎的排名,现在可以试一下切换到Google搜索中“图片”那一栏看看。图片这一栏可以在不用点击文章的情况下马上看到文章中的一些缩略图,根据画的缩略图能大体判断文章的质量。
写技术博客时,我很喜欢画图来表达原理。也因为自己画的图多了,有了一层感悟:但凡能把技术原理通过画图清晰表达出来的,一般文章内容也不会太差。这是因为,画图不同于文字和简单的贴代码,是经过作者理解了原理再翻译成图形语言的。
按照这个推论,得到一个搜索优质技术文章的技巧:使用Google搜索技术文章时,以前是根据关键字搜索相信搜索引擎的排名,现在可以试一下切换到Google搜索中“图片”那一栏看看。图片这一栏可以在不用点击文章的情况下马上看到文章中的一些缩略图,根据画的缩略图能大体判断文章的质量。
#杂
今天扛叱扛叱写了1000多行代码。我感觉即使我在思路清晰的时候,一天的输出也就是1千多行代码,大概7个小时的高效工作时间,这个时长的专注度和输出对我来说顶天了。
今天扛叱扛叱写了1000多行代码。我感觉即使我在思路清晰的时候,一天的输出也就是1千多行代码,大概7个小时的高效工作时间,这个时长的专注度和输出对我来说顶天了。
#杂
去年十月份去了一趟普陀山。从舟山机场出来,还得转轮船才能到达普陀山所在的小岛。去往普陀山的码头门口上大字写着“彼岸”两个字,普陀山是中国佛教圣地,所以“彼岸”在这里有一语双关的意思,感觉太酷啦。
去年十月份去了一趟普陀山。从舟山机场出来,还得转轮船才能到达普陀山所在的小岛。去往普陀山的码头门口上大字写着“彼岸”两个字,普陀山是中国佛教圣地,所以“彼岸”在这里有一语双关的意思,感觉太酷啦。
#分布式
公众号荒了很久,转一篇XP写的《理解 Calvin - Fast Distributed Transactions》。
最近忙着写面试的论文题目,分布式教程的撰写又停滞了一段时间,目前写到分布式事务章节了,整体进度50%。
公众号荒了很久,转一篇XP写的《理解 Calvin - Fast Distributed Transactions》。
最近忙着写面试的论文题目,分布式教程的撰写又停滞了一段时间,目前写到分布式事务章节了,整体进度50%。
Telegram
codedump的电报频道
#分布式
从2025年开年后开始写一本分布式教程,到现在过去了20天(中间还花了小一周时间准备面试,最后还不合适),初步写好了两章,大家可以看看。由于只是初稿,错漏在所难免,就是给大家看看目前的完成度。两章内容里,自己手画了20多张图,按照我预估全部完成可能有8章的内容,所以最后可能要画200+张的图。我挺喜欢画图解释原理的,一图胜千言。
从2025年开年后开始写一本分布式教程,到现在过去了20天(中间还花了小一周时间准备面试,最后还不合适),初步写好了两章,大家可以看看。由于只是初稿,错漏在所难免,就是给大家看看目前的完成度。两章内容里,自己手画了20多张图,按照我预估全部完成可能有8章的内容,所以最后可能要画200+张的图。我挺喜欢画图解释原理的,一图胜千言。
#工具
国内很多网站(微博、知乎等)在跳转外链时,会弹出一个提醒确认界面。可以安装油猴脚本Open the F**king URL Right Now实现自动跳转。最新的版本里,还把微博跳转外链时加上的continueflag参数去掉了,这个功能在收藏网页的时候挺实用的,因为像Raindrop这样的收藏网页工具里,同一个地址带的参数不同会被认为是不同的网址。
作者是之前推荐过的Douban book+插件的作者OldPanda。
国内很多网站(微博、知乎等)在跳转外链时,会弹出一个提醒确认界面。可以安装油猴脚本Open the F**king URL Right Now实现自动跳转。最新的版本里,还把微博跳转外链时加上的continueflag参数去掉了,这个功能在收藏网页的时候挺实用的,因为像Raindrop这样的收藏网页工具里,同一个地址带的参数不同会被认为是不同的网址。
作者是之前推荐过的Douban book+插件的作者OldPanda。