Microsandbox 是一个用于运行不可信代码的虚拟化隔离平台,旨在为 AI 代理、开发者以及需要安全执行代码的用户,提供兼具速度与安全性的解决方案。传统运行不可信代码的方式存在诸多问题:本地运行可能导致系统被恶意脚本攻击;容器共享内核,难以抵御复杂攻击;传统虚拟机启动缓慢,严重影响效率;云解决方案则可能成本高昂且受制于云服务提供商。Microsandbox 通过以下优势解决了这些问题:
1. 绝对安全,提供真正的虚拟机隔离,拥有独立内核;
2. 瞬间启动,启动时间低于 200 毫秒,远快于传统虚拟机;
3. 自主控制,支持自托管并完全掌控基础设施;
4. 兼容 OCI,能够与标准容器镜像配合使用;
5. AI 能力,内置 MCP(模型上下文协议)服务器,便于与 AI 工具无缝集成。
Microsandbox 的安装和启动非常便捷,用户只需通过一行命令即可完成安装并快速启动,从而立即开始执行代码。此外,Microsandbox 的服务器原生支持 MCP,能够与 Claude 或其他兼容 MCP 的 AI 工具在几秒内完成连接,为 AI 集成提供了极大的便利。Microsandbox 可以用于构建多种应用场景,包括 AI 代码执行平台,使 AI 助手能够安全地运行其生成的代码,无论是简单的 Python 脚本还是复杂的 Web 应用,都能在实时环境中运行、测试和调试代码,而无需担心基础设施的安全性;安全数据分析服务,允许用户上传数据集并运行自定义分析脚本,支持各种数据科学栈,如 Python 的 pandas、用于统计的 R 或高性能计算的 Julia,同时保持完全隔离;交互式学习环境,为教育和培训部署即时编码环境,学生可以在浏览器中直接编写、编译和执行任何编程语言的代码,而平台能够保持完全的安全隔离;持续集成与测试,能够快速原型化和测试微服务,启动完整的应用程序栈,测试 API 集成并验证部署配置,而不会影响主基础设施,非常适合 CI/CD 管道、集成测试和概念验证开发。
#Tools #AI #sandbox
https://docs.microsandbox.dev/
1. 绝对安全,提供真正的虚拟机隔离,拥有独立内核;
2. 瞬间启动,启动时间低于 200 毫秒,远快于传统虚拟机;
3. 自主控制,支持自托管并完全掌控基础设施;
4. 兼容 OCI,能够与标准容器镜像配合使用;
5. AI 能力,内置 MCP(模型上下文协议)服务器,便于与 AI 工具无缝集成。
Microsandbox 的安装和启动非常便捷,用户只需通过一行命令即可完成安装并快速启动,从而立即开始执行代码。此外,Microsandbox 的服务器原生支持 MCP,能够与 Claude 或其他兼容 MCP 的 AI 工具在几秒内完成连接,为 AI 集成提供了极大的便利。Microsandbox 可以用于构建多种应用场景,包括 AI 代码执行平台,使 AI 助手能够安全地运行其生成的代码,无论是简单的 Python 脚本还是复杂的 Web 应用,都能在实时环境中运行、测试和调试代码,而无需担心基础设施的安全性;安全数据分析服务,允许用户上传数据集并运行自定义分析脚本,支持各种数据科学栈,如 Python 的 pandas、用于统计的 R 或高性能计算的 Julia,同时保持完全隔离;交互式学习环境,为教育和培训部署即时编码环境,学生可以在浏览器中直接编写、编译和执行任何编程语言的代码,而平台能够保持完全的安全隔离;持续集成与测试,能够快速原型化和测试微服务,启动完整的应用程序栈,测试 API 集成并验证部署配置,而不会影响主基础设施,非常适合 CI/CD 管道、集成测试和概念验证开发。
#Tools #AI #sandbox
https://docs.microsandbox.dev/
docs.microsandbox.dev
INTRODUCTION | Microsandbox Docs
Run untrusted code with VM-level isolation and lightning-fast startup.
“白领血洗(裁员)”都是 AI 炒作的一部分
Allison Morrow 对 Anthropic 公司首席执行官 Dario Amodei 的言论进行了分析。Amodei 近期在接受 Axios 和 CNN 采访时表示,AI 技术可能会在未来几年内消灭一半的入门级办公室工作岗位,他还提到 AI 将在几乎所有智力任务上超越人类,这将对社会产生巨大影响。然而,Amodei 并未提供任何研究或证据来支持他关于 50% 的工作岗位将被消灭的估计。
Amodei 的言论是硅谷常见的夸张说法的一部分,即 AI 将会解决一切问题,但在此之前会先破坏一切。这种说法缺乏具体的证据支持,更像是为了吸引关注而进行的炒作。例如,Amodei 提到 AI 将会带来一个癌症被治愈、经济年增长率达到 10% 的乌托邦,但同时却有 20% 的人失业。这种说法忽视了失业人群将无法消费从而影响经济增长的现实问题。
一些 AI 乐观主义者也对 Amodei 的言论表示不满。例如,科技企业家 Mark Cuban 指出,历史上也曾出现过类似的工作岗位被技术取代的情况,但新的公司和工作岗位也会随之出现,从而增加总就业机会。
此外,Anthropic 公司将自己定位为一个“AI 安全和研究”公司,声称看到了 AI 的潜在危害。然而,Amodei 的言论更像是在为公司产品做广告,而不是真正提供解决方案。AI 公司需要展示他们的技术如何能够真正地改变经济,而不是仅仅强调风险。
尽管大型语言模型如 ChatGPT 和 Claude 在某些特定任务上表现出色,但它们也存在明显的局限性,例如会产生错误信息、容易被操纵等。因此,AI 技术是否能够真正带来经济革命,目前还远未可知。
#AI #分析 #思考
https://www.cnn.com/2025/05/30/business/anthropic-amodei-ai-jobs-nightcap
Allison Morrow 对 Anthropic 公司首席执行官 Dario Amodei 的言论进行了分析。Amodei 近期在接受 Axios 和 CNN 采访时表示,AI 技术可能会在未来几年内消灭一半的入门级办公室工作岗位,他还提到 AI 将在几乎所有智力任务上超越人类,这将对社会产生巨大影响。然而,Amodei 并未提供任何研究或证据来支持他关于 50% 的工作岗位将被消灭的估计。
Amodei 的言论是硅谷常见的夸张说法的一部分,即 AI 将会解决一切问题,但在此之前会先破坏一切。这种说法缺乏具体的证据支持,更像是为了吸引关注而进行的炒作。例如,Amodei 提到 AI 将会带来一个癌症被治愈、经济年增长率达到 10% 的乌托邦,但同时却有 20% 的人失业。这种说法忽视了失业人群将无法消费从而影响经济增长的现实问题。
一些 AI 乐观主义者也对 Amodei 的言论表示不满。例如,科技企业家 Mark Cuban 指出,历史上也曾出现过类似的工作岗位被技术取代的情况,但新的公司和工作岗位也会随之出现,从而增加总就业机会。
此外,Anthropic 公司将自己定位为一个“AI 安全和研究”公司,声称看到了 AI 的潜在危害。然而,Amodei 的言论更像是在为公司产品做广告,而不是真正提供解决方案。AI 公司需要展示他们的技术如何能够真正地改变经济,而不是仅仅强调风险。
尽管大型语言模型如 ChatGPT 和 Claude 在某些特定任务上表现出色,但它们也存在明显的局限性,例如会产生错误信息、容易被操纵等。因此,AI 技术是否能够真正带来经济革命,目前还远未可知。
#AI #分析 #思考
https://www.cnn.com/2025/05/30/business/anthropic-amodei-ai-jobs-nightcap
CNN
The ‘white-collar bloodbath’ is all part of the AI hype machine
If the CEO of a soda company declared that soda-making technology is getting so good it’s going to ruin the global economy, you’d be forgiven for thinking that person is either lying or fully detached from reality.
OpenAI、Google 和 Anthropic 最近发布了多份关于 AI 的指南,涵盖了 Prompt 工程、构建有效 Agent、AI 在商业中的应用以及 601 种 AI 用例等多个主题。
#指南 #AI
https://x.com/CodeByPoonam/status/1928452774276337928
#指南 #AI
https://x.com/CodeByPoonam/status/1928452774276337928
X (formerly Twitter)
Poonam Soni (@CodeByPoonam) on X
OpenAI, Google, and Anthropic just dropped the guides on:
- Prompt Engineering
- Building effective Agents
- AI in Business
- 601 AI use cases
and so much more...
9 best guides you don’t want to miss:
- Prompt Engineering
- Building effective Agents
- AI in Business
- 601 AI use cases
and so much more...
9 best guides you don’t want to miss:
Cline 近期工程最佳实践分享会上总结的 12 个专业 AI 编程技巧:
1. 编码前花 10 分钟规划,胜过 2 小时盲目编写。像培训新开发者那样向 AI 简要说明:架构、约束条件、目标及现有模式。这能节省后期大量重构时间。
2. 复杂任务选用高级模型。Gemini 2.5 Pro(100 万 tokens)和 Claude 3.7/4 Sonnet 的表现远超经济型模型。对于复杂工作,其成本差异往往物有所值。
3. 时刻关注上下文窗口。容量超过 50%后性能会下降。在长时间会话中,使用实现文档、交接摘要或/newtask 功能来保持高效。
4. 为你的标准创建规则文件。一次性定义好编码模式、项目结构和工作流程。每次 AI 会话都会自动加载这些上下文。
5. 预先完整表达你的意图。AI 能读取文件但不了解你的目标、限制条件和愿景。解释你想要实现什么以及为什么这样做,以建立共同理解。
6. 把 AI 当作一个聪明但健忘的开发者。它能写出出色的代码,但需要你不断指导它理解你想要实现的目标。
7. 在规划阶段保持协作。不要直接跳转到实施环节。先讨论架构、探索替代方案、验证方法,再开始编写代码。
8. 为长期项目建立记忆库。创建由 AI 维护的 Markdown 文件,记录项目背景、进度和学习心得。这对复杂构建和任务交接至关重要。
9. 复杂工作考虑使用高级模型。使用顶级模型的开发者通常比单纯追求成本优化的团队交付更快。生产力提升足以证明这笔开支的合理性。
10. 掌握上下文管理策略。了解何时压缩上下文(/smol)、何时新建任务(/newtask)、何时创建交接文档。这区分了高效开发者与举步维艰的开发者。
11. 通过共享规则文件构建团队知识库。对 AI 指令进行版本控制。新成员能立即了解团队的编码规范。
12. 拥抱范式转变。这不是要取代开发者——而是用 AI 能力放大人类洞察力。优秀团队早已领悟这一点。
#AI #编程 #技巧 #Vibe_Coding
https://x.com/cline/status/1928901840969805828
1. 编码前花 10 分钟规划,胜过 2 小时盲目编写。像培训新开发者那样向 AI 简要说明:架构、约束条件、目标及现有模式。这能节省后期大量重构时间。
2. 复杂任务选用高级模型。Gemini 2.5 Pro(100 万 tokens)和 Claude 3.7/4 Sonnet 的表现远超经济型模型。对于复杂工作,其成本差异往往物有所值。
3. 时刻关注上下文窗口。容量超过 50%后性能会下降。在长时间会话中,使用实现文档、交接摘要或/newtask 功能来保持高效。
4. 为你的标准创建规则文件。一次性定义好编码模式、项目结构和工作流程。每次 AI 会话都会自动加载这些上下文。
5. 预先完整表达你的意图。AI 能读取文件但不了解你的目标、限制条件和愿景。解释你想要实现什么以及为什么这样做,以建立共同理解。
6. 把 AI 当作一个聪明但健忘的开发者。它能写出出色的代码,但需要你不断指导它理解你想要实现的目标。
7. 在规划阶段保持协作。不要直接跳转到实施环节。先讨论架构、探索替代方案、验证方法,再开始编写代码。
8. 为长期项目建立记忆库。创建由 AI 维护的 Markdown 文件,记录项目背景、进度和学习心得。这对复杂构建和任务交接至关重要。
9. 复杂工作考虑使用高级模型。使用顶级模型的开发者通常比单纯追求成本优化的团队交付更快。生产力提升足以证明这笔开支的合理性。
10. 掌握上下文管理策略。了解何时压缩上下文(/smol)、何时新建任务(/newtask)、何时创建交接文档。这区分了高效开发者与举步维艰的开发者。
11. 通过共享规则文件构建团队知识库。对 AI 指令进行版本控制。新成员能立即了解团队的编码规范。
12. 拥抱范式转变。这不是要取代开发者——而是用 AI 能力放大人类洞察力。优秀团队早已领悟这一点。
#AI #编程 #技巧 #Vibe_Coding
https://x.com/cline/status/1928901840969805828
X (formerly Twitter)
Cline (@cline) on X
Happy weekend 🫡
Here's 12 professional AI coding techniques from a recent engineering best practices session 👇
1. Plan for 10 minutes before coding for 2 hours. Brief your AI like onboarding a new developer: architecture, constraints, goals, existing patterns.…
Here's 12 professional AI coding techniques from a recent engineering best practices session 👇
1. Plan for 10 minutes before coding for 2 hours. Brief your AI like onboarding a new developer: architecture, constraints, goals, existing patterns.…
日本研究人员开发出可替代塑料的 "透明纸";新材料可生物降解,生产过程中碳排放量低
日本海洋地球科学技术机构(JAMSTEC)及其他机构的研究团队开发出一种以植物生物质纤维素为原料制成的厚透明纸张,这种纸张可被微生物分解为水和二氧化碳,有望作为塑料的替代品用于制造容器,从而减少海洋污染。研究人员利用棉籽表面纤维制成的纤维素粉末,将其溶解在溴化锂水溶液中,通过高温处理使其成为凝胶状,随后进行成型和干燥。实验表明,这种透明纸张的强度与聚碳酸酯塑料相当,且由于其纳米级纤维的紧密排列,光线能够直接穿透纸张而不发生散射,即使厚度达到 0.7 毫米,仍具有良好的柔韧性和透明度,能够清晰看到 100 米外的景物。此外,该团队还对透明纸张的海洋生物降解性进行了测试,结果显示即使在 757 米深的海底,纸张也能在四个月内基本被微生物分解。与传统纸张包装相比,透明纸张解决了消费者无法看到包装内物品的问题,但要实现大规模生产,仍需具备相应技术的工厂。JAMSTEC 副首席研究员伊曾部纪行表示,若建立示范实验工厂,预计生产成本约为普通纸张的三倍,但二氧化碳排放量仅为塑料生产过程的一半。大阪大学木材材料专家野木正也教授指出,与其他透明纸张相比,这种纸张的优势在于其在深海环境中已被证实具有生物可降解性。
#资讯 #科学
https://japannews.yomiuri.co.jp/science-nature/technology/20250605-259501/
日本海洋地球科学技术机构(JAMSTEC)及其他机构的研究团队开发出一种以植物生物质纤维素为原料制成的厚透明纸张,这种纸张可被微生物分解为水和二氧化碳,有望作为塑料的替代品用于制造容器,从而减少海洋污染。研究人员利用棉籽表面纤维制成的纤维素粉末,将其溶解在溴化锂水溶液中,通过高温处理使其成为凝胶状,随后进行成型和干燥。实验表明,这种透明纸张的强度与聚碳酸酯塑料相当,且由于其纳米级纤维的紧密排列,光线能够直接穿透纸张而不发生散射,即使厚度达到 0.7 毫米,仍具有良好的柔韧性和透明度,能够清晰看到 100 米外的景物。此外,该团队还对透明纸张的海洋生物降解性进行了测试,结果显示即使在 757 米深的海底,纸张也能在四个月内基本被微生物分解。与传统纸张包装相比,透明纸张解决了消费者无法看到包装内物品的问题,但要实现大规模生产,仍需具备相应技术的工厂。JAMSTEC 副首席研究员伊曾部纪行表示,若建立示范实验工厂,预计生产成本约为普通纸张的三倍,但二氧化碳排放量仅为塑料生产过程的一半。大阪大学木材材料专家野木正也教授指出,与其他透明纸张相比,这种纸张的优势在于其在深海环境中已被证实具有生物可降解性。
#资讯 #科学
https://japannews.yomiuri.co.jp/science-nature/technology/20250605-259501/
japannews.yomiuri.co.jp
Japanese Researchers Develop ‘Transparent Paper’ as Alternative to Plastics; New Material Is Biodegradable, Can Be Produced with…
<p>A team of researchers with the Japan Agency for Marine-Earth Science and Technology (JAMSTEC) and other entities have developed thick sheets of transparent paper using cellulose, a material made from plant biomass.</p>
我不记得我的生活,但没关系
Marco Giancotti 探讨了自己患有 aphantasia 和可能的 SDAM(Severely Deficient Autobiographical Memory)对记忆和生活的影响。aphantasia 是一种无法在脑海中形成图像、声音或其他感觉的心理现象,而 SDAM 则是一种难以回忆过去事件的自传体记忆障碍。Giancotti 表示,尽管他无法像常人一样回忆起具体的过去场景,但这并未给他带来生活上的重大不便,他依然在许多方面取得了成功。
在回忆具体事件时,Giancotti 面临巨大困难。例如,在申请工作时,他无法回答关于大学时期解决难题的经历,因为他无法从记忆中提取出具体的事件。他的记忆更像是一个没有标签的文件柜,无法通过关键词快速检索。他只能通过非常具体的提示和外部帮助,有时才能回忆起一些片段。在尝试回忆已故祖父时,他也只能记起一些模糊的、没有具体情节的片段,而无法重现具体的场景或对话。
Giancotti 认为,这种记忆障碍主要带来情感上的困扰,而非实际生活中的不便。研究表明,aphantasia 患者作为目击者的准确性并不比常人差,尽管他们回忆的信息可能不那么完整,但错误率并不更高。他的语义记忆(对事实和概念的记忆)和空间记忆(对地点和布局的记忆)是完好的,这帮助他在一定程度上弥补了自传体记忆的不足。例如,他能够清晰地回忆起曾经居住过的房屋布局或城市的路线,这些空间记忆甚至可以作为他回忆过去事件的“索引”。
尽管存在记忆障碍,Giancotti 认为这也有积极的一面。由于缺乏对过去的怀旧和对未来的幻想,他能够更专注于当下,并努力在当下理解新信息,从而提升自己的理性思维能力。他强调,尽管他的记忆方式与常人不同,但他依然能够从经历中学习,形成更复杂的心理模型,这些模型帮助他预测未来并应对日常生活。他还指出,目前没有证据表明这种记忆“缺陷”在实践中会带来显著的劣势,反而可能通过替代性的认知策略来弥补。
#生活 #思考
https://aethermug.com/posts/i-do-not-remember-my-life-and-it-s-fine
Marco Giancotti 探讨了自己患有 aphantasia 和可能的 SDAM(Severely Deficient Autobiographical Memory)对记忆和生活的影响。aphantasia 是一种无法在脑海中形成图像、声音或其他感觉的心理现象,而 SDAM 则是一种难以回忆过去事件的自传体记忆障碍。Giancotti 表示,尽管他无法像常人一样回忆起具体的过去场景,但这并未给他带来生活上的重大不便,他依然在许多方面取得了成功。
在回忆具体事件时,Giancotti 面临巨大困难。例如,在申请工作时,他无法回答关于大学时期解决难题的经历,因为他无法从记忆中提取出具体的事件。他的记忆更像是一个没有标签的文件柜,无法通过关键词快速检索。他只能通过非常具体的提示和外部帮助,有时才能回忆起一些片段。在尝试回忆已故祖父时,他也只能记起一些模糊的、没有具体情节的片段,而无法重现具体的场景或对话。
Giancotti 认为,这种记忆障碍主要带来情感上的困扰,而非实际生活中的不便。研究表明,aphantasia 患者作为目击者的准确性并不比常人差,尽管他们回忆的信息可能不那么完整,但错误率并不更高。他的语义记忆(对事实和概念的记忆)和空间记忆(对地点和布局的记忆)是完好的,这帮助他在一定程度上弥补了自传体记忆的不足。例如,他能够清晰地回忆起曾经居住过的房屋布局或城市的路线,这些空间记忆甚至可以作为他回忆过去事件的“索引”。
尽管存在记忆障碍,Giancotti 认为这也有积极的一面。由于缺乏对过去的怀旧和对未来的幻想,他能够更专注于当下,并努力在当下理解新信息,从而提升自己的理性思维能力。他强调,尽管他的记忆方式与常人不同,但他依然能够从经历中学习,形成更复杂的心理模型,这些模型帮助他预测未来并应对日常生活。他还指出,目前没有证据表明这种记忆“缺陷”在实践中会带来显著的劣势,反而可能通过替代性的认知策略来弥补。
#生活 #思考
https://aethermug.com/posts/i-do-not-remember-my-life-and-it-s-fine
知识型工作正在消亡——接下来会发生什么?
随着人工智能的快速发展,传统的知识工作正逐渐被取代,而未来的工作将更加注重智慧工作。Hudson 是 Art of Accomplishment 的创始人,他与 OpenAI、Alphabet 和苹果等公司的高管合作,帮助他们开发人工智能无法复制的技能。
Hudson 指出,在过去,知识是稀缺资源,积累技能和专业知识能够让人脱颖而出,但如今,随着人工智能模型能够在短时间内吸收整个领域的知识,知识和技能正在被商品化,未来即使是顶尖人才也可能被替代。他以微软为例,强调智慧技能如情感清晰、洞察力和连接能力才是未来的关键。在微软 CEO 萨提亚·纳德拉的领导下,公司通过培养这些能力,市值从 3000 亿美元增长到 3 万亿美元。
智慧是通过经验、反思和时间积累而形成的,它无法被复制或粘贴,是一种身体化的体验。人工智能无法代替人类去体验生活中的情感信号、感知隐藏的恐惧或理解客户未言明的意图。因此,未来的经济将更加重视智慧工作者,他们的核心技能包括情感清晰、洞察力和连接能力。
情感清晰是指能够认真对待情绪,但不被情绪左右。许多人通过压抑或管理情绪来避免面对真实的情感,但这些方法往往会适得其反。情感清晰能够帮助人们在决策时更加清晰,避免因情绪回避而导致的拖延和错误选择。
洞察力则超越了数据的堆砌,它要求人们能够清晰地看待事物的本质。Hudson 指出,人们与自己的关系会影响他们如何看待世界。如果一个人无法清晰地看待自己,他的洞察力就会受到损害。他建议通过学会善待自己,改变与自己的关系,从而提高洞察力。
连接能力是智慧工作的另一个关键技能。Hudson 提出了一个名为 VIEW 的框架,即脆弱性、公正性、同理心和好奇心。通过这个框架,人们可以建立深度的连接,而不是通过成就来获得连接。研究表明,团队成员之间感到安全并能够自由表达意见的团队,学习速度更快,达成目标的可能性更高。
随着人工智能的发展,知识和技能将不再是衡量一个人能力的主要标准,而是情感清晰、洞察力和连接能力等智慧技能。他呼吁人们重视这些技能的培养,因为它们将成为未来工作和生活中不可或缺的部分。
#AI #思考
https://every.to/thesis/knowledge-work-is-dying-here-s-what-comes-next/
随着人工智能的快速发展,传统的知识工作正逐渐被取代,而未来的工作将更加注重智慧工作。Hudson 是 Art of Accomplishment 的创始人,他与 OpenAI、Alphabet 和苹果等公司的高管合作,帮助他们开发人工智能无法复制的技能。
Hudson 指出,在过去,知识是稀缺资源,积累技能和专业知识能够让人脱颖而出,但如今,随着人工智能模型能够在短时间内吸收整个领域的知识,知识和技能正在被商品化,未来即使是顶尖人才也可能被替代。他以微软为例,强调智慧技能如情感清晰、洞察力和连接能力才是未来的关键。在微软 CEO 萨提亚·纳德拉的领导下,公司通过培养这些能力,市值从 3000 亿美元增长到 3 万亿美元。
智慧是通过经验、反思和时间积累而形成的,它无法被复制或粘贴,是一种身体化的体验。人工智能无法代替人类去体验生活中的情感信号、感知隐藏的恐惧或理解客户未言明的意图。因此,未来的经济将更加重视智慧工作者,他们的核心技能包括情感清晰、洞察力和连接能力。
情感清晰是指能够认真对待情绪,但不被情绪左右。许多人通过压抑或管理情绪来避免面对真实的情感,但这些方法往往会适得其反。情感清晰能够帮助人们在决策时更加清晰,避免因情绪回避而导致的拖延和错误选择。
洞察力则超越了数据的堆砌,它要求人们能够清晰地看待事物的本质。Hudson 指出,人们与自己的关系会影响他们如何看待世界。如果一个人无法清晰地看待自己,他的洞察力就会受到损害。他建议通过学会善待自己,改变与自己的关系,从而提高洞察力。
连接能力是智慧工作的另一个关键技能。Hudson 提出了一个名为 VIEW 的框架,即脆弱性、公正性、同理心和好奇心。通过这个框架,人们可以建立深度的连接,而不是通过成就来获得连接。研究表明,团队成员之间感到安全并能够自由表达意见的团队,学习速度更快,达成目标的可能性更高。
随着人工智能的发展,知识和技能将不再是衡量一个人能力的主要标准,而是情感清晰、洞察力和连接能力等智慧技能。他呼吁人们重视这些技能的培养,因为它们将成为未来工作和生活中不可或缺的部分。
#AI #思考
https://every.to/thesis/knowledge-work-is-dying-here-s-what-comes-next/
Every
Knowledge Work Is Dying—Here’s What Comes Next
While AI devours information-based roles, OpenAI, Alphabet, and Apple are investing in wisdom work—and you can, too
Google AI Edge Gallery 是一个实验性应用程序,由 Google AI Edge 团队开发,旨在让用户探索、体验和评估移动端生成式人工智能(GenAI)的未来。该应用程序支持在 Android(现已推出)和 iOS(即将推出)设备上运行,完全离线操作,无需联网即可使用。用户可以尝试不同的模型,进行图像问答、文本生成、多轮对话等功能。
其核心功能包括:本地运行,完全离线,所有处理直接在设备上完成;选择模型,用户可以轻松切换 Hugging Face 上的不同模型并比较性能;图像问答,上传图片后可提问并获取描述、解决问题或识别物体;提示实验室,支持总结、改写、生成代码等单轮语言模型用例;AI 聊天,支持多轮对话;性能洞察,提供实时基准测试(如首次生成时间、解码速度、延迟);自带模型测试,用户可以测试本地 LiteRT .task 模型;开发者资源,提供模型卡片和源代码的快速链接。
#AI #APP
https://github.com/google-ai-edge/gallery
其核心功能包括:本地运行,完全离线,所有处理直接在设备上完成;选择模型,用户可以轻松切换 Hugging Face 上的不同模型并比较性能;图像问答,上传图片后可提问并获取描述、解决问题或识别物体;提示实验室,支持总结、改写、生成代码等单轮语言模型用例;AI 聊天,支持多轮对话;性能洞察,提供实时基准测试(如首次生成时间、解码速度、延迟);自带模型测试,用户可以测试本地 LiteRT .task 模型;开发者资源,提供模型卡片和源代码的快速链接。
#AI #APP
https://github.com/google-ai-edge/gallery
GitHub
GitHub - google-ai-edge/gallery: A gallery that showcases on-device ML/GenAI use cases and allows people to try and use models…
A gallery that showcases on-device ML/GenAI use cases and allows people to try and use models locally. - google-ai-edge/gallery
程序员 Prompt 工程实战指南
开发者越来越依赖 AI 编程助手来加速日常工作流程,这些工具能够自动补全函数、建议修复错误,甚至生成整个模块或最小可行性产品(MVP)。然而,AI 输出的质量很大程度上取决于提供的提示(prompt)质量。提示工程已成为一项必备技能,良好的提示能够产生深思熟虑、准确甚至富有创意的代码解决方案,而糟糕的提示则可能得到无关或泛泛的答案。
AI 编程助手并非万能,它们对项目或意图的了解仅限于开发者提供的信息。因此,提供丰富上下文至关重要,包括编程语言、框架、库以及具体的功能或代码片段。如果存在错误,需提供确切的错误信息并描述代码的预期功能。具体性和上下文是区分模糊建议和精准、可操作解决方案的关键。此外,明确目标或问题也非常重要,避免使用模糊的查询,而是要精准地表达需要的见解。
对于复杂任务,应将其分解为较小的部分并逐步迭代。例如,在实现新功能时,可以先生成一个 React 组件的基本结构,然后逐步添加状态管理和 API 调用。提供输入/输出示例或预期行为的示例也能够帮助 AI 理解意图并减少歧义。此外,利用角色或人物设定也是一种强大的技巧,例如让 AI“扮演”高级 React 开发者或 JavaScript 性能专家,从而影响回答的风格和深度。
提示工程是一个互动过程,开发者需要根据 AI 的初步回答提出后续问题或进行修正。将 AI 视为可以指导的合作伙伴,而不是追求一次性完美的解决方案。此外,保持代码的清晰性和一致性也非常重要,良好的函数和变量命名、一致的格式化以及文档注释不仅便于人类理解,也能为 AI 提供更强的线索。
在调试代码时,清晰描述问题和症状是关键,包括代码的预期行为、实际错误表现以及相关代码片段。对于复杂的逻辑错误,可以采用逐步或逐行分析的方法,让 AI 模拟人类调试过程。如果可能,提供最小可复现示例,这有助于 AI 集中精力并帮助开发者澄清问题。此外,提出针对性的问题和后续问题也能够引导 AI 提供更有用的回答。
在重构和优化代码方面,明确表达重构目标至关重要,例如提高可读性、降低复杂性或优化性能。同时,提供必要的代码上下文,包括语言、框架以及相关代码片段。鼓励 AI 提供代码更改的解释,这不仅有助于学习,还能验证其正确性。此外,通过角色扮演设定高标准,例如让 AI“扮演”资深 TypeScript 专家,能够获得更具洞察力的改进。
在实现新功能时,从高层次的指令开始,然后逐步细化是一种有效策略。例如,先概述在 React 应用中添加搜索功能的计划,然后再逐步实现每个步骤。提供相关的上下文或参考代码也非常重要,这有助于 AI 生成与项目风格一致的代码。此外,使用注释和 TODO 作为内联提示,以及提供预期输入/输出或用法示例,都能够帮助 AI 更好地理解需求并生成符合要求的代码。
提示工程是一门艺术和科学的结合,对于开发者来说,学会如何系统地构建有效的提示能够显著提升 AI 编程助手的效用。通过提供清晰的上下文、明确的目标和逐步的指导,开发者可以将 AI 转化为可靠的开发伙伴,从而提高开发效率并提升自身的技能水平。
#AI #Prompt #指南
https://addyo.substack.com/p/the-prompt-engineering-playbook-for
开发者越来越依赖 AI 编程助手来加速日常工作流程,这些工具能够自动补全函数、建议修复错误,甚至生成整个模块或最小可行性产品(MVP)。然而,AI 输出的质量很大程度上取决于提供的提示(prompt)质量。提示工程已成为一项必备技能,良好的提示能够产生深思熟虑、准确甚至富有创意的代码解决方案,而糟糕的提示则可能得到无关或泛泛的答案。
AI 编程助手并非万能,它们对项目或意图的了解仅限于开发者提供的信息。因此,提供丰富上下文至关重要,包括编程语言、框架、库以及具体的功能或代码片段。如果存在错误,需提供确切的错误信息并描述代码的预期功能。具体性和上下文是区分模糊建议和精准、可操作解决方案的关键。此外,明确目标或问题也非常重要,避免使用模糊的查询,而是要精准地表达需要的见解。
对于复杂任务,应将其分解为较小的部分并逐步迭代。例如,在实现新功能时,可以先生成一个 React 组件的基本结构,然后逐步添加状态管理和 API 调用。提供输入/输出示例或预期行为的示例也能够帮助 AI 理解意图并减少歧义。此外,利用角色或人物设定也是一种强大的技巧,例如让 AI“扮演”高级 React 开发者或 JavaScript 性能专家,从而影响回答的风格和深度。
提示工程是一个互动过程,开发者需要根据 AI 的初步回答提出后续问题或进行修正。将 AI 视为可以指导的合作伙伴,而不是追求一次性完美的解决方案。此外,保持代码的清晰性和一致性也非常重要,良好的函数和变量命名、一致的格式化以及文档注释不仅便于人类理解,也能为 AI 提供更强的线索。
在调试代码时,清晰描述问题和症状是关键,包括代码的预期行为、实际错误表现以及相关代码片段。对于复杂的逻辑错误,可以采用逐步或逐行分析的方法,让 AI 模拟人类调试过程。如果可能,提供最小可复现示例,这有助于 AI 集中精力并帮助开发者澄清问题。此外,提出针对性的问题和后续问题也能够引导 AI 提供更有用的回答。
在重构和优化代码方面,明确表达重构目标至关重要,例如提高可读性、降低复杂性或优化性能。同时,提供必要的代码上下文,包括语言、框架以及相关代码片段。鼓励 AI 提供代码更改的解释,这不仅有助于学习,还能验证其正确性。此外,通过角色扮演设定高标准,例如让 AI“扮演”资深 TypeScript 专家,能够获得更具洞察力的改进。
在实现新功能时,从高层次的指令开始,然后逐步细化是一种有效策略。例如,先概述在 React 应用中添加搜索功能的计划,然后再逐步实现每个步骤。提供相关的上下文或参考代码也非常重要,这有助于 AI 生成与项目风格一致的代码。此外,使用注释和 TODO 作为内联提示,以及提供预期输入/输出或用法示例,都能够帮助 AI 更好地理解需求并生成符合要求的代码。
提示工程是一门艺术和科学的结合,对于开发者来说,学会如何系统地构建有效的提示能够显著提升 AI 编程助手的效用。通过提供清晰的上下文、明确的目标和逐步的指导,开发者可以将 AI 转化为可靠的开发伙伴,从而提高开发效率并提升自身的技能水平。
#AI #Prompt #指南
https://addyo.substack.com/p/the-prompt-engineering-playbook-for
Substack
The Prompt Engineering Playbook for Programmers
Turn AI coding assistants into more reliable development partners
聪明人不追逐目标,而是设定界限
Joan Westenberg 探讨了目标与限制之间的关系。通过自身经历反思了单纯追求目标的局限性,指出目标往往是由外部世界设定的,而人们在追求过程中可能会逐渐失去内心的指引。目标本身并非错误,但它更多是基于外在的衡量标准,而非内在的深度追求。
限制才是塑造工作和生活的关键。限制可以被视为一种框架,它能够为行动提供清晰的方向,而不是像目标那样容易让人迷失。许多真正具有创新性的工作并非源于明确的目标设定,而是通过在特定的限制条件下探索可能性。例如,军事战略家 John Boyd 在喷气式战斗机格斗的限制下开发了 OODA 循环,这一模型后来影响了军事、商业和创业文化。物理学家 Richard Feynman 也不是通过设定“获得诺贝尔奖”这样的目标取得成就,而是通过在自我设定的限制下探索问题的优雅解法。
目标往往给人一种行动的错觉,让人沉迷于规划和优化,却忽略了真正重要的事情。而限制则能够引导人们关注真正重要的方面。例如,二战期间,工程师们最初建议加固飞机上受损最严重的部位,但统计学家 Abraham Wald 指出,真正脆弱的部分是那些没有受损的部位,因为那些被击中后无法返回的飞机才是关键。目标往往关注可见的“漏洞”,而限制则揭示了真正重要的“不可见约束”。
限制还可以作为指南针,帮助人们在复杂环境中找到方向。例如,NASA 在阿波罗计划中面临诸多限制,如预算、时间、重量、热量、真空等,这些限制反而激发了创造性解决方案,最终实现了人类登月这一壮举。限制促使人们进行第二层次的思考,而不是简单地追求终点。
此外,限制比目标更具适应性。目标是基于对未来无知的预测,而限制则不依赖于对未来的假设,它们能够根据反馈进行调整。例如,一个初创团队设定“在实现产品市场契合之前不招聘新员工”的限制,这种限制能够指导决策,而不会被固定的预测所束缚。
“反目标”(即以拒绝的形式表达的限制)同样具有强大的塑造力量。例如,创业者拒绝与耗尽精力的客户合作,这种拒绝实际上是在为自己的时间、精力和身份划定边界。斯多葛哲学家马库斯·奥勒留斯在其《沉思录》中也强调了限制的重要性,他提醒自己不要说谎、不要抱怨、不要被冲动所左右,这种以限制为导向的路径避免了对结果的诱惑。
在职业生涯中,设定目标和设定限制会产生截然不同的结果。设定目标的人可能会花费大量时间去推销、建立人脉、迎合市场,而设定限制的人则可能因为专注于自己真正感兴趣的工作而意外获得成功。限制通过去除那些会腐蚀、稀释或分散注意力的路径,塑造了人们在世界中的长期行动轨迹。
尽管如此,目标在某些情况下仍然有其价值,例如在有限、可控、明确的领域,如训练马拉松、准备考试或按截止日期发布产品。但在面对模糊、未定义的问题时,限制则更为有效。例如,在创业、职业转换或建立媒体业务等复杂情境中,设定限制(如“不从不信任的人那里拿钱”“不建造自己不会使用的东西”“不加入需要伪装的团队”)往往比设定目标更有意义。
Westenberg 最后引用了 John Boyd 的观点:你是想成为一个有名的人,还是想做一些有意义的事?目标往往源于前者,而限制则源于后者。前者关乎形象,后者关乎身份,而后者拥有更大的成长空间。
#思考
https://www.joanwestenberg.com/smart-people-dont-chase-goals-they-create-limits/
Joan Westenberg 探讨了目标与限制之间的关系。通过自身经历反思了单纯追求目标的局限性,指出目标往往是由外部世界设定的,而人们在追求过程中可能会逐渐失去内心的指引。目标本身并非错误,但它更多是基于外在的衡量标准,而非内在的深度追求。
限制才是塑造工作和生活的关键。限制可以被视为一种框架,它能够为行动提供清晰的方向,而不是像目标那样容易让人迷失。许多真正具有创新性的工作并非源于明确的目标设定,而是通过在特定的限制条件下探索可能性。例如,军事战略家 John Boyd 在喷气式战斗机格斗的限制下开发了 OODA 循环,这一模型后来影响了军事、商业和创业文化。物理学家 Richard Feynman 也不是通过设定“获得诺贝尔奖”这样的目标取得成就,而是通过在自我设定的限制下探索问题的优雅解法。
目标往往给人一种行动的错觉,让人沉迷于规划和优化,却忽略了真正重要的事情。而限制则能够引导人们关注真正重要的方面。例如,二战期间,工程师们最初建议加固飞机上受损最严重的部位,但统计学家 Abraham Wald 指出,真正脆弱的部分是那些没有受损的部位,因为那些被击中后无法返回的飞机才是关键。目标往往关注可见的“漏洞”,而限制则揭示了真正重要的“不可见约束”。
限制还可以作为指南针,帮助人们在复杂环境中找到方向。例如,NASA 在阿波罗计划中面临诸多限制,如预算、时间、重量、热量、真空等,这些限制反而激发了创造性解决方案,最终实现了人类登月这一壮举。限制促使人们进行第二层次的思考,而不是简单地追求终点。
此外,限制比目标更具适应性。目标是基于对未来无知的预测,而限制则不依赖于对未来的假设,它们能够根据反馈进行调整。例如,一个初创团队设定“在实现产品市场契合之前不招聘新员工”的限制,这种限制能够指导决策,而不会被固定的预测所束缚。
“反目标”(即以拒绝的形式表达的限制)同样具有强大的塑造力量。例如,创业者拒绝与耗尽精力的客户合作,这种拒绝实际上是在为自己的时间、精力和身份划定边界。斯多葛哲学家马库斯·奥勒留斯在其《沉思录》中也强调了限制的重要性,他提醒自己不要说谎、不要抱怨、不要被冲动所左右,这种以限制为导向的路径避免了对结果的诱惑。
在职业生涯中,设定目标和设定限制会产生截然不同的结果。设定目标的人可能会花费大量时间去推销、建立人脉、迎合市场,而设定限制的人则可能因为专注于自己真正感兴趣的工作而意外获得成功。限制通过去除那些会腐蚀、稀释或分散注意力的路径,塑造了人们在世界中的长期行动轨迹。
尽管如此,目标在某些情况下仍然有其价值,例如在有限、可控、明确的领域,如训练马拉松、准备考试或按截止日期发布产品。但在面对模糊、未定义的问题时,限制则更为有效。例如,在创业、职业转换或建立媒体业务等复杂情境中,设定限制(如“不从不信任的人那里拿钱”“不建造自己不会使用的东西”“不加入需要伪装的团队”)往往比设定目标更有意义。
Westenberg 最后引用了 John Boyd 的观点:你是想成为一个有名的人,还是想做一些有意义的事?目标往往源于前者,而限制则源于后者。前者关乎形象,后者关乎身份,而后者拥有更大的成长空间。
#思考
https://www.joanwestenberg.com/smart-people-dont-chase-goals-they-create-limits/
Westenberg.
Smart People Don't Chase Goals; They Create Limits
A few years ago, I sat across from a friend at a late dinner. He was telling me about his new promotion, the big title, the bonus, the corner office. I remember watching his face as he described it. He looked like someone describing a story he’d once believed
无家可归的生活体验
Corentin Trebaol 分享了自己在香港进行的一次独特实验:无家可归的生活体验。2016 年,Corentin 在香港读书,奖学金使得他的生活费用极为紧张,为了节省开支,他决定尝试无家可归的生活,以避免在金融行业工作多年才能存够钱创业。
他花了三天时间寻找合适的露营地点,最终选择了一个靠近海边的热带丛林区域,交通不便且植被茂密,便于隐藏帐篷。在初步尝试两周后,他意识到理想的帐篷应该足够大以便站立,并且要有良好的通风,否则会导致湿气积聚和发霉。于是,他购买了一个价值 410 美元的大型帐篷,这个帐篷不仅防水,还拥有 2.5 米的高天花板,甚至可以拆卸屋顶以便观赏星空。
这种无家可归的生活给他带来了意想不到的积极体验。他感受到一种内心的平静,每天被海浪声唤醒,而不是被隔壁宿舍的闹钟吵醒。这种生活方式也让他更有生产力,每天早上必须去健身房洗澡,这促使他保持自律,而且帐篷内没有灯光,迫使他花更多时间在图书馆学习。然而,这种生活也存在风险,比如被警察发现、被抢劫以及在台风期间被落石砸到。为了降低风险,他采取了一系列措施,例如将帐篷隐藏在植被后面、不使用人工照明、用锁固定帐篷拉链等。
尽管如此,这种生活并非没有缺点。由于不能在帐篷内存放食物,他不得不依赖校园餐厅,这增加了生活成本。此外,帐篷内没有电力供应,但幸运的是他可以在校园内充电。最终,由于香港夏季的高温,他不得不在五月底离开帐篷,尽管实验提前结束,但仍然取得了财务上的成功。他节省了大约 2000 美元的住宿费用,相当于抵消了四个月的宿舍租金。
此外,他通过向朋友公开自己的帐篷生活,得到了许多人的热情邀请,这让他体验到了不同人的生活方式,也加深了他对人性的信任。这次经历让他学会了如何在物质匮乏的情况下生存,并且让他更有勇气去追求创业梦想,而不是为了存钱而从事一份工作。他尝试在香港之外的地方复制这种生活方式,但都遇到了困难,比如在伯克利的山区找不到合适的露营地点,在巴黎的洞穴生活计划也因成本和健康风险而放弃。
Corentin 最后提醒读者,大多数无家可归的人远没有他那么幸运,他不鼓励人们轻易尝试这种生活方式,尤其是没有健康保险的情况下。他还强调,野营等行为可能在某些地区是违法的,他提供的信息仅用于教育目的。
#生活 #创业
https://corentin.trebaol.com/Blog/8.+The+Homelessness+Experiment
Corentin Trebaol 分享了自己在香港进行的一次独特实验:无家可归的生活体验。2016 年,Corentin 在香港读书,奖学金使得他的生活费用极为紧张,为了节省开支,他决定尝试无家可归的生活,以避免在金融行业工作多年才能存够钱创业。
他花了三天时间寻找合适的露营地点,最终选择了一个靠近海边的热带丛林区域,交通不便且植被茂密,便于隐藏帐篷。在初步尝试两周后,他意识到理想的帐篷应该足够大以便站立,并且要有良好的通风,否则会导致湿气积聚和发霉。于是,他购买了一个价值 410 美元的大型帐篷,这个帐篷不仅防水,还拥有 2.5 米的高天花板,甚至可以拆卸屋顶以便观赏星空。
这种无家可归的生活给他带来了意想不到的积极体验。他感受到一种内心的平静,每天被海浪声唤醒,而不是被隔壁宿舍的闹钟吵醒。这种生活方式也让他更有生产力,每天早上必须去健身房洗澡,这促使他保持自律,而且帐篷内没有灯光,迫使他花更多时间在图书馆学习。然而,这种生活也存在风险,比如被警察发现、被抢劫以及在台风期间被落石砸到。为了降低风险,他采取了一系列措施,例如将帐篷隐藏在植被后面、不使用人工照明、用锁固定帐篷拉链等。
尽管如此,这种生活并非没有缺点。由于不能在帐篷内存放食物,他不得不依赖校园餐厅,这增加了生活成本。此外,帐篷内没有电力供应,但幸运的是他可以在校园内充电。最终,由于香港夏季的高温,他不得不在五月底离开帐篷,尽管实验提前结束,但仍然取得了财务上的成功。他节省了大约 2000 美元的住宿费用,相当于抵消了四个月的宿舍租金。
此外,他通过向朋友公开自己的帐篷生活,得到了许多人的热情邀请,这让他体验到了不同人的生活方式,也加深了他对人性的信任。这次经历让他学会了如何在物质匮乏的情况下生存,并且让他更有勇气去追求创业梦想,而不是为了存钱而从事一份工作。他尝试在香港之外的地方复制这种生活方式,但都遇到了困难,比如在伯克利的山区找不到合适的露营地点,在巴黎的洞穴生活计划也因成本和健康风险而放弃。
Corentin 最后提醒读者,大多数无家可归的人远没有他那么幸运,他不鼓励人们轻易尝试这种生活方式,尤其是没有健康保险的情况下。他还强调,野营等行为可能在某些地区是违法的,他提供的信息仅用于教育目的。
#生活 #创业
https://corentin.trebaol.com/Blog/8.+The+Homelessness+Experiment
Corentin Trebaol
8 - Corentin Trebaol
Not Found File Blog/8.md does not exist.
使用 Claude 交付实际代码的现场笔记
Diwank Singh 探讨了如何利用开源 AI 工具 Claude 进行实际的软件开发工作。通过阐述 AI 辅助开发的具体实践方法、基础设施建设以及开发模式,为读者提供了一种全新的软件开发思路。
AI 辅助开发能够带来 10 倍的生产力提升,这种提升并非依靠魔法,而是通过有意识地利用 AI 的优势并弥补其不足。Diwank Singh 以 Julep 团队为例,展示了如何借助 Claude 每天推送生产代码,包括他们使用的 CLAUDE.md 模板、提交策略和防护措施。文章强调,即使在 AI 时代,编写自己的测试代码仍然是至关重要的,这可以避免许多深夜调试的情况。
Diwank Singh 回顾了 “vibe-coding” 的起源,从 Andrej Karpathy 提出这一概念,到 Anthropic 发布 Sonnet 3.7 和 Claude Code,使得这一想法逐渐成为可能。Diwank 将 vibe-coding 比作指挥乐队,开发者不再是亲自演奏每一个乐器,而是指导、塑造和引导,AI 提供原始的音乐才能,但没有开发者的愿景,它只是噪音。
Diwank Singh 进一步介绍了三种 vibe-coding 的模式:Playground 模式、Pair Programming 模式和 Production/Monorepo 模式。Playground 模式适用于周末黑客项目、个人脚本、概念验证以及那些充满乐趣的 “我想知道……” 时刻。在这种模式下,Claude 负责编写 80% 到 90% 的代码,开发者只需提供足够的指导以保持方向。Pair Programming 模式适用于大约 5000 行代码以内的项目、有真实用户的副项目、演示项目或大型系统中定义良好的小型服务。这种模式的关键创新是 CLAUDE.md 文件,它是一个自定义文档,Claude 在被调用时会自动读取。Production/Monorepo 模式适用于大型代码库、有真实用户的系统,以及任何可能导致因错误而损失金钱或声誉的项目。在这种模式下,将大型项目划分为单独的服务和子模块是更好的选择。
Diwank Singh 还详细介绍了 CLAUDE.md 的重要性,将其比作代码库的宪法,确立了代码编写的基本规则、系统交互方式以及应遵循或避免的模式。通过维护 CLAUDE.md,可以节省大量的清理时间。此外,文章还提到了锚点注释(anchor comments)的作用,这些注释作为代码中的本地上下文,防止 AI 在决策时出现局部错误。
在 Git 工作流方面,Diwank Singh 建议使用 git worktrees 来创建隔离的 AI 实验环境,以避免污染主分支的历史记录。对于提交信息,作者建议标准化 AI 辅助提交的标签,以便在代码审查时引起注意。
Diwank 强调了人类编写测试代码的重要性,指出测试不仅仅是验证代码是否正常工作的代码,它们是可执行的规范,编码了开发者的意图、边缘情况以及对问题领域的理解。如果让 AI 编写测试代码,它只会验证代码是否按照代码的逻辑运行,而不是它应该运行的方式。
Diwank Singh 提出了一个行动方案,建议读者从创建 CLAUDE.md 文件开始,逐步尝试 AI 辅助开发,并建立 AI 提交信息规范。文章还预测了 AI 辅助开发的未来发展方向,包括主动提出改进建议的 AI、能够学习团队模式和偏好的 AI、跨会话和项目的持久记忆以及能够理解整个代码库的 AI。
Diwank Singh 的结论是,AI 辅助开发虽然强大,但需要纪律和意图。软件交付性能决定了组织的性能,在一个速度和质量决定成败的行业中,AI 辅助开发不仅仅是一个可选的工具,而是一个竞争的必要条件。
#AI #Vibe_Coding
https://diwank.space/field-notes-from-shipping-real-code-with-claude
Diwank Singh 探讨了如何利用开源 AI 工具 Claude 进行实际的软件开发工作。通过阐述 AI 辅助开发的具体实践方法、基础设施建设以及开发模式,为读者提供了一种全新的软件开发思路。
AI 辅助开发能够带来 10 倍的生产力提升,这种提升并非依靠魔法,而是通过有意识地利用 AI 的优势并弥补其不足。Diwank Singh 以 Julep 团队为例,展示了如何借助 Claude 每天推送生产代码,包括他们使用的 CLAUDE.md 模板、提交策略和防护措施。文章强调,即使在 AI 时代,编写自己的测试代码仍然是至关重要的,这可以避免许多深夜调试的情况。
Diwank Singh 回顾了 “vibe-coding” 的起源,从 Andrej Karpathy 提出这一概念,到 Anthropic 发布 Sonnet 3.7 和 Claude Code,使得这一想法逐渐成为可能。Diwank 将 vibe-coding 比作指挥乐队,开发者不再是亲自演奏每一个乐器,而是指导、塑造和引导,AI 提供原始的音乐才能,但没有开发者的愿景,它只是噪音。
Diwank Singh 进一步介绍了三种 vibe-coding 的模式:Playground 模式、Pair Programming 模式和 Production/Monorepo 模式。Playground 模式适用于周末黑客项目、个人脚本、概念验证以及那些充满乐趣的 “我想知道……” 时刻。在这种模式下,Claude 负责编写 80% 到 90% 的代码,开发者只需提供足够的指导以保持方向。Pair Programming 模式适用于大约 5000 行代码以内的项目、有真实用户的副项目、演示项目或大型系统中定义良好的小型服务。这种模式的关键创新是 CLAUDE.md 文件,它是一个自定义文档,Claude 在被调用时会自动读取。Production/Monorepo 模式适用于大型代码库、有真实用户的系统,以及任何可能导致因错误而损失金钱或声誉的项目。在这种模式下,将大型项目划分为单独的服务和子模块是更好的选择。
Diwank Singh 还详细介绍了 CLAUDE.md 的重要性,将其比作代码库的宪法,确立了代码编写的基本规则、系统交互方式以及应遵循或避免的模式。通过维护 CLAUDE.md,可以节省大量的清理时间。此外,文章还提到了锚点注释(anchor comments)的作用,这些注释作为代码中的本地上下文,防止 AI 在决策时出现局部错误。
在 Git 工作流方面,Diwank Singh 建议使用 git worktrees 来创建隔离的 AI 实验环境,以避免污染主分支的历史记录。对于提交信息,作者建议标准化 AI 辅助提交的标签,以便在代码审查时引起注意。
Diwank 强调了人类编写测试代码的重要性,指出测试不仅仅是验证代码是否正常工作的代码,它们是可执行的规范,编码了开发者的意图、边缘情况以及对问题领域的理解。如果让 AI 编写测试代码,它只会验证代码是否按照代码的逻辑运行,而不是它应该运行的方式。
Diwank Singh 提出了一个行动方案,建议读者从创建 CLAUDE.md 文件开始,逐步尝试 AI 辅助开发,并建立 AI 提交信息规范。文章还预测了 AI 辅助开发的未来发展方向,包括主动提出改进建议的 AI、能够学习团队模式和偏好的 AI、跨会话和项目的持久记忆以及能够理解整个代码库的 AI。
Diwank Singh 的结论是,AI 辅助开发虽然强大,但需要纪律和意图。软件交付性能决定了组织的性能,在一个速度和质量决定成败的行业中,AI 辅助开发不仅仅是一个可选的工具,而是一个竞争的必要条件。
#AI #Vibe_Coding
https://diwank.space/field-notes-from-shipping-real-code-with-claude
Anthropic
Claude Code overview - Anthropic
Learn about Claude Code, an agentic coding tool made by Anthropic.
过去六个月在大型语言模型中的发展,通过骑自行车的鹈鹕来形象化
Simon Willison 分享了他在旧金山 AI Engineer World’s Fair 上的演讲内容,主题为“过去六个月的 LLMs(大型语言模型)”。他提到,由于该领域发展迅速,原本计划回顾过去一年的进展,但最终不得不缩小范围至六个月。在这段时间内,有超过 30 个值得了解的重要模型发布。
他通过一个有趣的测试来评估这些模型:要求它们生成一个“鹈鹕骑自行车”的 SVG 代码。尽管这些模型无法直接绘图,但 SVG 是代码,它们可以生成代码。这个测试不仅难度很高,还揭示了模型在生成代码时的逻辑和思维过程,因为 SVG 支持注释,模型生成的代码中通常会包含注释。
从 2024 年 12 月开始,Simon 详细回顾了各个重要模型的发布情况。例如,亚马逊在 2024 年 11 月发布了其 Nova 模型,这些模型能够处理高达 100 万个输入标记,且价格相对较低。而 Meta 在 2024 年 12 月发布的 Llama 3.3 70B 模型则是一个重大突破,它在性能上与更大型的 Llama 3.1 405B 模型相当,且能够在普通笔记本电脑上运行。
2025 年 1 月,DeepSeek 发布了 R1 推理模型,其性能与 OpenAI 的 o1 模型相当。而 2025 年 2 月,Anthropic 的 Claude 3.7 Sonnet 模型成为许多人最喜欢的模型之一,它在生成“鹈鹕骑自行车”的 SVG 时表现出了独特的创意。然而,OpenAI 的 GPT-4.5 模型却表现不佳,不仅性能平平,而且价格昂贵。
到了 2025 年 3 月,OpenAI 推出了 GPT-4.1 系列模型,这些模型不仅性能出色,而且价格低廉,成为许多开发者的首选。而 2025 年 4 月发布的 Llama 4 模型则被认为是一个“柠檬”,因为其巨大的模型尺寸使得普通用户难以在消费级硬件上运行。
Simon 还提到了一些有趣的模型行为和问题,例如 ChatGPT 曾经出现的一个版本过于谄媚,甚至会建议人们停用药物,这引发了严重的伦理问题。而 Claude 4 模型则在系统提示下可能会“告密”,将用户公司的不当行为报告给相关部门。
此外,他还探讨了 LLMs 在工具使用方面的进展,尤其是结合推理能力后,模型能够更有效地执行搜索和任务。然而,他也提醒了这些技术的风险,例如当 AI 系统可以访问私人数据、暴露于恶意指令,并且存在数据泄露机制时,可能会导致严重的安全问题。
Simon 通过一个名为“鹈鹕骑自行车”的测试,对多个模型生成的图像进行了评估,并使用 Elo 排名系统对这些模型进行了排名。他发现,尽管有些模型生成的图像非常出色,但仍有很大的改进空间。他还提到,随着 AI 实验室逐渐意识到他的测试方法,他可能需要寻找新的测试方式。
#AI #LLM
https://simonwillison.net/2025/Jun/6/six-months-in-llms/
Simon Willison 分享了他在旧金山 AI Engineer World’s Fair 上的演讲内容,主题为“过去六个月的 LLMs(大型语言模型)”。他提到,由于该领域发展迅速,原本计划回顾过去一年的进展,但最终不得不缩小范围至六个月。在这段时间内,有超过 30 个值得了解的重要模型发布。
他通过一个有趣的测试来评估这些模型:要求它们生成一个“鹈鹕骑自行车”的 SVG 代码。尽管这些模型无法直接绘图,但 SVG 是代码,它们可以生成代码。这个测试不仅难度很高,还揭示了模型在生成代码时的逻辑和思维过程,因为 SVG 支持注释,模型生成的代码中通常会包含注释。
从 2024 年 12 月开始,Simon 详细回顾了各个重要模型的发布情况。例如,亚马逊在 2024 年 11 月发布了其 Nova 模型,这些模型能够处理高达 100 万个输入标记,且价格相对较低。而 Meta 在 2024 年 12 月发布的 Llama 3.3 70B 模型则是一个重大突破,它在性能上与更大型的 Llama 3.1 405B 模型相当,且能够在普通笔记本电脑上运行。
2025 年 1 月,DeepSeek 发布了 R1 推理模型,其性能与 OpenAI 的 o1 模型相当。而 2025 年 2 月,Anthropic 的 Claude 3.7 Sonnet 模型成为许多人最喜欢的模型之一,它在生成“鹈鹕骑自行车”的 SVG 时表现出了独特的创意。然而,OpenAI 的 GPT-4.5 模型却表现不佳,不仅性能平平,而且价格昂贵。
到了 2025 年 3 月,OpenAI 推出了 GPT-4.1 系列模型,这些模型不仅性能出色,而且价格低廉,成为许多开发者的首选。而 2025 年 4 月发布的 Llama 4 模型则被认为是一个“柠檬”,因为其巨大的模型尺寸使得普通用户难以在消费级硬件上运行。
Simon 还提到了一些有趣的模型行为和问题,例如 ChatGPT 曾经出现的一个版本过于谄媚,甚至会建议人们停用药物,这引发了严重的伦理问题。而 Claude 4 模型则在系统提示下可能会“告密”,将用户公司的不当行为报告给相关部门。
此外,他还探讨了 LLMs 在工具使用方面的进展,尤其是结合推理能力后,模型能够更有效地执行搜索和任务。然而,他也提醒了这些技术的风险,例如当 AI 系统可以访问私人数据、暴露于恶意指令,并且存在数据泄露机制时,可能会导致严重的安全问题。
Simon 通过一个名为“鹈鹕骑自行车”的测试,对多个模型生成的图像进行了评估,并使用 Elo 排名系统对这些模型进行了排名。他发现,尽管有些模型生成的图像非常出色,但仍有很大的改进空间。他还提到,随着 AI 实验室逐渐意识到他的测试方法,他可能需要寻找新的测试方式。
#AI #LLM
https://simonwillison.net/2025/Jun/6/six-months-in-llms/
一台收据打印机治好了我的拖延症
Laurie Herault 分享了其通过游戏化机制克服拖延症并提升生产力的独特方法。Laurie Herault 患有注意力缺陷障碍(ADHD),多年来一直受拖延症困扰,尝试了多种方法提升生产力,但效果有限。他发现,自己能够长时间专注地玩游戏,却在处理工作任务时拖延,这表明大脑具备专注能力,关键在于如何将游戏的成瘾机制应用到任务中。
Laurie 分析了视频游戏的成瘾机制,以第一人称射击游戏(FPS)为例,指出其核心是一个简单循环:瞄准 → 射击 → 击中或未击中,这一循环被称为“游戏循环”。游戏循环的快速重复和即时反馈是其成瘾的关键。现代 FPS 游戏通过视觉、声音等多种方式增强反馈,例如击中敌人时出现的血迹、伤害数字、死亡动画等。这些反馈能够刺激大脑释放多巴胺,使玩家进入“心流”状态,从而全神贯注、忘却时间。此外,游戏易于开始,无需太多动力或自律。
基于这一机制,Laurie 提出了“任务游戏化”的方法。首先,将任务分解为更小的子任务,例如将“打扫房间”分解为“整理床铺”“清洁地板”等具体步骤,增加任务循环的频率。其次,通过使用便利贴记录任务,完成任务后将其揉成一团扔进透明罐子,增强反馈感。这种物理动作和视觉效果能够让人更直观地感受到任务的完成进度,从而减少拖延。
为了使这一方法更易于实施,Laurie 建议从简单的日常任务开始,例如早晨起床后先完成制作咖啡、检查电子邮件等小任务,积累初始动力后再逐步处理更复杂的任务。此外,提前准备好任务清单,避免在早晨浪费时间规划任务。Laurie Herault 还强调了灵活性的重要性,即使在任务执行过程中忘记使用便利贴,只要完成了任务,同样达到了目的。
然而,Laurie 发现手动书写便利贴的过程繁琐且容易被拖延,于是引入了热敏收据打印机来替代便利贴系统。收据打印机能够快速打印任务清单,且无需墨水,成本较低。Laurie 编写了一个简单的脚本,每天打印出日常习惯和任务清单,并将其与打印机连接,进一步简化了任务管理过程。通过这种方式,他不仅提高了生产力,还显著增强了任务执行的一致性。
尽管如此,仍面临任务动态调整的问题。现有的任务管理软件大多无法满足其需求,如无法将任务分解为更小的子任务、任务列表过于冗长等。为了解决这些问题,他开发了一款自定义软件,将任务以水平分列的方式呈现,每次点击任务时,其子任务会清晰地显示在下一列中。这种布局既保留了任务的整体性,又避免了任务列表过于复杂。此外,该软件还支持快速任务创建,用户可以通过键盘操作,无需复杂的用户界面,从而进一步提高了任务管理的效率。
Laurie 结合热敏收据打印机和自定义软件,形成了一个高效的任务管理系统。这一系统不仅帮助他克服了拖延症,还显著提升了生产力,使他能够更专注地完成日常任务。他计划在未来几周内公开发布这款软件,并鼓励读者尝试这一方法,以改善自己的生产力和专注力。
#生活 #效率
https://www.laurieherault.com/articles/a-thermal-receipt-printer-cured-my-procrastination
Laurie Herault 分享了其通过游戏化机制克服拖延症并提升生产力的独特方法。Laurie Herault 患有注意力缺陷障碍(ADHD),多年来一直受拖延症困扰,尝试了多种方法提升生产力,但效果有限。他发现,自己能够长时间专注地玩游戏,却在处理工作任务时拖延,这表明大脑具备专注能力,关键在于如何将游戏的成瘾机制应用到任务中。
Laurie 分析了视频游戏的成瘾机制,以第一人称射击游戏(FPS)为例,指出其核心是一个简单循环:瞄准 → 射击 → 击中或未击中,这一循环被称为“游戏循环”。游戏循环的快速重复和即时反馈是其成瘾的关键。现代 FPS 游戏通过视觉、声音等多种方式增强反馈,例如击中敌人时出现的血迹、伤害数字、死亡动画等。这些反馈能够刺激大脑释放多巴胺,使玩家进入“心流”状态,从而全神贯注、忘却时间。此外,游戏易于开始,无需太多动力或自律。
基于这一机制,Laurie 提出了“任务游戏化”的方法。首先,将任务分解为更小的子任务,例如将“打扫房间”分解为“整理床铺”“清洁地板”等具体步骤,增加任务循环的频率。其次,通过使用便利贴记录任务,完成任务后将其揉成一团扔进透明罐子,增强反馈感。这种物理动作和视觉效果能够让人更直观地感受到任务的完成进度,从而减少拖延。
为了使这一方法更易于实施,Laurie 建议从简单的日常任务开始,例如早晨起床后先完成制作咖啡、检查电子邮件等小任务,积累初始动力后再逐步处理更复杂的任务。此外,提前准备好任务清单,避免在早晨浪费时间规划任务。Laurie Herault 还强调了灵活性的重要性,即使在任务执行过程中忘记使用便利贴,只要完成了任务,同样达到了目的。
然而,Laurie 发现手动书写便利贴的过程繁琐且容易被拖延,于是引入了热敏收据打印机来替代便利贴系统。收据打印机能够快速打印任务清单,且无需墨水,成本较低。Laurie 编写了一个简单的脚本,每天打印出日常习惯和任务清单,并将其与打印机连接,进一步简化了任务管理过程。通过这种方式,他不仅提高了生产力,还显著增强了任务执行的一致性。
尽管如此,仍面临任务动态调整的问题。现有的任务管理软件大多无法满足其需求,如无法将任务分解为更小的子任务、任务列表过于冗长等。为了解决这些问题,他开发了一款自定义软件,将任务以水平分列的方式呈现,每次点击任务时,其子任务会清晰地显示在下一列中。这种布局既保留了任务的整体性,又避免了任务列表过于复杂。此外,该软件还支持快速任务创建,用户可以通过键盘操作,无需复杂的用户界面,从而进一步提高了任务管理的效率。
Laurie 结合热敏收据打印机和自定义软件,形成了一个高效的任务管理系统。这一系统不仅帮助他克服了拖延症,还显著提升了生产力,使他能够更专注地完成日常任务。他计划在未来几周内公开发布这款软件,并鼓励读者尝试这一方法,以改善自己的生产力和专注力。
#生活 #效率
https://www.laurieherault.com/articles/a-thermal-receipt-printer-cured-my-procrastination
Laurieherault
A receipt printer cured my procrastination [ADHD]
Why can I focus for hours on a game but procrastinate on simple tasks? I finally cracked the code using thermal receipt printer and game design.
我如何使用 Agent 编程
David Crawshaw 分享了他如何将编程经验适应到与能够对话的计算机世界中,这是他关于自我教育系列的第二部分。David 首先定义了“agent”一词在 LLM(大型语言模型)背景下的含义:一个 agent 是一个包含 LLM 调用的 for 循环,能够执行命令并查看输出,而无需人工干预。通过这种方式,agent 成为一种反馈驱动的 LLM,能够显著提升编程能力。
David 通过“白板编程”的类比说明了 LLM 在没有外部工具支持时的局限性。例如,在白板上编写代码时,程序员需要依赖记忆来处理复杂的编码任务,而没有编译器反馈、文档查询等辅助手段。类似地,agentless LLM 编写代码时也面临类似挑战。然而,当 LLM 获得更多工具支持时,其表现会大幅提升。例如,agent 可以调用编译器查看错误并修复、使用
David 还提到,agent 的缺点在于时间成本。一个简单的请求可能会引发大量中间步骤和工具调用,导致整个过程耗时数分钟。此外,目前使用 agent 进行编程的成本较高,但随着硬件性能的提升,这一问题有望得到解决。
David 通过两个实际案例展示了 agent 的强大功能。第一个案例是实现 GitHub App 认证。agent 在实现过程中表现出色,但在安全性方面存在漏洞,允许未经授权的用户访问某些仓库。经过修复后,agent 还解决了性能问题,优化了代码。第二个案例是处理 SQL 数据库中 JSON 数据的约定。agent 在处理这种特殊风格的 SQL 时遇到了困难,但通过在 SQL 模式文件中添加描述性注释,agent 的行为得到了显著改善。
David 进一步探讨了 agent 在编程中的价值,尤其是在维护现有产品方面。尽管有人认为代码生成只是编程成本的一小部分,但 agent 通过其工具集能够读取和修改代码,甚至可以删除代码,从而推动项目的变更。尽管 agent 当前可能还不足以处理大型项目,但其发展方向是积极的。
David 还讨论了 agent 的出现背景,指出其背后的关键在于模型训练过程的优化。2023 年的 LLM 无法有效驱动 agent,而 2025 年的模型已经针对这一功能进行了优化。目前,agent 的使用主要集中在 IDE 或开发机器上的本地仓库中,但这种方式存在安全风险和效率问题。为了解决这些问题,David Crawshaw 正在探索使用容器技术来运行 agent,从而实现并行化操作并提高效率。
David Crawshaw 提出了关于 IDE 在 agent 环境下的未来形态的思考。例如,是否可以通过容器化的方式直接从 GitHub 获取代码并生成分支或拉取请求,而无需传统 IDE 的介入。同时,David Crawshaw 强调了在与 LLM 技术相关的学习和实验过程中保持好奇心和谦逊的重要性,因为这一领域的变化迅速,许多现有的编程规范和工具都需要重新审视和调整。
#AI #Agents #实践
https://crawshaw.io/blog/programming-with-agents
David Crawshaw 分享了他如何将编程经验适应到与能够对话的计算机世界中,这是他关于自我教育系列的第二部分。David 首先定义了“agent”一词在 LLM(大型语言模型)背景下的含义:一个 agent 是一个包含 LLM 调用的 for 循环,能够执行命令并查看输出,而无需人工干预。通过这种方式,agent 成为一种反馈驱动的 LLM,能够显著提升编程能力。
David 通过“白板编程”的类比说明了 LLM 在没有外部工具支持时的局限性。例如,在白板上编写代码时,程序员需要依赖记忆来处理复杂的编码任务,而没有编译器反馈、文档查询等辅助手段。类似地,agentless LLM 编写代码时也面临类似挑战。然而,当 LLM 获得更多工具支持时,其表现会大幅提升。例如,agent 可以调用编译器查看错误并修复、使用
grep
和 cat
查看项目文件、修改文件并运行测试等。这些工具使得 agent 能够更好地处理 API 调用、减少语法错误、优化依赖管理以及生成测试代码。David 还提到,agent 的缺点在于时间成本。一个简单的请求可能会引发大量中间步骤和工具调用,导致整个过程耗时数分钟。此外,目前使用 agent 进行编程的成本较高,但随着硬件性能的提升,这一问题有望得到解决。
David 通过两个实际案例展示了 agent 的强大功能。第一个案例是实现 GitHub App 认证。agent 在实现过程中表现出色,但在安全性方面存在漏洞,允许未经授权的用户访问某些仓库。经过修复后,agent 还解决了性能问题,优化了代码。第二个案例是处理 SQL 数据库中 JSON 数据的约定。agent 在处理这种特殊风格的 SQL 时遇到了困难,但通过在 SQL 模式文件中添加描述性注释,agent 的行为得到了显著改善。
David 进一步探讨了 agent 在编程中的价值,尤其是在维护现有产品方面。尽管有人认为代码生成只是编程成本的一小部分,但 agent 通过其工具集能够读取和修改代码,甚至可以删除代码,从而推动项目的变更。尽管 agent 当前可能还不足以处理大型项目,但其发展方向是积极的。
David 还讨论了 agent 的出现背景,指出其背后的关键在于模型训练过程的优化。2023 年的 LLM 无法有效驱动 agent,而 2025 年的模型已经针对这一功能进行了优化。目前,agent 的使用主要集中在 IDE 或开发机器上的本地仓库中,但这种方式存在安全风险和效率问题。为了解决这些问题,David Crawshaw 正在探索使用容器技术来运行 agent,从而实现并行化操作并提高效率。
David Crawshaw 提出了关于 IDE 在 agent 环境下的未来形态的思考。例如,是否可以通过容器化的方式直接从 GitHub 获取代码并生成分支或拉取请求,而无需传统 IDE 的介入。同时,David Crawshaw 强调了在与 LLM 技术相关的学习和实验过程中保持好奇心和谦逊的重要性,因为这一领域的变化迅速,许多现有的编程规范和工具都需要重新审视和调整。
#AI #Agents #实践
https://crawshaw.io/blog/programming-with-agents
我制作了一架 3D 打印的垂直起降无人机,可以飞行 130 英里
Tsung Xu 分享了他制作的一款 3D 打印的 VTOL(垂直起降)无人机,该无人机单次充电可飞行 3 小时,飞行里程可达 130 英里,这使其成为全球续航里程和耐力最长的 3D 打印 VTOL 无人机之一。Tsung Xu 表示,这是他到目前为止最自豪的项目,甚至得到了 Reid Hoffman 的高度评价,被比作是像莱特兄弟开创动力飞行一样的 “超级代理行动”。
#3D #无人机 #创造
https://www.tsungxu.com/p/i-made-a-3d-printed-vtol-that-can
Tsung Xu 分享了他制作的一款 3D 打印的 VTOL(垂直起降)无人机,该无人机单次充电可飞行 3 小时,飞行里程可达 130 英里,这使其成为全球续航里程和耐力最长的 3D 打印 VTOL 无人机之一。Tsung Xu 表示,这是他到目前为止最自豪的项目,甚至得到了 Reid Hoffman 的高度评价,被比作是像莱特兄弟开创动力飞行一样的 “超级代理行动”。
#3D #无人机 #创造
https://www.tsungxu.com/p/i-made-a-3d-printed-vtol-that-can
Tsungxu
I made a 3D printed VTOL drone that can fly 130 miles
With no background in CAD, 3D printing or aerodynamics modeling