weekly-summary-20250615

技术

AI应用的核心组件

用于 LLM 通信的客户端
用于函数调用的函数 / 工具
用于 RAG 的向量数据库
用于跟踪、评估等的可观察性平台

为什么选择LangSmith

开箱即用的可视化日志
Prompt playground，可以立即从日志中修复 Prompt，并查看它在相同输入下的表现
可直接从日志轻松构建测试数据集，并可选择一键运行 Prompt 中的简单测试集（或在代码中进行端到端测试）
测试分数历史
Prompt 版本控制
对整个链的流式传输提供了很好的支持，手动实现这一点需要一些时间。

AI 2027

https://ai-2027.com/

想法

好文摘抄

当前的程序设计很难经得起时间考验

为什么都放弃了LangChain？ - 深度学习与NLP的文章 - 知乎
https://zhuanlan.zhihu.com/p/705164113
人工智能和 LLM 是瞬息万变的领域，每周都会有新的概念和想法出现。而 LangChain 这样围绕多种新兴技术创建的抽象概念，其框架设计很难经得起时间考验。

不要使用 LangChain

我建议大家不要使用 LangChain，这篇文章解释得很好
它在抽象之上使用抽象，实际上使你的代码变得不必要地复杂
只需编写 API调用并添加矢量数据库即可
– Fabian Both，AI 测试工具 Octomind 的深度学习工程师

Anthropic CPO访谈

https://mp.weixin.qq.com/s/Q06wTY_QMRlrTMOoTFh0qw
知道该向 AI 问什么、如何组织问题、如何思考前后端的结构变化，这些仍然是需要工程师具备的专业技能。
人类则更多地进行验收测试，而不是逐行审查。

最酷的是，这打破了技术壁垒。比如，Claude Code 是用 TypeScript 写的，但我们公司大部分项目用的是 Python。昨天我在 Slack 上看到一个同事，他不懂 TypeScript，但他想修复 Claude Code 的一个问题。于是他直接和 Claude 对话，一个小时内就生成了拉取请求并解决了问题。这让非团队成员也能轻松做出贡献。
关于 Artifact：当投入 10 分努力只能换来 1 分产出时，我们意识到这个产品的能量已经不存在了。

Q：对于那些想在 AI 领域创业的人来说，你认为哪些领域是相对安全的，不容易被像你们这样的基础模型公司碾压？
A：有几点：
一是对特定行业的深刻理解。比如法律科技公司 Harvey，他们的产品界面是为律师的特定工作流程设计的，这是你从零开始无法想到的。生物科技、医疗健康等领域也是如此。
二是差异化的市场进入策略。你是否了解你的客户，是卖给工程部、CIO 还是总法律顾问？这需要深厚的行业经验。
三是全新的交互形式。现有巨头的产品已经让用户形成了使用习惯，这为那些提供完全不同交互方式的初创公司留下了空间。
最后，也是最重要的一点，保持创业公司的精神。那种“我们与世界为敌，必须解决这个问题”的生存危机感，是无法用 OKR 复制的，这是一种持续的优势。

Q：您如何看待在构建功能时，既能增强人类能力，又能保持用户自主性，而不是让他们对我产生依赖？
A：一个好的产品设计来自于解决张力。一方面，我们希望模型能高效地给出答案；另一方面，我们不希望它变成一个让人停止思考的拐杖。关键在于找到平衡。我们需要训练 Claude 成为一个优秀的“对话者”，不是聊天机器人意义上的，而是真正的协作者，知道何时该介入，何时该提供更多信息，从而实现一种增强型的思维伙伴关系，而不是简单的认知代理。

技术卷成了白菜价

依靠技术还能搞钱在过去大量存在，到了今天，技术从上游卷到下游，卷到了白菜价……

Weekly Summary

#每周总结

可视化知识库开发笔记上一篇

Claude Code学习笔记下一篇