weekly-summary-20250615
技术
AI应用的核心组件
- 用于 LLM 通信的客户端
- 用于函数调用的函数 / 工具
- 用于 RAG 的向量数据库
- 用于跟踪、评估等的可观察性平台
为什么选择LangSmith
- 开箱即用的可视化日志
- Prompt playground,可以立即从日志中修复 Prompt,并查看它在相同输入下的表现
- 可直接从日志轻松构建测试数据集,并可选择一键运行 Prompt 中的简单测试集(或在代码中进行端到端测试)
- 测试分数历史
- Prompt 版本控制
- 对整个链的流式传输提供了很好的支持,手动实现这一点需要一些时间。
AI 2027
想法
好文摘抄
当前的程序设计很难经得起时间考验
为什么都放弃了LangChain? - 深度学习与NLP的文章 - 知乎
https://zhuanlan.zhihu.com/p/705164113
人工智能和 LLM 是瞬息万变的领域,每周都会有新的概念和想法出现。而 LangChain 这样围绕多种新兴技术创建的抽象概念,其框架设计很难经得起时间考验。
不要使用 LangChain
我建议大家不要使用 LangChain,这篇文章解释得很好
它在抽象之上使用抽象,实际上使你的代码变得不必要地复杂
只需编写 API调用并添加矢量数据库即可
– Fabian Both,AI 测试工具 Octomind 的深度学习工程师
Anthropic CPO访谈
https://mp.weixin.qq.com/s/Q06wTY_QMRlrTMOoTFh0qw
知道该向 AI 问什么、如何组织问题、如何思考前后端的结构变化,这些仍然是需要工程师具备的专业技能。
人类则更多地进行验收测试,而不是逐行审查。
最酷的是,这打破了技术壁垒。比如,Claude Code 是用 TypeScript 写的,但我们公司大部分项目用的是 Python。昨天我在 Slack 上看到一个同事,他不懂 TypeScript,但他想修复 Claude Code 的一个问题。于是他直接和 Claude 对话,一个小时内就生成了拉取请求并解决了问题。这让非团队成员也能轻松做出贡献。
关于 Artifact:当投入 10 分努力只能换来 1 分产出时,我们意识到这个产品的能量已经不存在了。
Q:对于那些想在 AI 领域创业的人来说,你认为哪些领域是相对安全的,不容易被像你们这样的基础模型公司碾压?
A:有几点:
一是对特定行业的深刻理解。比如法律科技公司 Harvey,他们的产品界面是为律师的特定工作流程设计的,这是你从零开始无法想到的。生物科技、医疗健康等领域也是如此。
二是差异化的市场进入策略。你是否了解你的客户,是卖给工程部、CIO 还是总法律顾问?这需要深厚的行业经验。
三是全新的交互形式。现有巨头的产品已经让用户形成了使用习惯,这为那些提供完全不同交互方式的初创公司留下了空间。
最后,也是最重要的一点,保持创业公司的精神。那种“我们与世界为敌,必须解决这个问题”的生存危机感,是无法用 OKR 复制的,这是一种持续的优势。
Q:您如何看待在构建功能时,既能增强人类能力,又能保持用户自主性,而不是让他们对我产生依赖?
A:一个好的产品设计来自于解决张力。一方面,我们希望模型能高效地给出答案;另一方面,我们不希望它变成一个让人停止思考的拐杖。关键在于找到平衡。我们需要训练 Claude 成为一个优秀的“对话者”,不是聊天机器人意义上的,而是真正的协作者,知道何时该介入,何时该提供更多信息,从而实现一种增强型的思维伙伴关系,而不是简单的认知代理。
技术卷成了白菜价
依靠技术还能搞钱在过去大量存在,到了今天,技术从上游卷到下游,卷到了白菜价……