weekly-summary-20250518

技术

谷歌的 NotebookLM 能生成中文播客了

https://www.ruanyifeng.com/blog/2025/05/notebooklm.html

它已经支持生成音频和 AI 问答,如果再支持生成视频,简直难以想象,是否还需要真人老师。
直接上传课本,它就生成讲课视频了。

Master the in-and-outs of building AI agents

Wanna master the in-and-outs of building AI agents?

Here’ a 3 step plan:

1️⃣ Master the Foundations (Don’t Skip This!)
↳ Google Agents Whitepaper https://archive.org/details/google-ai-agents-whitepaper
↳ Google Companion Paper https://kaggle.com/whitepaper-agent-companion
↳ ReAct: Reasoning + Acting with LLMs https://arxiv.org/abs/2210.03629
↳ Agent as a Judge https://arxiv.org/abs/2410.10934

2️⃣ Build to Learn (Apply The Theory)
↳ AI Agentic Design Patterns with AutoGen https://deeplearning.ai/short-courses/ai-agentic-design-patterns-with-autogen/
↳ Multi-AI Agent Systems with CrewAI https://deeplearning.ai/short-courses/multi-ai-agent-systems-with-crewai/
↳ AI Agents in LangGraph https://deeplearning.ai/short-courses/ai-agents-in-langgraph/
↳ Building Agentic RAG with LlamaIndex https://deeplearning.ai/short-courses/building-agentic-rag-with-llamaindex/

3️⃣ Study Real Projects (See How It’s Done)
↳ GenAI Agents by Nir Diamant https://github.com/NirDiamant/GenAI_Agents
↳ Agentic Pattern Course by Miguel Otero https://github.com/neural-maze/agentic-patterns-course
↳ Awesome LLMs apps by Shubham Saboo https://github.com/Shubhamsaboo/awesome-llm-apps

After completing these, the final stage is eternal: Keep building

a16z重磅预判:AI时代正在重写开发逻辑,这9个新范式将决定下一个技术十年

https://mp.weixin.qq.com/s/MGthNyHHlD4lERzDluMc1g
原文链接

1
"编程"转向"意图表达",从"版本控制"转向"意图追踪",从"文档"转向"知识神经网络"

AI可以很好的解决信息过载问题,包括我们的组件库的使用,本质上也是因为信息过载(上千的API,新手无法快速定位文档)导致易用性低。

1
这里有个很酷的概念,我称之为"上下文化的数据展示"。传统仪表板是静态的:它们展示固定的指标,用固定的方式。但AI驱动的仪表板可以根据你当前的任务、你的角色、甚至你过去的行为模式来重新配置自己。

构建面向AI的无障碍设施:

1
应用程序不再只为人眼设计,也为AI"眼"设计。每个界面元素都携带丰富的语义信息,不仅描述它看起来是什么,还描述它能做什么,以及如何使用它。

异步AI Agent:

1
这种异步模式可能会改变我们对"分支"的理解。传统的Git分支是代码的分叉。未来的"分支"可能是意图的分叉,每个分支由不同的AI agent以不同的方式探索。开发者不再是合并代码,而是评估和选择不同的解决方案路径。

关于a16z:
a16z(Andreessen Horowitz)是硅谷最知名的风险投资机构之一,由互联网先驱马克·安德森(Marc Andreessen)和本·霍洛维茨(Ben Horowitz)于2009年创立。

Assistant-UI:Typescript/React Library for AI Chat

https://github.com/assistant-ui/assistant-ui

思考:
我们是不是也得推出几个可视化组件库,能快速组装AI类的产品功能或者分析页面?
这个可以用Vega了,降低视觉上的要求,提升表达能力和数据分析能力。
可以根据用户意图随意组合配置

1
比如,用户可以说"显示上周末欧洲的异常情况",仪表板就会重塑以显示该视图,包括总结的趋势和相关日志。或者,更强大的是,"为什么我们的NPS评分上周下降了?",AI可能会提取调查情绪,将其与产品部署相关联,并生成一个简短的诊断叙述。

设计Agent: Lovart

https://mp.weixin.qq.com/s/SUa1Mwd4lAsOU-d_IOFZug

如何估算大模型推理阶段算力需求

https://mp.weixin.qq.com/s/oNsz5TG3NyfCUGDk136nSw

想法

如何阅读文档:从一个你感兴趣的问题开始

被动阅读主动查询
文档不再是文档,而是交互式知识系统
参考mintlify

1
开发者在文档方面的行为正在发生转变。与其阅读目录或从上往下扫描,用户现在从一个问题开始。心理模式不再是"让我研究这个规范",而是"按照我喜欢的方式重新整理这些信息"

好文摘抄

未来的开发模式

https://news.ycombinator.com/item?id=43955519
以前的小团队是1名高级开发人员 + 5名初级开发人员,以后是1名高级开发人员 + AI 大模型。

https://news.ycombinator.com/item?id=43965599
我打赌,以后的工程师必须深入底层,更接近硅片的层面。开发应用程序将不再需要精通技术的人,AI 让每个人都可以开发自己的应用程序。

加入创业公司的教训

https://blog.jacobstechtavern.com/p/the-side-hustle-from-hell

(1)即使创业公司的每个员工都很有动力,但如果创始人并非顶尖人才,那么取得巨大成功的机会很低(但你仍然可以从中学到很多东西)。

(2)创业公司只有两种工作:开发和销售。如果创始人既不做开发,也不做销售,不知道他在做什么,那就相信你的直觉吧。

(3)创业公司的产品还未得到市场验证的情况下,为多个平台构建原生应用,是一种极其低效的行为。如果同时为两个产品在每个平台开发两个原生应用,简直是疯了。

(4)创业公司的路演,大多是浪费时间。产品的验证来自于与用户交流和迭代,而不是打动评委。

(5)没有什么比并肩作战、共同实现梦想更神奇的了。如果你经常见不到创始人,所有的沟通都只能通过远程进行,那可不是好兆头。

(6)如果创业公司没有经过严格的面试,就录用了你,这是一个危险信号。他们到底是基于能力来录用你,还是因为你是第一个同意只收很少的报酬,就为他们工作的工程师?