Weekly Summary(20240414)

技术

模型微调-LLaMA-Factory

https://github.com/hiyouga/LLaMA-Factory

可视化的交互方式,让训模型变得如此简单。

想法

缺好的产品点子

现在感觉最缺的就是好的产品点子。团队其实已经起来了,人员和基建都比之前好很多了。

没有好的点子,就只能做基建,修炼内功,但是这样看不到业务上的成果,长期下去是不行的。

LLM 能力不足对产品的限制

现在的 AI F10 强依赖公司的 LLM,但是 LLM 的能力是比较弱的,这样我们怎么雕花,上限都很低。

而我们是不能绕开公司的 LLM 的,这是个问题。

为什么公司选择从零开始训 LLM

估计有这么几方面的考虑:

  • 监管要求

  • 想要把核心技术掌握在自己手中,避免被卡脖子

  • 成本问题,如果用别人的 LLM,对于 ToC 应用来说,成本非常高

但是训 LLM 本身就是一个大投入才能有成效的事情,这个事情上不可能花小钱办大事

好文摘抄

构建可视化开发的知识库的问题

可视化的 UI 问题很难用语言描述,自然就难以搜索和向大模型提问。

你刚刚玩前端,大家都说 CSS 很简单的,大专生写的东西。当你看着一个 CSS 不会调整,打算去问Chatgpt,首先,你发现你不知道如何使用中文或者英文把你需要调整的 CSS 视觉效果表述成一段文字,当你花了几分钟敲字终于写成一段看着像是问题的发给 Chatgpt 后,你不加思考地把chatgpt给的回答复制粘贴进 style 标签中,然后发现前端一点变化也没有。

那一刻你明白了一件事,后端程序员和架构程序员觉得草蛋的事情是这个:

  • 修改前:为啥不能跑?
  • 修改后:为啥能跑?

前端程序员觉得草蛋的事情是这个:

  • 修改前:为啥看着 UI 不对?
  • 修改后:为啥我加了 1000 行 CSS,但是一点变化也没有?

当你和 chatgpt battle 了一个小时后,你打算还是用 google,上 StackOverflow(笑 向别人虚心请教。

你现在不想写前端了,你只想亲切问候这个该死的世界。

作者:锦恢
链接:https://www.zhihu.com/question/634451206/answer/3459566821
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。