资讯可视化-基于沟通日志的AI复盘

这个项目做得比较坎坷，为了吸取经验教训，我把历史沟通记录扔给 AI，让其进行复盘总结。
这个项目最大的几个问题：
1、缺乏明确的协议定义作为各方的执行标准(前期太草率了，后面改动多次，也没有及时更新，也没有先制定相关的测试和验证工具，这种项目应该必须TDD才对)
2、过度依赖 Prompt，缺少工程化来提升稳定性、确定性

Prompt

/plan
@news_question.txt）
我们正在做一个基于大模型的 Agent 应用。这是我们在开发过程中的聊天记录，从中可以发现许多问题。我希望将这些问题按类别进行整理，把项目开发过程中出现的问题全部梳理出来，便于后续的项目总结。因此，请基于这份聊天记录，对我们遇到的问题进行分类与整理；为每一种类型的问题提供描述信息以及示例，并可贴出具体案例。请务必完整覆盖，注意不要遗漏问题，千万不要遗漏。

同时，请依据这些问题的严重程度、出现频率等维度做出分析排名；在此基础上形成一份总结表格，并将上述所有分析结果写入本地 Markdown 文件。信息越详细越好，不要丢失任何信息。最后，请再反思文档与已分析的问题，确认是否还有可以补充的内容。

项目概述

本报告基于一个基于大模型的 Agent 应用开发团队的聊天记录，对项目开发过程中遇到的问题进行全面分析和总结。该项目是一个资讯内容增强应用，通过 AI 模型为资讯内容添加可视化图表、时间轴、弹窗说明等增强功能。

分析方法

数据来源：团队开发聊天记录（2754 行）
分析周期：2025 年 8 月 12 日 - 2025 年 8 月 21 日
分析方法：问题分类、频率统计、严重程度评估、影响范围分析

问题分类详细分析

一、技术实现问题

1. 模型生成质量问题

问题描述：AI 模型生成的内容格式错误、质量不稳定，严重影响系统可用性
出现频率：约 25 次，贯穿整个开发周期
严重程度：★★★★★（最高）
影响范围：核心功能，导致系统不可用

具体案例：

空指针异常（第 358-366 行）：

1 2	`"data": "空指针异常\n\nnull" 现在报空指针异常的很多，大约二分之一请求报这个`

JSON 格式错误（第 866 行）：

1	`JsonMappingException: Unexpected character ('}' (code 125)): was expecting double-quote to start field name`

内容篡改（第 1727 行）：

1	`这篇文章输出"篡改"了一下原文，为啥会这样`

乱码问题（第 975 行）：
1
返回乱码

中英文混合输出（第 2322 行）：

1	`好难出可视化图表啊，这个甚至出现了中文`

重复返回（第 999 行）：
1
同样的popup返回了2次

2. 数据格式和结构问题

问题描述：数据格式不规范，前后端数据结构不一致，导致对接困难
出现频率：约 20 次
严重程度：★★★★☆
影响范围：前后端对接，功能实现

具体案例：

字段命名错误（第 220 行）：

1	`部分字段错误，比如这个应该是content，返回了context`

驼峰命名问题（第 896 行）：

1	`subTitle写错了，应该是驼峰命名`

单词拼写错误（第 904 行）：
1
单词写错了，figure

数据结构错误（第 909 行）：

1	`chart组件的data应该是数组，不是对象`

缺少必要属性（第 913 行）：
1
chart组件缺少了props属性
属性名称错误（第 918 行）：
1
timeline写错了
数据结构变更（第 2415 行）：
1
chart的props变成了chartSpec
层级结构混乱（第 2420 行）：
1
这个层级结构有点乱

3. 可视化图表问题

问题描述：图表生成不稳定，数据格式不正确，展示效果差
出现频率：约 18 次
严重程度：★★★★☆
影响范围：核心功能展示

具体案例：

图表生成失败（第 1846 行）：

1	`chart没返回chartSpec字段，所以可视化图表出不来`

图表不稳定（第 2070 行）：

1	`chart出现得非常不稳定，我试了几次，都没出现chart`

数据格式错误（第 1927 行）：

1	`chart的data，还是返回的对象，应该是数组`

错误的配置格式（第 1932 行）：

1	`而且这个怎么返回ECharts的配置了`

时间格式问题（第 2554 行）：

1	`chart中，代表时间的字段的值，必须是字符串或者是时间戳，目前有返回数值时间的情况，比如2001，这种是不行的`

图表显示问题（第 2575-2583 行）：

出来了一个图，但很多小问题：
1、hover柱子之后出来了浮框里面是空的
2、没有加"source:"
3、logo没换
4、Y-axis Label 单词中间没有空格；X-axis Label 没显示全，字体也不对

4. 图片和资源管理问题

问题描述：人物头像获取困难，图片资源管理混乱，存在侵权风险
出现频率：约 8 次
严重程度：★★★☆☆
影响范围：功能完整性

具体案例：

图片库有限（第 402-467 行）：

1	`image，是图片库里面，一共就50多个，要名字对上，才会触发`

人物图片缺失（第 491 行）：

1	`能让他们补一些最近频繁出境的人物的图片么？比如特朗普这种`

侵权风险（第 637 行）：

1	`我理解就是有人投诉照片侵权了，就从txt中找到这些"备注"，说明照片是可商用的`

头像获取问题（第 1737 行）：

1	`头像是出来了，但文字解释还是没有`

图片资源更新（第 1739 行）：

1	`340张图片鲁大师那边传好了，格式有点变化`

二、工程化和架构问题

1. 架构设计问题

问题描述：系统架构过度依赖 Prompt，工程化程度不足，缺乏稳定性
出现频率：约 15 次
严重程度：★★★★★
影响范围：项目长期发展

具体案例：

过度依赖 Prompt（第 776 行）：

1	`这prompt全是一次性的啊。。。你未来随便加一个，全都变了`

工程化不足（第 2695 行）：

1	`感觉我们这个项目对Prompt的倚重太大了，工程化的内容不够`

架构意义质疑（第 2746 行）：

1	`这现在agent框架的意义是啥我都不知道了。。。感觉就是个大prompt工程`

Agent 反思机制缺失（第 2750 行）：

1	`这agent能加反思吗？生成结果之后让他强行反思下问题`

2. 接口和协议问题

问题描述：接口协议不稳定，前后端协作困难，配置混乱
出现频率：约 12 次
严重程度：★★★☆☆
影响范围：前后端协作

具体案例：

inline 配置疑问（第 122 行）：

1	`inline不需要指出在那个词后面/本身上面加吗？`

数据层级争议（第 302-317 行）：

1	`timeline这个，没有props，只有data，是不是太特殊了啊`

slot 配置混乱（第 740-748 行）：

1	`caption只能在block里面么？这里面定的区域，强调了，在popup时有效，上面那些是不是只在block里面有效？`

接口数据问题（第 1804 行）：

1	`目前，接口数据有问题，display为popup的卡片，展示文本使用的slot是anchor，不是caption`

标签命名规范（第 2050 行）：

1	`这个标签名能不能改成data-vis 因为前端库这个标签不能命名成datav`

3. 测试和调试问题

问题描述：缺乏有效的测试和调试工具，开发效率低下
出现频率：约 8 次
严重程度：★★★★☆
影响范围：开发效率

具体案例：

缺乏调试工具（第 522 行）：

1	`现在看不到prompt的输出结果，我不好改，可以帮忙看看怎么做一个功能页面给我吗`

测试效率低（第 543 行）：

1	`现在测一次几分钟，那个不适合给杰英测试单步Prompt的输出吧，效率太低了`

分步调试需求（第 559 行）：

1	`是这个，相当于只验证各个Prompt的内容，不走后面的`

4. 部署和运维问题

问题描述：部署流程不稳定，环境配置问题，外部依赖风险
出现频率：约 6 次
严重程度：★★★★☆
影响范围：系统稳定性

具体案例：

Prompt 缓存问题（第 1489 行）：

1	`现在prompt用的都是缓存的，gitee更新的并不会生效`

仓库权限问题（第 1493 行）：

1	`因为gitee仓库转private了，更新读取不到了`

部署平台故障（第 2227 行）：
1
平台不知道出什么毛病
镜像构建失败（第 2228 行）：
1
镜像打不出来

三、团队协作和沟通问题

1. 需求理解不一致

问题描述：团队成员对需求理解存在偏差，导致实现不符合预期
出现频率：约 6 次
严重程度：★★★☆☆
影响范围：功能实现

具体案例：

inline 功能理解偏差（第 122 行）：

1	`inline不需要指出在那个词后面/本身上面加吗？`

区域配置争议（第 740-748 行）：

1	`caption只能在block里面么？这里面定的区域，强调了，在popup时有效，上面那些是不是只在block里面有效？`

配置方案分歧（第 772 行）：

1	`那就是完全不一样的配置了吧`

Agent 合并争议（第 1414 行）：

1	`按照昨天说的，popup和block是不是要合成一个agent去写？`

2. 责任分工不明确

问题描述：任务边界不清晰，相互推诿，影响开发效率
出现频率：约 5 次
严重程度：★★★☆☆
影响范围：团队效率

具体案例：

字段使用确认（第 225 行）：

1	`@钱晓东确认下这个columns我们用不用得到？用不到协议中就去掉吧`

责任归属疑问（第 226 行）：

1	`这个是之帆那边加的吧？ @陈之帆`

任务分配混乱（第 686 行）：

1	`@陈彦卓(🧠) 彦卓来处理一下吧，有问题再找正高`

多人责任指向（第 1804 行）：

1	`目前，接口数据有问题，display为popup的卡片，展示文本使用的slot是anchor，不是caption @陈之帆 @赵京`

3. 沟通效率问题

问题描述：信息传递不及时，重复沟通，团队氛围紧张
出现频率：约 4 次
严重程度：★★★☆☆
影响范围：团队效率

具体案例：

过度依赖个人（第 282 行）：
1
我不管，组里有东哥就够了

会议取消（第 510 行）：

1	`今天站会就不开了吧，等会就直接去这个吧？`

抱怨和指责（第 1052 行）：
1
他改了一亿个bug
能力质疑（第 1056 行）：
1
说我们太菜，找不到更多

4. 技术决策摇摆

问题描述：技术方案频繁变更，缺乏稳定性，影响开发进度
出现频率：约 4 次
严重程度：★★★★☆
影响范围：项目稳定性

具体案例：

数据结构反复讨论（第 302-317 行）：

1	`timeline这个，没有props，只有data，是不是太特殊了啊`

合并方案讨论（第 792-812 行）：

1	`block和popup如果要合并的话，这个插槽模板就大概是这样`

方案变更（第 1418-1422 行）：

1	`不用啊，现在差的太多了，你等后续完善好了再合吧`

四、项目管理和时间管理问题

1. 进度控制问题

问题描述：项目进度难以控制，计划执行不力
出现频率：约 4 次
严重程度：★★★☆☆
影响范围：项目交付

具体案例：

会议取消（第 510 行）：

1	`今天站会就不开了吧，等会就直接去这个吧？`

个人原因延误（第 1117 行）：

1	`刚俞这边找我有个事情耽搁了，没下去对进度，今天就还是继续联调吧`

进度会议（第 1442 行）：

1	`等会还是10点过下进度和问题吧`

进度确认（第 1471 行）：
1
过进度了

2. 技术债务积累

问题描述：临时解决方案过多，代码质量差，维护困难
出现频率：约 4 次
严重程度：★★★★☆
影响范围：长期维护

具体案例：

问题积累（第 1096 行）：

1	`不行了，GLM改BUG，越改越多了`

人工干预（第 1101 行）：
1
开启人工模式了
临时解决方案（第 1108 行）：
1
还是人工先搞一把

补丁代码（第 1923 行）：

1	`json我现在写一个纠正，可以纠正多余的和错误的括号`

3. 资源管理问题

问题描述：外部资源依赖过多，管理混乱，存在风险
出现频率：约 3 次
严重程度：★★★★☆
影响范围：项目风险

具体案例：

AI 模型额度限制（第 1088 行）：

1	`Claude额度用完了我用的GLM，真是坑爹`

安全风险（第 1451 行）：

1	`刺激，听说安全部扫出来外网git有400个我们公司项目`

项目安全疑问（第 1455 行）：
1
咱们这个有这些问题吗

五、产品质量和用户体验问题

1. 功能稳定性问题

问题描述：功能不稳定，时好时坏，用户体验差
出现频率：约 5 次
严重程度：★★★★☆
影响范围：用户满意度

具体案例：

高频异常（第 366 行）：

1	`现在报空指针异常的很多，大约二分之一请求报这个`

不稳定性（第 886 行）：
1
不是必现
功能缺失（第 1406 行）：
1
为什么有些文章跑不出来？

图表不稳定（第 2070 行）：

1	`chart出现得非常不稳定，我试了几次，都没出现chart`

2. 用户体验细节问题

问题描述：用户体验细节不到位，交互体验差
出现频率：约 4 次
严重程度：★★★☆☆
影响范围：用户体验

具体案例：

文字样式问题（第 1634 行）：

1	`现在popup里面的文字全部加粗了，实际应该只有被hover的词出现在浮框中才加粗哦`

异常显示（第 1783 行）：
1
这个绿色是啥东西

交互问题（第 2357 行）：

1	`两个蓝链之间鼠标移动会闪烁`

高亮功能（第 2517 行）：

1	`蓝链文本是Fed 但是弹窗中的文本需要高亮The Federal Reserve`

3. 数据准确性和完整性问题

问题描述：生成内容不准确，信息缺失，影响可信度
出现频率：约 3 次
严重程度：★★★★☆
影响范围：内容质量

具体案例：

信息缺失（第 1533 行）：

1	`1、没有加"source:"; 2、不应该直接放link，要放link来源的那个平台`

图表缺失（第 1598 行）：

1	`这个图没生成出来；另外"source:" 这个单词也没加`

内容不完整（第 1766 行）：

1	`头像是出来了，但文字解释还是没有`

问题频率和严重程度分析

问题排名表

排名	问题类别	频率	严重程度	影响范围	主要表现	解决优先级
1	模型生成质量问题	高频	★★★★★	核心功能	空指针异常、JSON 格式错误、内容篡改、乱码	最高
2	数据格式和结构问题	高频	★★★★☆	前后端对接	字段命名错误、数据结构不一致、层级混乱	高
3	可视化图表问题	高频	★★★★☆	核心功能展示	图表生成失败、数据格式错误、稳定性差	高
4	工程化架构问题	中频	★★★★★	项目长期发展	过度依赖 Prompt、缺乏测试工具、部署不稳定	高
5	接口协议问题	高频	★★★☆☆	前后端协作	slot 配置争议、标签名规范、数据传输路径变更	中
6	团队沟通问题	中频	★★★☆☆	团队效率	需求理解不一致、责任分工不明确、沟通效率低	中
7	图片资源管理问题	中频	★★★☆☆	功能完整性	图片库有限、人物图片缺失、侵权风险	中
8	项目管理问题	低频	★★★☆☆	项目进度	进度控制不当、技术债务积累	低

关键发现

技术债务严重：过度依赖 AI 模型生成，缺乏传统软件工程的规范和约束
质量控制缺失：缺乏有效的测试和质量保障手段
团队协作低效：需求理解不一致，责任分工不明确
项目管理混乱：进度控制不当，技术债务积累严重
用户体验不佳：功能不稳定，交互体验差

深层次问题分析

1. AI 应用开发的固有挑战

问题表现

不确定性：AI 模型输出具有随机性，难以保证一致性
质量控制困难：传统测试方法难以验证 AI 生成内容
Prompt 工程复杂性：Prompt 设计与维护成本高

具体案例

1 2	`感觉我们这个项目对Prompt的倚重太大了，工程化的内容不够这现在agent框架的意义是啥我都不知道了。。。感觉就是个大prompt工程`

解决思路

建立 AI 输出质量验证机制
减少对 Prompt 的过度依赖
结合传统软件工程方法

2. 团队经验和技能匹配问题

问题表现

AI 技术栈理解不足：团队对 AI 技术特点理解不够深入
工程化能力不足：缺乏 AI 应用开发的工程经验
最佳实践缺失：没有成熟的 AI 应用开发方法论

具体案例

1 2	`Claude额度用完了我用的GLM，真是坑爹 GLM被干懵逼了`

解决思路

加强团队 AI 技术培训
建立 AI 应用开发最佳实践
引入有经验的 AI 工程师

3. 项目管理和流程问题

问题表现

敏捷开发与 AI 迭代不适配：传统敏捷方法难以适应 AI 项目特点
需求变更管理不当：需求频繁变更，缺乏有效管控
风险管控不足：对 AI 项目的特殊风险认识不足

具体案例

1
2
3

不行了，GLM改BUG，越改越多了
开启人工模式了
还是人工先搞一把

解决思路

适应 AI 项目特点的项目管理方法
建立有效的需求变更管理机制
加强风险识别和控制

4. 技术选型和工具链问题

问题表现

工具链不成熟：AI 开发工具链不完善
技术选型不当：部分技术选择不适合项目需求
环境配置复杂：开发和部署环境配置困难

具体案例

1 2	`这pnpm好好用啊！是我孤陋寡闻了！ cursor也是这么讲的，我去i了，还是这样是不是要清理一下什么？`

解决思路

评估和选择成熟的 AI 开发工具
简化环境配置，提高开发效率
建立技术选型评估机制

改进建议

1. 技术层面改进

1.1 建立数据结构和接口规范

制定统一的数据格式标准
建立接口版本管理机制
实施数据验证和校验

1.2 加强质量控制

建立 AI 输出质量验证机制
实施自动化测试
建立性能监控和告警

1.3 优化架构设计

减少对 Prompt 的过度依赖
建立模块化和可扩展的架构
实施微服务架构

2. 工程化层面改进

2.1 完善开发工具链

建立统一的开发环境
配置自动化构建和部署
实施代码质量管理

2.2 建立测试体系

单元测试、集成测试、端到端测试
AI 模型输出质量测试
性能测试和压力测试

2.3 优化部署流程

容器化部署
持续集成和持续部署
建立灾备和恢复机制

3. 团队协作层面改进

3.1 明确责任分工

制定明确的角色和职责
建立任务分配和跟踪机制
实施代码审查制度

3.2 改善沟通机制

建立定期会议制度
使用项目管理工具
建立知识共享机制

3.3 加强团队培训

AI 技术培训
工程化技能培训
项目管理培训

4. 项目管理层面改进

4.1 适应 AI 项目特点

调整项目管理方法
建立迭代式开发流程
实施风险管理

4.2 控制技术债务

建立代码质量标准
定期重构和优化
实施技术评估

4.3 优化资源管理

建立资源预算和管控
外部依赖风险评估
建立应急响应机制

5. 产品质量层面改进

5.1 提升功能稳定性

建立监控和告警机制
实施故障恢复机制
建立用户反馈收集机制

5.2 改善用户体验

建立用户体验设计规范
实施用户测试
建立用户反馈处理机制

5.3 保证数据质量

建立数据验证机制
实施数据清洗和处理
建立数据质量监控

总结

本分析报告基于团队开发聊天记录，全面识别和分析了项目开发过程中的各类问题。主要发现：

技术层面：模型生成质量、数据格式、可视化图表是主要问题
工程化层面：过度依赖 Prompt、缺乏测试工具、部署不稳定是核心挑战
团队协作层面：需求理解不一致、责任分工不明确影响效率
项目管理层面：进度控制不当、技术债务积累需要重视
产品质量层面：功能稳定性、用户体验、数据质量有待提升

这些问题反映了 AI 应用开发过程中的典型挑战，特别是在技术、工程化和团队协作方面的平衡难题。建议团队从技术规范、工程化建设、团队协作、项目管理、质量控制等多个维度进行系统性改进。

通过实施本报告的建议，团队可以：

提高技术实现质量
加强工程化能力
改善团队协作效率
优化项目管理流程
提升产品质量和用户体验

最终实现项目的可持续发展，为后续 AI 应用开发积累宝贵经验。

报告生成时间：2025 年 8 月 21 日
分析周期：2025 年 8 月 12 日 - 2025 年 8 月 21 日
数据来源：团队开发聊天记录（2754 行）
分析方法：问题分类、频率统计、严重程度评估、影响范围分析

#前端工程化 #项目管理 #Agent

weekly-summary-20250831 上一篇

技术拆解-ClaudeCopilot 下一篇