资讯可视化-基于沟通日志的AI复盘

这个项目做得比较坎坷,为了吸取经验教训,我把历史沟通记录扔给 AI,让其进行复盘总结。
这个项目最大的几个问题:
1、缺乏明确的协议定义作为各方的执行标准(前期太草率了,后面改动多次,也没有及时更新,也没有先制定相关的测试和验证工具,这种项目应该必须TDD才对)
2、过度依赖 Prompt,缺少工程化来提升稳定性、确定性

Prompt

1
2
3
4
5
/plan
@news_question.txt)
我们正在做一个基于大模型的 Agent 应用。这是我们在开发过程中的聊天记录,从中可以发现许多问题。我希望将这些问题按类别进行整理,把项目开发过程中出现的问题全部梳理出来,便于后续的项目总结。因此,请基于这份聊天记录,对我们遇到的问题进行分类与整理;为每一种类型的问题提供描述信息以及示例,并可贴出具体案例。请务必完整覆盖,注意不要遗漏问题,千万不要遗漏。

同时,请依据这些问题的严重程度、出现频率等维度做出分析排名;在此基础上形成一份总结表格,并将上述所有分析结果写入本地 Markdown 文件。信息越详细越好,不要丢失任何信息。最后,请再反思文档与已分析的问题,确认是否还有可以补充的内容。

项目概述

本报告基于一个基于大模型的 Agent 应用开发团队的聊天记录,对项目开发过程中遇到的问题进行全面分析和总结。该项目是一个资讯内容增强应用,通过 AI 模型为资讯内容添加可视化图表、时间轴、弹窗说明等增强功能。

分析方法

  • 数据来源:团队开发聊天记录(2754 行)
  • 分析周期:2025 年 8 月 12 日 - 2025 年 8 月 21 日
  • 分析方法:问题分类、频率统计、严重程度评估、影响范围分析

问题分类详细分析

一、技术实现问题

1. 模型生成质量问题

问题描述:AI 模型生成的内容格式错误、质量不稳定,严重影响系统可用性
出现频率:约 25 次,贯穿整个开发周期
严重程度:★★★★★(最高)
影响范围:核心功能,导致系统不可用

具体案例

  • 空指针异常(第 358-366 行):
    1
    2
    "data": "空指针异常\n\nnull"
    现在报空指针异常的很多,大约二分之一请求报这个
  • JSON 格式错误(第 866 行):
    1
    JsonMappingException: Unexpected character ('}' (code 125)): was expecting double-quote to start field name
  • 内容篡改(第 1727 行):
    1
    这篇文章输出"篡改"了一下原文,为啥会这样
  • 乱码问题(第 975 行):
    1
    返回乱码
  • 中英文混合输出(第 2322 行):
    1
    好难出可视化图表啊,这个甚至出现了中文
  • 重复返回(第 999 行):
    1
    同样的popup返回了2

2. 数据格式和结构问题

问题描述:数据格式不规范,前后端数据结构不一致,导致对接困难
出现频率:约 20 次
严重程度:★★★★☆
影响范围:前后端对接,功能实现

具体案例

  • 字段命名错误(第 220 行):
    1
    部分字段错误,比如这个应该是content,返回了context
  • 驼峰命名问题(第 896 行):
    1
    subTitle写错了,应该是驼峰命名
  • 单词拼写错误(第 904 行):
    1
    单词写错了,figure
  • 数据结构错误(第 909 行):
    1
    chart组件的data应该是数组,不是对象
  • 缺少必要属性(第 913 行):
    1
    chart组件缺少了props属性
  • 属性名称错误(第 918 行):
    1
    timeline写错了
  • 数据结构变更(第 2415 行):
    1
    chart的props变成了chartSpec
  • 层级结构混乱(第 2420 行):
    1
    这个层级结构有点乱

3. 可视化图表问题

问题描述:图表生成不稳定,数据格式不正确,展示效果差
出现频率:约 18 次
严重程度:★★★★☆
影响范围:核心功能展示

具体案例

  • 图表生成失败(第 1846 行):
    1
    chart没返回chartSpec字段,所以可视化图表出不来
  • 图表不稳定(第 2070 行):
    1
    chart出现得非常不稳定,我试了几次,都没出现chart
  • 数据格式错误(第 1927 行):
    1
    chartdata,还是返回的对象,应该是数组
  • 错误的配置格式(第 1932 行):
    1
    而且这个怎么返回ECharts的配置了
  • 时间格式问题(第 2554 行):
    1
    chart中,代表时间的字段的值,必须是字符串或者是时间戳,目前有返回数值时间的情况,比如2001,这种是不行的
  • 图表显示问题(第 2575-2583 行):
    1
    2
    3
    4
    5
    出来了一个图,但很多小问题:
    1hover柱子之后出来了浮框里面是空的
    2、没有加"source:"
    3logo没换
    4Y-axis Label 单词中间没有空格;X-axis Label 没显示全,字体也不对

4. 图片和资源管理问题

问题描述:人物头像获取困难,图片资源管理混乱,存在侵权风险
出现频率:约 8 次
严重程度:★★★☆☆
影响范围:功能完整性

具体案例

  • 图片库有限(第 402-467 行):
    1
    image,是图片库里面,一共就50多个,要名字对上 ,才会触发
  • 人物图片缺失(第 491 行):
    1
    能让他们补一些最近频繁出境的人物的图片么?比如特朗普这种
  • 侵权风险(第 637 行):
    1
    我理解就是有人投诉照片侵权了,就从txt中找到这些"备注",说明照片是可商用的
  • 头像获取问题(第 1737 行):
    1
    头像是出来了,但文字解释还是没有
  • 图片资源更新(第 1739 行):
    1
    340张图片鲁大师那边传好了,格式有点变化

二、工程化和架构问题

1. 架构设计问题

问题描述:系统架构过度依赖 Prompt,工程化程度不足,缺乏稳定性
出现频率:约 15 次
严重程度:★★★★★
影响范围:项目长期发展

具体案例

  • 过度依赖 Prompt(第 776 行):
    1
    prompt全是一次性的啊。。。你未来随便加一个,全都变了
  • 工程化不足(第 2695 行):
    1
    感觉我们这个项目对Prompt的倚重太大了,工程化的内容不够
  • 架构意义质疑(第 2746 行):
    1
    这现在agent框架的意义是啥 我都不知道了。。。感觉就是个大prompt工程
  • Agent 反思机制缺失(第 2750 行):
    1
    agent能加反思吗?生成结果之后 让他强行反思下问题

2. 接口和协议问题

问题描述:接口协议不稳定,前后端协作困难,配置混乱
出现频率:约 12 次
严重程度:★★★☆☆
影响范围:前后端协作

具体案例

  • inline 配置疑问(第 122 行):
    1
    inline不需要指出在那个词后面/本身上面加吗?
  • 数据层级争议(第 302-317 行):
    1
    timeline这个,没有props,只有data,是不是太特殊了啊
  • slot 配置混乱(第 740-748 行):
    1
    caption只能在block里面么?这里面定的区域,强调了,在popup时有效,上面那些是不是只在block里面有效?
  • 接口数据问题(第 1804 行):
    1
    目前,接口数据有问题,display为popup的卡片,展示文本使用的slot是anchor,不是caption
  • 标签命名规范(第 2050 行):
    1
    这个标签名能不能改成data-vis 因为前端库这个标签不能命名成datav

3. 测试和调试问题

问题描述:缺乏有效的测试和调试工具,开发效率低下
出现频率:约 8 次
严重程度:★★★★☆
影响范围:开发效率

具体案例

  • 缺乏调试工具(第 522 行):
    1
    现在看不到prompt的输出结果,我不好改,可以帮忙看看怎么做一个功能页面给我吗
  • 测试效率低(第 543 行):
    1
    现在测一次几分钟,那个不适合给杰英测试单步Prompt的输出吧,效率太低了
  • 分步调试需求(第 559 行):
    1
    是这个,相当于只验证各个Prompt的内容,不走后面的

4. 部署和运维问题

问题描述:部署流程不稳定,环境配置问题,外部依赖风险
出现频率:约 6 次
严重程度:★★★★☆
影响范围:系统稳定性

具体案例

  • Prompt 缓存问题(第 1489 行):
    1
    现在prompt用的都是缓存的,gitee更新的并不会生效
  • 仓库权限问题(第 1493 行):
    1
    因为gitee仓库转private了,更新读取不到了
  • 部署平台故障(第 2227 行):
    1
    平台不知道出什么毛病
  • 镜像构建失败(第 2228 行):
    1
    镜像打不出来

三、团队协作和沟通问题

1. 需求理解不一致

问题描述:团队成员对需求理解存在偏差,导致实现不符合预期
出现频率:约 6 次
严重程度:★★★☆☆
影响范围:功能实现

具体案例

  • inline 功能理解偏差(第 122 行):
    1
    inline不需要指出在那个词后面/本身上面加吗?
  • 区域配置争议(第 740-748 行):
    1
    caption只能在block里面么?这里面定的区域,强调了,在popup时有效,上面那些是不是只在block里面有效?
  • 配置方案分歧(第 772 行):
    1
    那就是完全不一样的配置了吧
  • Agent 合并争议(第 1414 行):
    1
    按照昨天说的,popup和block是不是要合成一个agent去写?

2. 责任分工不明确

问题描述:任务边界不清晰,相互推诿,影响开发效率
出现频率:约 5 次
严重程度:★★★☆☆
影响范围:团队效率

具体案例

  • 字段使用确认(第 225 行):
    1
    @钱晓东 确认下这个columns我们用不用得到?用不到协议中就去掉吧
  • 责任归属疑问(第 226 行):
    1
    这个是之帆那边加的吧? @陈之帆
  • 任务分配混乱(第 686 行):
    1
    @陈彦卓(🧠) 彦卓来处理一下吧,有问题再找正高
  • 多人责任指向(第 1804 行):
    1
    目前,接口数据有问题,display为popup的卡片,展示文本使用的slot是anchor,不是caption @陈之帆 @赵京

3. 沟通效率问题

问题描述:信息传递不及时,重复沟通,团队氛围紧张
出现频率:约 4 次
严重程度:★★★☆☆
影响范围:团队效率

具体案例

  • 过度依赖个人(第 282 行):
    1
    我不管,组里有东哥就够了
  • 会议取消(第 510 行):
    1
    今天站会就不开了吧,等会就直接去这个吧?
  • 抱怨和指责(第 1052 行):
    1
    他改了一亿个bug
  • 能力质疑(第 1056 行):
    1
    说我们太菜,找不到更多

4. 技术决策摇摆

问题描述:技术方案频繁变更,缺乏稳定性,影响开发进度
出现频率:约 4 次
严重程度:★★★★☆
影响范围:项目稳定性

具体案例

  • 数据结构反复讨论(第 302-317 行):
    1
    timeline这个,没有props,只有data,是不是太特殊了啊
  • 合并方案讨论(第 792-812 行):
    1
    block和popup如果要合并的话,这个插槽模板就大概是这样
  • 方案变更(第 1418-1422 行):
    1
    不用啊,现在差的太多了,你等后续完善好了 再合吧

四、项目管理和时间管理问题

1. 进度控制问题

问题描述:项目进度难以控制,计划执行不力
出现频率:约 4 次
严重程度:★★★☆☆
影响范围:项目交付

具体案例

  • 会议取消(第 510 行):
    1
    今天站会就不开了吧,等会就直接去这个吧?
  • 个人原因延误(第 1117 行):
    1
    刚俞这边找我有个事情耽搁了,没下去对进度,今天就还是继续联调吧
  • 进度会议(第 1442 行):
    1
    等会还是10点过下进度和问题吧
  • 进度确认(第 1471 行):
    1
    过进度了

2. 技术债务积累

问题描述:临时解决方案过多,代码质量差,维护困难
出现频率:约 4 次
严重程度:★★★★☆
影响范围:长期维护

具体案例

  • 问题积累(第 1096 行):
    1
    不行了,GLM改BUG,越改越多了
  • 人工干预(第 1101 行):
    1
    开启人工模式了
  • 临时解决方案(第 1108 行):
    1
    还是人工先搞一把
  • 补丁代码(第 1923 行):
    1
    json我现在写一个纠正,可以纠正多余的和错误的括号

3. 资源管理问题

问题描述:外部资源依赖过多,管理混乱,存在风险
出现频率:约 3 次
严重程度:★★★★☆
影响范围:项目风险

具体案例

  • AI 模型额度限制(第 1088 行):
    1
    Claude额度用完了我用的GLM,真是坑爹
  • 安全风险(第 1451 行):
    1
    刺激,听说安全部扫出来 外网git有400个我们公司项目
  • 项目安全疑问(第 1455 行):
    1
    咱们这个有这些问题吗

五、产品质量和用户体验问题

1. 功能稳定性问题

问题描述:功能不稳定,时好时坏,用户体验差
出现频率:约 5 次
严重程度:★★★★☆
影响范围:用户满意度

具体案例

  • 高频异常(第 366 行):
    1
    现在报空指针异常的很多,大约二分之一请求报这个
  • 不稳定性(第 886 行):
    1
    不是必现
  • 功能缺失(第 1406 行):
    1
    为什么有些文章跑不出来?
  • 图表不稳定(第 2070 行):
    1
    chart出现得非常不稳定,我试了几次,都没出现chart

2. 用户体验细节问题

问题描述:用户体验细节不到位,交互体验差
出现频率:约 4 次
严重程度:★★★☆☆
影响范围:用户体验

具体案例

  • 文字样式问题(第 1634 行):
    1
    现在popup里面的文字全部加粗了,实际应该只有被hover的词出现在浮框中才加粗哦
  • 异常显示(第 1783 行):
    1
    这个绿色是啥东西
  • 交互问题(第 2357 行):
    1
    两个蓝链之间鼠标移动会闪烁
  • 高亮功能(第 2517 行):
    1
    蓝链文本是Fed 但是弹窗中的文本需要高亮The Federal Reserve

3. 数据准确性和完整性问题

问题描述:生成内容不准确,信息缺失,影响可信度
出现频率:约 3 次
严重程度:★★★★☆
影响范围:内容质量

具体案例

  • 信息缺失(第 1533 行):
    1
    1、没有加"source:"; 2、不应该直接放link,要放link来源的那个平台
  • 图表缺失(第 1598 行):
    1
    这个图没生成出来;另外"source:" 这个单词也没加
  • 内容不完整(第 1766 行):
    1
    头像是出来了,但文字解释还是没有

问题频率和严重程度分析

问题排名表

排名 问题类别 频率 严重程度 影响范围 主要表现 解决优先级
1 模型生成质量问题 高频 ★★★★★ 核心功能 空指针异常、JSON 格式错误、内容篡改、乱码 最高
2 数据格式和结构问题 高频 ★★★★☆ 前后端对接 字段命名错误、数据结构不一致、层级混乱
3 可视化图表问题 高频 ★★★★☆ 核心功能展示 图表生成失败、数据格式错误、稳定性差
4 工程化架构问题 中频 ★★★★★ 项目长期发展 过度依赖 Prompt、缺乏测试工具、部署不稳定
5 接口协议问题 高频 ★★★☆☆ 前后端协作 slot 配置争议、标签名规范、数据传输路径变更
6 团队沟通问题 中频 ★★★☆☆ 团队效率 需求理解不一致、责任分工不明确、沟通效率低
7 图片资源管理问题 中频 ★★★☆☆ 功能完整性 图片库有限、人物图片缺失、侵权风险
8 项目管理问题 低频 ★★★☆☆ 项目进度 进度控制不当、技术债务积累

关键发现

  1. 技术债务严重:过度依赖 AI 模型生成,缺乏传统软件工程的规范和约束
  2. 质量控制缺失:缺乏有效的测试和质量保障手段
  3. 团队协作低效:需求理解不一致,责任分工不明确
  4. 项目管理混乱:进度控制不当,技术债务积累严重
  5. 用户体验不佳:功能不稳定,交互体验差

深层次问题分析

1. AI 应用开发的固有挑战

问题表现

  • 不确定性:AI 模型输出具有随机性,难以保证一致性
  • 质量控制困难:传统测试方法难以验证 AI 生成内容
  • Prompt 工程复杂性:Prompt 设计与维护成本高

具体案例

1
2
感觉我们这个项目对Prompt的倚重太大了,工程化的内容不够
这现在agent框架的意义是啥 我都不知道了。。。感觉就是个大prompt工程

解决思路

  • 建立 AI 输出质量验证机制
  • 减少对 Prompt 的过度依赖
  • 结合传统软件工程方法

2. 团队经验和技能匹配问题

问题表现

  • AI 技术栈理解不足:团队对 AI 技术特点理解不够深入
  • 工程化能力不足:缺乏 AI 应用开发的工程经验
  • 最佳实践缺失:没有成熟的 AI 应用开发方法论

具体案例

1
2
Claude额度用完了我用的GLM,真是坑爹
GLM被干懵逼了

解决思路

  • 加强团队 AI 技术培训
  • 建立 AI 应用开发最佳实践
  • 引入有经验的 AI 工程师

3. 项目管理和流程问题

问题表现

  • 敏捷开发与 AI 迭代不适配:传统敏捷方法难以适应 AI 项目特点
  • 需求变更管理不当:需求频繁变更,缺乏有效管控
  • 风险管控不足:对 AI 项目的特殊风险认识不足

具体案例

1
2
3
不行了,GLM改BUG,越改越多了
开启人工模式了
还是人工先搞一把

解决思路

  • 适应 AI 项目特点的项目管理方法
  • 建立有效的需求变更管理机制
  • 加强风险识别和控制

4. 技术选型和工具链问题

问题表现

  • 工具链不成熟:AI 开发工具链不完善
  • 技术选型不当:部分技术选择不适合项目需求
  • 环境配置复杂:开发和部署环境配置困难

具体案例

1
2
这pnpm好好用啊!是我孤陋寡闻了!
cursor也是这么讲的,我去i了,还是这样 是不是要清理一下什么?

解决思路

  • 评估和选择成熟的 AI 开发工具
  • 简化环境配置,提高开发效率
  • 建立技术选型评估机制

改进建议

1. 技术层面改进

1.1 建立数据结构和接口规范

  • 制定统一的数据格式标准
  • 建立接口版本管理机制
  • 实施数据验证和校验

1.2 加强质量控制

  • 建立 AI 输出质量验证机制
  • 实施自动化测试
  • 建立性能监控和告警

1.3 优化架构设计

  • 减少对 Prompt 的过度依赖
  • 建立模块化和可扩展的架构
  • 实施微服务架构

2. 工程化层面改进

2.1 完善开发工具链

  • 建立统一的开发环境
  • 配置自动化构建和部署
  • 实施代码质量管理

2.2 建立测试体系

  • 单元测试、集成测试、端到端测试
  • AI 模型输出质量测试
  • 性能测试和压力测试

2.3 优化部署流程

  • 容器化部署
  • 持续集成和持续部署
  • 建立灾备和恢复机制

3. 团队协作层面改进

3.1 明确责任分工

  • 制定明确的角色和职责
  • 建立任务分配和跟踪机制
  • 实施代码审查制度

3.2 改善沟通机制

  • 建立定期会议制度
  • 使用项目管理工具
  • 建立知识共享机制

3.3 加强团队培训

  • AI 技术培训
  • 工程化技能培训
  • 项目管理培训

4. 项目管理层面改进

4.1 适应 AI 项目特点

  • 调整项目管理方法
  • 建立迭代式开发流程
  • 实施风险管理

4.2 控制技术债务

  • 建立代码质量标准
  • 定期重构和优化
  • 实施技术评估

4.3 优化资源管理

  • 建立资源预算和管控
  • 外部依赖风险评估
  • 建立应急响应机制

5. 产品质量层面改进

5.1 提升功能稳定性

  • 建立监控和告警机制
  • 实施故障恢复机制
  • 建立用户反馈收集机制

5.2 改善用户体验

  • 建立用户体验设计规范
  • 实施用户测试
  • 建立用户反馈处理机制

5.3 保证数据质量

  • 建立数据验证机制
  • 实施数据清洗和处理
  • 建立数据质量监控

总结

本分析报告基于团队开发聊天记录,全面识别和分析了项目开发过程中的各类问题。主要发现:

  1. 技术层面:模型生成质量、数据格式、可视化图表是主要问题
  2. 工程化层面:过度依赖 Prompt、缺乏测试工具、部署不稳定是核心挑战
  3. 团队协作层面:需求理解不一致、责任分工不明确影响效率
  4. 项目管理层面:进度控制不当、技术债务积累需要重视
  5. 产品质量层面:功能稳定性、用户体验、数据质量有待提升

这些问题反映了 AI 应用开发过程中的典型挑战,特别是在技术、工程化和团队协作方面的平衡难题。建议团队从技术规范、工程化建设、团队协作、项目管理、质量控制等多个维度进行系统性改进。

通过实施本报告的建议,团队可以:

  • 提高技术实现质量
  • 加强工程化能力
  • 改善团队协作效率
  • 优化项目管理流程
  • 提升产品质量和用户体验

最终实现项目的可持续发展,为后续 AI 应用开发积累宝贵经验。


报告生成时间:2025 年 8 月 21 日
分析周期:2025 年 8 月 12 日 - 2025 年 8 月 21 日
数据来源:团队开发聊天记录(2754 行)
分析方法:问题分类、频率统计、严重程度评估、影响范围分析