RAG学习笔记
RAG 解决什么问题?
- 搜索
- Summary
概念
Tree-RAG
Tree-RAG 工作流程及实体树应用介绍:
https://cobusgreyling.medium.com/t-rag-rag-fine-tuning-entity-detection-9a5aaa01e437
翻译版:
https://juejin.cn/post/7353963878542573608
实体树向量数据库
Llama-index
https://developer.aliyun.com/article/1501662
https://legacy.ts.llamaindex.ai/
三种不同粒度的分割和检索策略:
https://docs.llamaindex.ai/en/stable/examples/retrievers/auto_merging_retriever/#load-data
Multi-Step Query Transformations(多步策略,分解任务,类似 CoT?):
https://docs.llamaindex.ai/en/stable/optimizing/advanced_retrieval/query_transformations/#hyde-hypothetical-document-embeddings
TS 版:
https://github.com/run-llama/LlamaIndexTS
Playground:
https://llama-playground.vercel.app/
技术
优化方式
最优化大模型效果之 RAG(二):索引的优化策略:
https://juejin.cn/post/7387016941552664630
交流
中午跟东明讨论下叙事可视化当前遇到的问题,未来的方案,如何合作
树状索引+LLaMa Index + 外部 LLM
树状索引的好处:不建立树状索引,是在整个空间里面找,自然准确性很差
针对我们的问题:结构化数据
Java 转成 Python