RAG学习笔记

RAG 解决什么问题?

  • 搜索
  • Summary

概念

Tree-RAG

Tree-RAG 工作流程及实体树应用介绍:
https://cobusgreyling.medium.com/t-rag-rag-fine-tuning-entity-detection-9a5aaa01e437
翻译版:
https://juejin.cn/post/7353963878542573608

实体树向量数据库

Llama-index

https://developer.aliyun.com/article/1501662

https://legacy.ts.llamaindex.ai/

三种不同粒度的分割和检索策略:
https://docs.llamaindex.ai/en/stable/examples/retrievers/auto_merging_retriever/#load-data

Multi-Step Query Transformations(多步策略,分解任务,类似 CoT?):
https://docs.llamaindex.ai/en/stable/optimizing/advanced_retrieval/query_transformations/#hyde-hypothetical-document-embeddings

TS 版:
https://github.com/run-llama/LlamaIndexTS

Playground:
https://llama-playground.vercel.app/

技术

优化方式

最优化大模型效果之 RAG(二):索引的优化策略:
https://juejin.cn/post/7387016941552664630

交流

中午跟东明讨论下叙事可视化当前遇到的问题,未来的方案,如何合作
树状索引+LLaMa Index + 外部 LLM
树状索引的好处:不建立树状索引,是在整个空间里面找,自然准确性很差
针对我们的问题:结构化数据
Java 转成 Python

资料