一文看懂什么是 RAG
金虎、赵钧
本节目标
- 理解 RAG 的概念
- 理解 RAG 系统的技术原理
- 了解 向量化(Embeding)的概念
- 了解基于 RAG 的工具
- 了解 RAG 的局限性
案例
“我有很多医院管理制度、条款、规范、指南等等文件,我该如何实现通过问答的形式来检索这些文件的内容?”
❌ 大模型(LLM)收到问题后,到知识库中浏览一遍所有知识,筛选出与问题相关的内容,并整理、回答。
- 大模型本身没有访问并浏览知识库的能力,需要通过工程化的手段把文档通过上下文传递给大模型
- 大模型有上下文长度限制,容纳的文档长度有限
- 即便假设大模型有充足的上下文空间,足以容纳知识库的所有文档,那么分析所有文档时间成本和算力成本也太高了
加载中...
暂无思维导图
加载中...