一文看懂什么是 RAG

金虎、赵钧

本节目标

  • 理解 RAG 的概念
  • 理解 RAG 系统的技术原理
  • 了解 向量化(Embeding)的概念
  • 了解基于 RAG 的工具
  • 了解 RAG 的局限性

案例

“我有很多医院管理制度、条款、规范、指南等等文件,我该如何实现通过问答的形式来检索这些文件的内容?”


❌ 大模型(LLM)收到问题后,到知识库中浏览一遍所有知识,筛选出与问题相关的内容,并整理、回答。

  • 大模型本身没有访问并浏览知识库的能力,需要通过工程化的手段把文档通过上下文传递给大模型
  • 大模型有上下文长度限制,容纳的文档长度有限
  • 即便假设大模型有充足的上下文空间,足以容纳知识库的所有文档,那么分析所有文档时间成本和算力成本也太高了
加载中...