请用自己的话解释一下什么是 RAG（检索增强生成）？大模型本身已经很强了，为什么还需要给它外挂 RAG？

Question

吴师兄 · Accepted Answer

答案要点 RAG（检索增强生成）= 检索 + 生成：先从外部知识库里找到相关资料，再让大模型参考这些资料来回答问题 大模型的知识“冻结”在训练完成那一刻，之后发生的新事情、企业内部的私有资料它都不知道 遇到不知道的问题，模型倾向于一本正经地编造，这叫“幻觉”（Hallucination，指模型生成看似合理但不符合事实的内容） RAG 用“开卷考试”的方式补知识：不改模型本身，只在回答前把资料塞进上下文 三大好处：知识可以随时更新、答案可以溯源、成本远低于重新训练模型 核心概念 RAG（Retrieval-Augmented Generation，检索增强生成）是一种让大模型在回答问题之前，先从外部知识库中检索相关资料，再基于这些资料生成答案的技术方案。它把模型“背在脑子里的知识”（训练时学到的参数）和“随时可查的资料库”（外部文档）结合了起来。 打个比方：纯大模型答题像闭卷考试，全靠训练时背下来的内容；RAG 则是开卷考试，答题前先翻书找到相关章节，再组织语言作答。 为什么大模型需要 RAG | 大模型的短板 | RAG 怎么补 | |---|---| | 知识有截止日期，训练之后的新信息一概不知 | 知识库随时更新，不用重新训练模型 | | 没见过企业内部文档、私有数据 | 把私有资料放进知识库即可注入 | | 不知道时爱编造（幻觉） | 答案有检索到的原文支撑，可标注来源供核对 | | 重新训练一次成本极高 | 只需维护知识库，工程成本低得多 | 一句话总结：RAG 不是让模型变得更聪明，而是让它“答题前能查资料”。用户提问时，系统先检索出最相关的几段内容，连同问题一起交给模型，模型“看着资料回答”，答案自然更准、更新、更可信。 入门之后，建议往两个方向继续深入：一是 RAG 的完整链路（文档解析、分块、向量化、检索、重排），二是 RAG 与微调这两条技术路线该怎么选。

请用自己的话解释一下什么是 RAG（检索增强生成）？大模型本身已经很强了，为什么还需要给它外挂 RAG？

口语版讲法(约2分钟)

面试官可能的追问

同模块相关题目