项目里想让大模型掌握公司的业务知识，你会选择 RAG 还是微调？请从知识时效性、成本、幻觉三个角度说说你的判断依据。

Question

吴师兄 · Accepted Answer

答案要点 微调是“改模型本身”：用领域数据继续训练模型，把知识和行为方式写进参数里 RAG 是“外挂资料库”：模型不动，回答前先检索资料喂给它 知识时效性：知识经常变 → 选 RAG，改知识库即时生效；微调的知识固化在参数里，更新就得重训 成本：RAG 主要是工程成本；微调需要标注数据 + GPU 训练，且每次知识更新都要再花一遍 幻觉：RAG 答案有原文可溯源，更可控；微调过的知识模型照样可能记岔、编造 核心概念 RAG 与微调（Fine-tuning）是给大模型补充领域能力的两条路线：RAG 在回答时从外部知识库检索资料喂给模型，模型参数不变；微调则是用领域数据继续训练模型，把知识和说话方式直接写进模型参数。前者像给员工发一本随时更新的操作手册，后者像送员工去脱产培训。 三个角度对比 | 角度 | RAG | 微调 | |---|---|---| | 知识时效性 | 改知识库立即生效，适合频繁更新的知识（价格、政策、文档） | 知识固化在参数里，更新一次就要重新训练一次 | | 成本 | 无需训练，主要是建知识库和调检索的工程成本 | 需要准备标注数据 + GPU 算力，门槛和单次成本都高 | | 幻觉 | 答案有检索原文支撑，可标注出处、可核对 | 学过的知识仍可能记岔编造，且很难定位错误来源 | 一个简单的判断口诀 要补的是知识（事实、文档、制度、产品信息）→ 优先 RAG 要教的是能力和风格（固定输出格式、行业话术、特定任务套路）→ 考虑微调 实际项目里两者并不对立，常见打法是组合拳：RAG 管知识来源，微调管表达方式和任务能力 对入门者的建议是：九成的“让模型懂业务”需求，先用 RAG 验证效果，不够再考虑微调。入门之后，可以深入了解 LoRA 等低成本微调方法，以及 RAG 与微调结合落地的真实案例。

项目里想让大模型掌握公司的业务知识，你会选择 RAG 还是微调？请从知识时效性、成本、幻觉三个角度说说你的判断依据。

口语版讲法(约2分钟)

面试官可能的追问

同模块相关题目