RAG 面试题大全与知识体系
RAG 是大模型应用开发岗面试必考的第一主题:简历上写了 RAG 项目,面试官会从分块、检索、重排一路追问到评估。这一页把本站全部 RAG 资产按知识体系组织好——先用 11 章实战教程把系统做出来,再按模块刷真题,每道题都有书面答案和口语版讲法。
共 245 道大厂真题,每道都有书面答案 + 口语版讲法 + 面试官追问。
先做项目,再刷题
RAG 基础与整体架构(62 题)
- 什么是 RAG?一句话讲清检索增强生成 — 用开卷考试的思路,补上大模型的知识短板
- RAG 和微调怎么选? — 从时效性、成本、幻觉三个角度给出判断口诀
- RAG 完整流程分几步? — 解析、分块、向量化、检索、生成,五步讲透全链路
- 大模型幻觉是什么?怎么缓解?
- 增量式向量索引怎么更新?
- 对话模型准确性怎么提?
- RAG 核心架构与工作流程
- 分布漂移下外接数据库怎么增强模型?
- RAG vs 传统检索生成怎么选?
- 领域RAG系统怎么搭?
- RAG 怎么提升生成准确性?
- RAG 怎么提升生成质量?
- RAG 检索模块怎么提升相关性?
- 多目标优化权重怎么定?
- 地图避障方法有哪些局限?
- RAG 索引优化怎么做?
- LangChain vs LlamaIndex 架构差异?
- RAG 查不到文档怎么降级?
- 高精度 RAG 系统怎么设计?
- 医疗法律RAG架构怎么搭?
- RAG 检索增强技术有哪些?
- 专业领域 RAG 索引流程怎么设计?
- RAG 怎么提升事实准确性?
- LangChain vs LlamaIndex 场景怎么选?
- CTR/CVR/ROI 冲突怎么协调?
- RAG 检索噪声怎么处理?
- 豆包等产品多轮一致性挑战与方案?
- 新用户冷启动怎么做?
- RAG 知识库怎么增量更新?
- 搜索排序权重怎么动态调?
- 查询文档相关性怎么算?
- LLM怎么融入推荐系统?意图理解与生成
- 外挂数据库怎么提升大模型准确性?
- 多信号评分函数怎么设计?
- 推荐不精准怎么算法改进?
- 搜索评分函数怎么设计?
- RAG 模型分类有哪些?
- 现代 RAG 架构怎么变?
- 时间窗口对话系统怎么设计?
- RAG 二次生成怎么提升安全性?
- 偏好数据如何收集与建模?
- 生成式推荐 vs 判别式推荐?
- 生成式推荐系统未来怎么发展?
- 生成式推荐 vs 判别式推荐怎么选?
- 用户兴趣模型怎么设计?
- ROI 问题怎么影响推荐效果?
- Query 改写有哪些创新方法?
- 动态增量更新怎么防检索偏差?
- 时效性特征怎么设计?
- 内容热门度怎么量化?
- 推荐不精准怎么诊断?
- 时间窗口对话管理怎么实现?
- 逻辑引导怎么用?
- 人工干预怎么控制 LLM 生成?
- 排序模型初始权重怎么设?
- 大模型输出怎么检测和过滤?
- RAG 技术原理与核心组件详解
- 上下文错误时怎么保证输出准确?
- RAG 项目实战怎么讲?
- RAG 检索准但回答差怎么调?
- LLM 输出怎么限定标签范围?
- Deep Research vs RAG 怎么选?
文档处理与分块(29 题)
- 长文档 Chunking 怎么选? — 医学法律领域 RAG 系统文本切分策略对比,5 种方法优缺点分析
- 文本块怎么转向量并建索引? — RAG 场景下嵌入模型选型与向量数据库索引机制(HNSW/IVF)详解
- Chunking 策略怎么选? — RAG 系统中 4 种分块方法原理对比,对检索与生成的影响
- RAG 向量索引构建流程怎么做?
- RAG 数据处理与索引流程?
- Chunk 向量化与索引怎么选?
- Embedding+向量库怎么做语义匹配?
- RAG 文本分块与向量索引怎么做?
- RAG 向量索引怎么优化?
- Chunking 策略怎么平衡上下文与精度?
- RAG 长文档怎么切块?
- RAG 数据清洗与 Chunking 怎么选?
- Embedding 模型选型 vs 落地流程?
- RAG 知识库搭建流程?
- RAG 知识库构建流程怎么做?
- 专业文档怎么切块?
- 专业领域文档怎么切块?
- 专业领域文档怎么清洗?
- RAG 文档 Chunk 划分策略怎么选?
- RAG 文本分块策略怎么选?
- RAG文本分块策略怎么设计?
- RAG 文本分块怎么选?
- 分块策略怎么影响检索?
- 常用分块方法有哪些?
- RAG 文档分段策略怎么优化?
- RAG 向量化流程怎么做?
- RAG 向量化怎么做?
- RAG 文档怎么存储和向量化?
- 文本转向量完整流程怎么做?
向量检索与召回(49 题)
- 什么是 Embedding 向量嵌入? — 给文字发语义坐标,让机器学会算“意思像不像”
- 向量数据库和普通数据库有什么区别? — 从精确匹配到相似检索,一文看懂 ANN 为什么快
- 混合检索怎么提升 RAG 召回? — Sparse(BM25) vs Dense(向量检索)原理与相似度度量差异
- RAG Retriever 工作机制详解
- Embedding 怎么实现语义召回?
- BM25 原理与 TF-IDF 改进点
- 混合检索为什么优于单一检索?
- BM25 vs 向量检索 vs 混合检索怎么选?
- 召回 vs 粗排怎么分工?
- 召回阶段怎么选方法?
- BM25公式参数含义与TF-IDF对比
- RAG召回效率与相关性怎么提升?
- RAG检索器与索引结构怎么选?
- 召回模型怎么搭建?
- 稀疏 vs 稠密检索怎么选?
- 混合检索为什么用 Sparse+Dense?
- 多路召回 vs 排序模型怎么分工?
- RAG 工作流怎么应对时效衰减?
- RAG 向量库怎么处理时间衰减?
- Embedding 升级后向量不一致怎么解决?
- LLM怎么融入推荐系统?特征提取与召回
- LLM怎么融入推荐系统?序列建模与排序
- 向量数据库选型关键因素有哪些?
- RAG 向量检索怎么高效召回?
- BM25 原理与公式怎么理解?
- Embedding + 向量数据库怎么搭?
- BM25 原理与公式详解
- 稠密vs稀疏检索怎么选?
- 推荐不精准怎么从算法改进?
- Embedding 模型结构怎么选?
- Hard Search vs Soft Search 怎么选?
- BM25原理、应用场景及与TF-IDF区别
- Embedding 相似性检索怎么实现?
- 检索失败时 RAG 怎么兜底?
- Embedding 模型架构怎么选?
- 向量召回实现方式有哪些?
- 向量召回原理与实现?
- 检索模块性能怎么优化?
- 向量检索 4 种范式怎么选?
- 检索质量差怎么优化?
- RAG 技术实现怎么落地?
- RAG 文本分段怎么优化?
- ANN 索引怎么构建?
- RAG 知识库怎么存?
- RAG 向量匹配怎么实现?
- RAG 向量匹配怎么高效实现?
- RAG 知识库存储怎么选?
- Embedding 相似性检索怎么工作?
- 向量检索基本原理是什么?
重排与检索优化(70 题)
- 专业领域 RAG 架构怎么设计? — 医疗/法律场景下数据预处理、检索器与生成器优化方案
- RAG 检索质量怎么提升? — 查询扩展、重排序、混合检索等 5 种方法原理与适用场景详解
- RAG Retriever 工作流程怎么设计? — 从查询预处理到向量检索、排序筛选,各环节技术要点与性能影响
- 专业领域 RAG 链路怎么优化?
- 向量数据库怎么支撑 Agent 记忆?
- RAG 系统瓶颈怎么优化?
- RAG 检索偏差怎么系统性解决?
- RAG 为什么需要 Re-ranking?
- RAG 原理与架构怎么拆解?
- RAG检索阶段怎么实现?
- RAG 检索不准怎么优化?
- RAG 系统迭代优化方向有哪些?
- 精排精度高,为何不跳过召回粗排?
- 直接精排所有候选,为何不可行?
- RAG 流程各阶段怎么拆?
- RAG 完整工作流程怎么跑?
- RAG 检索优化:重排序怎么用?
- RAG 为何还要重排?
- 记忆型Agent为何用向量数据库?
- RAG 重排序怎么选?
- RAG 中 Re-ranking 怎么用?
- 召回和粗排为什么不能跳过?
- RAG 为什么需要重排?
- RAG 系统怎么持续迭代?
- RAG 为什么需要重排模块?
- Naive RAG vs Advanced RAG 区别?
- RAG 流程各环节怎么优化?
- RAG 完整流程怎么实现?
- RAG 延迟与正确率挑战怎么破?
- RAG 流程优化怎么做?
- RAG 为什么需要 Rerank?
- 两阶段检索 vs 直接重排?
- RAG 延迟和准确率挑战怎么破?
- RAG 查询改写怎么设计?
- RAG增强与生成如何衔接?
- RAG 工作原理与核心组件
- RAG 技术实现流程怎么走?
- RAG 工作流程与关键技术组件
- RAG 文档处理与检索策略怎么搭?
- RAG 组件功能与数据流向?
- RAG检索方法选型原因?
- RAG 核心实现原理是什么?
- 检索方法怎么选?
- 专业领域RAG数据与检索优化?
- RAG检索方法如何优化?
- RAG 系统架构怎么设计?
- RAG 完整流程怎么优化?
- RAG 怎么解决大模型幻觉?
- RAG 系统架构怎么实现?
- RAG 局限性怎么破?
- RAG 系统怎么实现?
- 领域 RAG 系统架构怎么设计?
- RAG 架构怎么设计?
- RAG 检索器与知识库怎么搭?
- RAG 核心模块与数据流怎么设计?
- RAG 架构怎么搭?
- RAG 系统核心组件怎么搭?
- BM25+向量+Cross-Encoder 怎么组合?
- RAG 检索阶段怎么优化?
- Context vs Prompt Engineering 区别?
- RAG 检索器与生成器如何协同?
- RAG 系统有哪些常见陷阱?
- 推荐结果多样性怎么控制?
- RAG 系统实现流程怎么搭?
- 向量数据库构建流程怎么做?
- 两阶段 vs 端到端怎么选?
- RAG 召回相关性与准确性怎么提升?
- RAG 为何需要重排序?
- 向量数据库 vs 传统数据库怎么选?
- RAG 工作流程怎么实现?
知识图谱增强(35 题)
- LLM 事实准确性怎么保证? — 金融场景下知识图谱+LLM 一致性方案,含具体实施策略
- 垂直领域 RAG 系统怎么搭? — 医疗/法律场景下知识图谱、检索策略与领域 Embedding 优化
- GraphRAG 怎么实现? — 知识图谱构建、图检索与传统向量检索的差异与优势
- 知识图谱更新机制怎么设计?
- GraphRAG原理 vs 传统RAG 怎么选?
- GraphRAG 增量更新怎么保实时?
- GraphRAG 最大技术挑战?
- GraphRAG 怎么实现复杂查询?
- GraphRAG vs 传统 RAG 优势在哪?
- GraphRAG 架构怎么设计?
- 伪 vs 真多模态 RAG 怎么实现?
- GraphRAG 技术难点有哪些?
- GraphRAG 增量更新策略与挑战?
- GraphRAG 知识图谱构建有哪些挑战?
- GraphRAG 为何召回更精准?
- GraphRAG 精准召回怎么实现?
- GraphRAG适用场景 vs 传统RAG 有哪些?
- RAG 系统痛点怎么破?
- GraphRAG 如何保证时效性与一致性?
- 知识图谱动态更新怎么做?
- 知识图谱怎么动态更新?
- 不用图数据库能做 GraphRAG 吗?
- GraphRAG 必须用图数据库吗?
- GraphRAG创新点 vs 传统RAG 是什么?
- RAG 技术原理和实现流程
- GraphRAG 怎么提升检索质量?
- GraphRAG 怎么提升检索效果?
- 知识图谱更新怎么保证实时性与一致性?
- 知识图谱实时性怎么保证?
- GraphRAG 原理与实现方法
- GraphRAG 工作原理是什么?
- 向量索引 vs 分层存储怎么选?
- 向量库 vs 知识库 vs 符号记忆?
- 数据/架构/推理/工具怎么选?
- 训练/推理/外部知识怎么选?
常见问题
RAG 面试一般会考哪些问题?
围绕你简历上的 RAG 项目逐层追问:为什么这样分块、召回率怎么测、混合检索和重排为什么要加、幻觉怎么归因。背概念挡不住追问,最好把一个完整 RAG 系统亲手做一遍。
没做过 RAG 项目,直接背面试题有用吗?
用处有限。面试官深挖两层就能分辨背题和真做过。建议先花 4~6 周跟完免费的 11 章 RAG 实战教程,再回来按模块刷题查漏,每道题用口语版练「讲出来」。
RAG 的 chunk 大小到底怎么选?
没有万能值:先按文档结构(标题/段落)切,再用 QA 评估集量化不同 chunk 大小的召回率,用数据说话。这是高频追问,教程第 3 章带你完整重现一次选型实验。
2026 年了,RAG 还值得学吗?会不会被长上下文取代?
值得。知识频繁更新、需要引用溯源、成本受限的场景仍以 RAG 为主流方案;面试考察重点已从「是什么」转向「怎么做好检索质量与评估」,门槛在变高而不是消失。
想有人带着把项目做深、简历改到能扛追问,看 训练营;先自学完全够用,本页全部内容免费。