RAG 面试题大全与知识体系

RAG 是大模型应用开发岗面试必考的第一主题:简历上写了 RAG 项目,面试官会从分块、检索、重排一路追问到评估。这一页把本站全部 RAG 资产按知识体系组织好——先用 11 章实战教程把系统做出来,再按模块刷真题,每道题都有书面答案和口语版讲法。

共 245 道大厂真题,每道都有书面答案 + 口语版讲法 + 面试官追问。

先做项目,再刷题

RAG 基础与整体架构(62 题)

文档处理与分块(29 题)

长文档 Chunking 怎么选? — 医学法律领域 RAG 系统文本切分策略对比,5 种方法优缺点分析
文本块怎么转向量并建索引? — RAG 场景下嵌入模型选型与向量数据库索引机制(HNSW/IVF)详解
Chunking 策略怎么选? — RAG 系统中 4 种分块方法原理对比,对检索与生成的影响
RAG 向量索引构建流程怎么做?
RAG 数据处理与索引流程?
Chunk 向量化与索引怎么选?
Embedding+向量库怎么做语义匹配?
RAG 文本分块与向量索引怎么做?
RAG 向量索引怎么优化?
Chunking 策略怎么平衡上下文与精度?
RAG 长文档怎么切块?
RAG 数据清洗与 Chunking 怎么选?
Embedding 模型选型 vs 落地流程?
RAG 知识库搭建流程?
RAG 知识库构建流程怎么做?
专业文档怎么切块?
专业领域文档怎么切块?
专业领域文档怎么清洗?
RAG 文档 Chunk 划分策略怎么选?
RAG 文本分块策略怎么选?
RAG文本分块策略怎么设计？
RAG 文本分块怎么选?
分块策略怎么影响检索?
常用分块方法有哪些?
RAG 文档分段策略怎么优化?
RAG 向量化流程怎么做?
RAG 向量化怎么做?
RAG 文档怎么存储和向量化?
文本转向量完整流程怎么做?

向量检索与召回(49 题)

重排与检索优化(70 题)

知识图谱增强(35 题)

LLM 事实准确性怎么保证? — 金融场景下知识图谱+LLM 一致性方案,含具体实施策略
垂直领域 RAG 系统怎么搭? — 医疗/法律场景下知识图谱、检索策略与领域 Embedding 优化
GraphRAG 怎么实现? — 知识图谱构建、图检索与传统向量检索的差异与优势
知识图谱更新机制怎么设计?
GraphRAG原理 vs 传统RAG 怎么选?
GraphRAG 增量更新怎么保实时?
GraphRAG 最大技术挑战?
GraphRAG 怎么实现复杂查询?
GraphRAG vs 传统 RAG 优势在哪?
GraphRAG 架构怎么设计?
伪 vs 真多模态 RAG 怎么实现？
GraphRAG 技术难点有哪些?
GraphRAG 增量更新策略与挑战？
GraphRAG 知识图谱构建有哪些挑战?
GraphRAG 为何召回更精准?
GraphRAG 精准召回怎么实现?
GraphRAG适用场景 vs 传统RAG 有哪些?
RAG 系统痛点怎么破?
GraphRAG 如何保证时效性与一致性？
知识图谱动态更新怎么做?
知识图谱怎么动态更新?
不用图数据库能做 GraphRAG 吗?
GraphRAG 必须用图数据库吗?
GraphRAG创新点 vs 传统RAG 是什么?
RAG 技术原理和实现流程
GraphRAG 怎么提升检索质量?
GraphRAG 怎么提升检索效果?
知识图谱更新怎么保证实时性与一致性?
知识图谱实时性怎么保证?
GraphRAG 原理与实现方法
GraphRAG 工作原理是什么?
向量索引 vs 分层存储怎么选？
向量库 vs 知识库 vs 符号记忆？
数据/架构/推理/工具怎么选?
训练/推理/外部知识怎么选?

常见问题

RAG 面试一般会考哪些问题?

围绕你简历上的 RAG 项目逐层追问:为什么这样分块、召回率怎么测、混合检索和重排为什么要加、幻觉怎么归因。背概念挡不住追问,最好把一个完整 RAG 系统亲手做一遍。

没做过 RAG 项目,直接背面试题有用吗?

用处有限。面试官深挖两层就能分辨背题和真做过。建议先花 4~6 周跟完免费的 11 章 RAG 实战教程,再回来按模块刷题查漏,每道题用口语版练「讲出来」。

RAG 的 chunk 大小到底怎么选?

没有万能值:先按文档结构(标题/段落)切,再用 QA 评估集量化不同 chunk 大小的召回率,用数据说话。这是高频追问,教程第 3 章带你完整重现一次选型实验。

2026 年了,RAG 还值得学吗?会不会被长上下文取代?

值得。知识频繁更新、需要引用溯源、成本受限的场景仍以 RAG 为主流方案;面试考察重点已从「是什么」转向「怎么做好检索质量与评估」,门槛在变高而不是消失。

想有人带着把项目做深、简历改到能扛追问,看训练营;先自学完全够用,本页全部内容免费。