第4讲:RAG 检索增强生成
从检索到生成到评估,完整构建北大研究生手册问答系统——理解参数化知识与非参数化检索的取舍
学习目标
完成本讲学习后,你将能够:
- 解释 RAG 的动机——参数化知识 vs. 非参数化检索,能够在 RAG、长上下文与微调三条路径中做出合理取舍
- 掌握 检索侧的基础方法:BM25、Dense Retrieval(DPR / BGE / E5)、混合检索(RRF)、查询变换与 Reranker
- 掌握 索引与分块的工程决策:Fixed-size / Recursive / Semantic / Parent-Child chunking 与 Embedding 选型
- 判断 生成侧的设计取舍:Query 改写、多跳检索、上下文压缩、幻觉抑制
- 评估 RAG 系统:用 RAGAS 计算 Faithfulness / Answer Relevance / Context Recall / Context Precision
- 独立交付 一个可用的北大研究生手册 QA 系统(本讲重点实验)
学时分配
| 环节 | 时长 | 内容 |
|---|---|---|
| 讲授 | ~100 分钟 | 检索 / 索引 / 生成策略 / 评估 / 高级变体 |
| 上机实验 | ~80 分钟 | 端到端搭建 PKU 研究生手册 QA |
本讲整体路线
本讲沿着一条清晰的技术主线推进:先拆解 RAG 的三大环节(检索、索引、生成),然后横向展开评估与高级变体,最后在真实场景中合拢为一个完整系统。
具体而言,我们先在 retrieval-basics 中确立"查得准"的标准——从 BM25 的精确匹配到稠密检索的语义泛化,再到两者互补的混合检索;接着在 indexing-chunking 中回答"把文档切成什么形状、存在哪里"——切分策略与嵌入模型的选择直接决定了召回上限;generation-strategies 讨论把检索结果交给 LLM 后的工程取舍;evaluation 则把前三者串成一个可量化诊断的闭环;advanced-variants 介绍 Self-RAG / CRAG / GraphRAG 等最新设计,并以 TM-RAG 作为一个特别的扩展案例;最后,lab-pku-handbook 是本讲的重点产出——你将端到端搭建一个可用的北大研究生手册问答系统。
本讲内容
4.1 检索基础:稀疏、稠密与混合
BM25、DPR / Sentence-BERT / BGE、Hybrid Search with RRF、HyDE 与 Query 改写
4.2 索引与分块
固定/滑窗/语义切分、父子文档索引、多索引策略、嵌入模型选型
4.3 生成策略
朴素/高级/模块化 RAG、Query 改写、上下文压缩、幻觉抑制
4.4 评估方法
RAGAS 四大指标、离线与在线评估、常见故障模式与定位
4.5 高级变体
Self-RAG / CRAG / FLARE / Adaptive-RAG / GraphRAG,案例:TM-RAG
上机实验:PKU 研究生手册 QA
端到端构建北大研究生手册问答系统:解析、索引、检索、生成、评估
参考文献
Foundation / Advanced / Evaluation / Tools 分类参考文献与课程材料
参考材料
- 课程内部材料:
RAG课程材料_检索增强生成从原理到实践.md(主线讲义) - 课程内部材料:
TM-RAG实验设计_翻译记忆增强的大语言模型翻译.md(作为高级变体案例) - 综述:Retrieval-Augmented Generation for Large Language Models: A Survey(Gao et al., 2024)
关键词
RAG · BM25 · Dense Retrieval · Hybrid Search · RRF · Reranker · Chunking · RAGAS · Self-RAG · CRAG · GraphRAG · FAISS · LangChain