第4讲：RAG 检索增强生成

从检索到生成到评估，完整构建北大研究生手册问答系统——理解参数化知识与非参数化检索的取舍

学习目标

完成本讲学习后，你将能够：

解释 RAG 的动机——参数化知识 vs. 非参数化检索，能够在 RAG、长上下文与微调三条路径中做出合理取舍
掌握检索侧的基础方法：BM25、Dense Retrieval（DPR / BGE / E5）、混合检索（RRF）、查询变换与 Reranker
掌握索引与分块的工程决策：Fixed-size / Recursive / Semantic / Parent-Child chunking 与 Embedding 选型
判断生成侧的设计取舍：Query 改写、多跳检索、上下文压缩、幻觉抑制
评估 RAG 系统：用 RAGAS 计算 Faithfulness / Answer Relevance / Context Recall / Context Precision
独立交付 一个可用的北大研究生手册 QA 系统（本讲重点实验）

学时分配

环节	时长	内容
讲授	~100 分钟	检索 / 索引 / 生成策略 / 评估 / 高级变体
上机实验	~80 分钟	端到端搭建 PKU 研究生手册 QA

本讲整体路线

本讲沿着一条清晰的技术主线推进：先拆解 RAG 的三大环节（检索、索引、生成），然后横向展开评估与高级变体，最后在真实场景中合拢为一个完整系统。

具体而言，我们先在 retrieval-basics 中确立"查得准"的标准——从 BM25 的精确匹配到稠密检索的语义泛化，再到两者互补的混合检索；接着在 indexing-chunking 中回答"把文档切成什么形状、存在哪里"——切分策略与嵌入模型的选择直接决定了召回上限；generation-strategies 讨论把检索结果交给 LLM 后的工程取舍；evaluation 则把前三者串成一个可量化诊断的闭环；advanced-variants 介绍 Self-RAG / CRAG / GraphRAG 等最新设计，并以 TM-RAG 作为一个特别的扩展案例；最后，lab-pku-handbook 是本讲的重点产出——你将端到端搭建一个可用的北大研究生手册问答系统。

课程内部材料：RAG课程材料_检索增强生成从原理到实践.md（主线讲义）
课程内部材料：TM-RAG实验设计_翻译记忆增强的大语言模型翻译.md（作为高级变体案例）
综述：Retrieval-Augmented Generation for Large Language Models: A Survey（Gao et al., 2024）

关键词

RAG · BM25 · Dense Retrieval · Hybrid Search · RRF · Reranker · Chunking · RAGAS · Self-RAG · CRAG · GraphRAG · FAISS · LangChain

学习目标

学时分配

本讲整体路线

本讲内容

4.1 检索基础：稀疏、稠密与混合

4.2 索引与分块

4.3 生成策略

4.4 评估方法

4.5 高级变体

上机实验：PKU 研究生手册 QA

参考文献

参考材料

关键词

On this page