人工智能实践（语言智能）

第4讲：RAG

参考文献

第 4 讲 RAG 的核心论文分类索引——Foundation / Advanced / Evaluation / Tools，外加课程内部材料

奠基性论文（Foundation）

理解 RAG 的起源和基本范式，必读前三篇。

RAG (Lewis et al., 2020)

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. NeurIPS 2020. 正式提出 RAG 范式，定义 RAG-Sequence 和 RAG-Token。

REALM (Guu et al., 2020)

REALM: Retrieval-Augmented Language Model Pre-Training. ICML 2020. 首次把检索器与预训练联合训练。

DPR (Karpukhin et al., 2020)

Dense Passage Retrieval for Open-Domain Question Answering. EMNLP 2020. 稠密段落检索成为标准基线。

FiD (Izacard & Grave, 2021)

Fusion-in-Decoder。检索 100+ 文档仍可扩展，奠定大规模 RAG 可行性。

RETRO (Borgeaud et al., 2022)

2 万亿 token 数据库，用 1/25 的参数匹配 GPT-3。

检索技术（Retrieval）

Contriever (Izacard et al., 2022)

无监督对比学习的稠密检索，零样本迁移能力强。

ColBERT (Khattab & Zaharia, 2020)

晚交互范式，token 级 late interaction，精度与效率的折中。

BGE / C-Pack (Xiao et al., 2023)

BAAI 开源的中英文嵌入模型，MTEB 榜首常客。

BGE-M3 (Chen et al., 2024)

统一稠密/多向量/稀疏检索，支持 100+ 语言、8K 上下文。

HyDE (Gao et al., 2023)

Precise Zero-Shot Dense Retrieval without Relevance Labels. 假设性文档嵌入。

高级 RAG 技术（Advanced Variants）

第 4.5 节讨论的各个变体原文。

Self-RAG (Asai et al., 2024)

Learning to Retrieve, Generate, and Critique through Self-Reflection. ICLR 2024. 反思型 RAG 代表作。

CRAG (Yan et al., 2024)

Corrective Retrieval Augmented Generation. 轻量级评估器 + 网络搜索兜底。

FLARE (Jiang et al., 2023)

Active Retrieval Augmented Generation. EMNLP 2023. 生成过程中基于置信度触发检索。

Adaptive-RAG (Jeong et al., 2024)

Learning to Adapt Retrieval-Augmented LLMs through Question Complexity. NAACL 2024.

GraphRAG (Edge et al., 2024)

From Local to Global: A Graph RAG Approach to Query-Focused Summarization.

RAPTOR (Sarthi et al., 2024)

Recursive Abstractive Processing for Tree-Organized Retrieval. ICLR 2024.

Chain-of-Note (Yu et al., 2023)

增强 RAG 对噪声和无关检索的鲁棒性。

评估与基准（Evaluation）

RAGAS (Es et al., 2024)

Automated Evaluation of Retrieval Augmented Generation. 本讲评估的核心框架。

ARES (Saad-Falcon et al., 2024)

Automated Evaluation Framework for RAG Systems. NAACL 2024.

Lost in the Middle (Liu et al., 2024)

How Language Models Use Long Contexts. TACL 2024. 长上下文中间位置信息被忽略。

RGB (Chen et al., 2024)

Benchmarking Large Language Models in RAG. AAAI 2024. 中文 RAG 基准。

智能体 RAG 与编程框架（Agentic / Frameworks）

Agentic RAG Survey (Singh et al., 2025)

智能体驱动 RAG 的综述，串联第 4 讲和第 7 讲（Agent）。

DSPy (Khattab et al., 2024)

Compiling Declarative Language Model Calls into Self-Improving Pipelines. ICLR 2024. 声明式 RAG 编程范式。

ReAct (Yao et al., 2023)

Synergizing Reasoning and Acting in LLMs. ICLR 2023. 检索作为工具调用的思想源头。

综述与扩展（Surveys）

RAG Survey (Gao et al., 2024)

Retrieval-Augmented Generation for Large Language Models: A Survey. 必读综述，涵盖朴素/高级/模块化 RAG 的完整体系。

RAG Meeting LLMs (Fan et al., 2024)

A Survey on RAG Meeting LLMs. KDD 2024.

ColPali (Faysse et al., 2025)

Efficient Document Retrieval with Vision Language Models. ICLR 2025. 视觉语言模型直接检索文档图像。

工具与学习资源（Tools & Tutorials）

框架与库

工具	用途	入门文档
LangChain	最流行的 RAG 编排框架	python.langchain.com
LlamaIndex	面向 RAG 优化的框架	docs.llamaindex.ai
DSPy	声明式 LLM 编程	dspy.ai
RAGAS	RAG 评估	docs.ragas.io
Dify	低代码 RAG 工作流	docs.dify.ai

向量数据库

数据库	特点	推荐场景
FAISS	研究首选、单机高性能	原型开发、课堂教学
Chroma	零配置、易持久化	本地项目、小规模
Milvus / Qdrant	分布式、生产级	生产部署、大规模
Weaviate	图 + 向量混合	结构化知识

课程内部材料

本讲内容主要基于以下两份内部材料，建议对照阅读：

source-materials/RAG课程材料_检索增强生成从原理到实践.md（主线讲义，45K 字）
source-materials/TM-RAG实验设计_翻译记忆增强的大语言模型翻译.md（高级变体案例，43K 字）

姊妹课程链接

本讲内容与其他讲次的连接：

第 3 讲（提示词）：RAG 的 Prompt 模板设计、query 改写技术直接延续第 3 讲的方法论
第 6 讲（微调）：RAFT 等"RAG + 微调"联合方法，以及如何微调自己的 Embedding 模型
第 7 讲（Agent）：Agentic RAG 把检索作为工具调用，是 Agent 课程的重要接入点
第 8 讲（LLM as Judge）：RAGAS 的核心机制就是 LLM-as-Judge 的典型应用

本参考文献列表会随课程演进持续更新。遇到新的关键 paper 可以在 GitHub 仓库提 PR 补充。

上机实验：PKU 研究生手册 QA 系统

端到端构建北大研究生手册问答系统——从 PDF 解析、索引构建、混合检索到 LLM 生成与 RAGAS 评估

第5讲：数据工程

为大模型准备数据——从常见数据来源到 SFT 格式规范、通用合成方法、低资源专题与质量过滤

On this page

奠基性论文（Foundation）检索技术（Retrieval）高级 RAG 技术（Advanced Variants）评估与基准（Evaluation）智能体 RAG 与编程框架（Agentic / Frameworks）综述与扩展（Surveys）工具与学习资源（Tools & Tutorials）框架与库向量数据库课程内部材料姊妹课程链接