人工智能实践(语言智能)
第4讲:RAG

参考文献

第 4 讲 RAG 的核心论文分类索引——Foundation / Advanced / Evaluation / Tools,外加课程内部材料

奠基性论文(Foundation)

理解 RAG 的起源和基本范式,必读前三篇。


检索技术(Retrieval)


高级 RAG 技术(Advanced Variants)

第 4.5 节讨论的各个变体原文。


评估与基准(Evaluation)


智能体 RAG 与编程框架(Agentic / Frameworks)


综述与扩展(Surveys)


工具与学习资源(Tools & Tutorials)

框架与库

工具用途入门文档
LangChain最流行的 RAG 编排框架python.langchain.com
LlamaIndex面向 RAG 优化的框架docs.llamaindex.ai
DSPy声明式 LLM 编程dspy.ai
RAGASRAG 评估docs.ragas.io
Dify低代码 RAG 工作流docs.dify.ai

向量数据库

数据库特点推荐场景
FAISS研究首选、单机高性能原型开发、课堂教学
Chroma零配置、易持久化本地项目、小规模
Milvus / Qdrant分布式、生产级生产部署、大规模
Weaviate图 + 向量混合结构化知识

课程内部材料

本讲内容主要基于以下两份内部材料,建议对照阅读:

  • source-materials/RAG课程材料_检索增强生成从原理到实践.md(主线讲义,45K 字)
  • source-materials/TM-RAG实验设计_翻译记忆增强的大语言模型翻译.md(高级变体案例,43K 字)

姊妹课程链接

本讲内容与其他讲次的连接:

  • 第 3 讲(提示词):RAG 的 Prompt 模板设计、query 改写技术直接延续第 3 讲的方法论
  • 第 6 讲(微调):RAFT 等"RAG + 微调"联合方法,以及如何微调自己的 Embedding 模型
  • 第 7 讲(Agent):Agentic RAG 把检索作为工具调用,是 Agent 课程的重要接入点
  • 第 8 讲(LLM as Judge):RAGAS 的核心机制就是 LLM-as-Judge 的典型应用

本参考文献列表会随课程演进持续更新。遇到新的关键 paper 可以在 GitHub 仓库提 PR 补充。