课程全景图

九讲之间的逻辑

讲次	可交付的能力	主要工具
1	用 Transformers pipeline 解决分类 / NER / 翻译	Hugging Face
2	解释并可视化 Attention	nanoGPT / minGPT
3	写可优化的 prompt pipeline	DSPy / TextGrad
4	端到端 RAG 系统	LangChain / LlamaIndex / FAISS
5	构建小规模 SFT 数据集	自写脚本 + 合成工具
6	LoRA 微调领域模型	TRL / LLaMA-Factory
7	带工具 + 记忆的 Agent	LangGraph / smolagents
8	为任务族搭建 Judge 基线	Prometheus / 自定义 rubric
9	设计并跑 GEO 实验	可观测的生成式搜索入口

两门课程技术栈统一，本课程第 6 讲的 RLHF/DPO/GRPO 部分直接跳转至后训练课程对应章节。