课程资源
课程全景图
九讲知识图谱与内在联系
九讲之间的逻辑
能力矩阵
| 讲次 | 可交付的能力 | 主要工具 |
|---|---|---|
| 1 | 用 Transformers pipeline 解决分类 / NER / 翻译 | Hugging Face |
| 2 | 解释并可视化 Attention | nanoGPT / minGPT |
| 3 | 写可优化的 prompt pipeline | DSPy / TextGrad |
| 4 | 端到端 RAG 系统 | LangChain / LlamaIndex / FAISS |
| 5 | 构建小规模 SFT 数据集 | 自写脚本 + 合成工具 |
| 6 | LoRA 微调领域模型 | TRL / LLaMA-Factory |
| 7 | 带工具 + 记忆的 Agent | LangGraph / smolagents |
| 8 | 为任务族搭建 Judge 基线 | Prometheus / 自定义 rubric |
| 9 | 设计并跑 GEO 实验 | 可观测的生成式搜索入口 |
与姊妹课程的连结
| 本课程(语言智能实践) | 姊妹课程(大语言模型后训练) | |
|---|---|---|
| 侧重 | 接口化使用 + 工程落地 | 对齐与推理强化的深度训练 |
| 深度 | 覆盖完整技术链条,每一环做到 MVP | 聚焦 SFT/DPO/GRPO 等训练算法 |
| 适用 | 应用型研究生、技术选型 | 研究型研究生、训练底层 |
| 实验 | 9 次轻量 lab | 5 次完整训练 + 期末项目 |
两门课程技术栈统一,本课程第 6 讲的 RLHF/DPO/GRPO 部分直接跳转至后训练课程对应章节。