课程总览

人工智能实践（语言智能）——北京大学软件与微电子学院研究生课程

课程简介

"语言智能"曾经是自然语言处理的代名词，如今已被大模型重塑为一个端到端可工程化的学科。本课程面向研究生，系统讲授从经典 NLP 到现代大模型应用的核心技术链条，强调原理与动手实践的统一：

经典 NLP 与 Transformer：建立从词向量、序列标注、机器翻译到注意力机制的技术肌肉
提示词与 RAG：把 LLM 作为接口使用——从 Zero-shot 到 CoT/ToT/DSPy/TextGrad 的前沿方法，以及检索增强生成的完整工程链路
数据工程与微调：为大模型准备数据、做 LoRA/QLoRA 微调、评估与诊断
Agent 与 Judge：构建带工具和记忆的自主体，用 LLM 作为评估器
GEO：面向生成式搜索的内容优化新学科

课程信息


课程名称	人工智能实践（语言智能）
开课单位	北京大学软件与微电子学院
面向对象	研究生
授课教师	高志军
讲次	9 讲
授课形式	讲授 + 上机实验
授课语言	中文

课程设计理念

一条主线贯穿九讲。课程按"基础 → 接口化使用 → 工程化改造 → 自主化运行 → 评估与传播"的顺序推进，保证每一讲都能衔接上一讲的产出与下一讲的前置知识。

原理与实践 1:1。每一讲都配一个可独立完成的实验，输出可运行代码和可验证结果。重要实验包括：北大研究生手册的 RAG 问答系统（第 4 讲）、SFT 数据集构建（第 5 讲）、LoRA 微调（第 6 讲）、带工具的 Agent（第 7 讲）、Judge 基准（第 8 讲）。

指向真实工程。技术栈统一选用主流开源组件（Transformers、PyTorch、LangChain/LlamaIndex、FAISS/Qdrant、TRL、LLaMA-Factory、DSPy、vLLM），方便结业后直接迁移到工作项目。