人工智能实践(语言智能)
第3讲:提示词

参考材料

按主题分组的核心论文、综述与内部译本——构建你自己的提示工程阅读地图

内部材料(本讲直接依据)

文件内容
prompt-engineering-literature-review-zh.md课程内部综述(25K 字),覆盖提示范式演进、理论基础、自动化优化
DSPy论文中文翻译_Khattab2023.mdDSPy 论文 arXiv:2310.03714 的中文译本
TextGrad论文中文翻译.mdTextGrad Nature 2025 论文的中文译本

核心原始论文

基础范式

年份作者标题要点
2020Brown et al., NeurIPSGPT-3: Language Models are Few-Shot Learners确立 ICL 范式,催生提示工程
2022Wei et al., ICLRFLAN: Finetuned Language Models Are Zero-Shot Learners指令微调,孵化 InstructGPT 系列
2021Zhao et al., ICMLCalibrate Before Use识别 ICL 的三种系统性偏差
2022Min et al., EMNLPRethinking the Role of Demonstrations"标签随机化"实验,格式 > 语义
2024Sclar et al., ICLRQuantifying Language Models' Sensitivity to Spurious FeaturesFormatSpread,76 点准确率差异

Chain-of-Thought 及扩展

年份作者标题要点
2022Wei et al., NeurIPSChain-of-Thought Prompting Elicits ReasoningCoT 原始论文,GSM8K 碾压纪录
2022Kojima et al., NeurIPSLarge Language Models are Zero-Shot ReasonersZero-shot CoT,"Let's think step by step"
2023Wang et al., ICLRSelf-Consistency Improves Chain-of-Thought Reasoning多路采样 + 多数投票
2023Gao et al., ICMLPAL: Program-aided Language Models生成 Python 代码作为推理步骤
2023Chen et al., TMLRProgram of Thoughts (PoT)与 PAL 并行的工作,外包计算

Tree / Graph of Thoughts

年份作者标题要点
2023Yao et al., NeurIPSTree of Thoughts: Deliberate Problem Solving评估器 + DFS/BFS 搜索,24 点 74%
2024Besta et al., AAAIGraph of Thoughts任意 DAG,聚合与反馈循环
2023Zhou et al., ICLRLeast-to-Most Prompting显式问题分解,SCAN 上 16% → 99.7%
2023Khot et al., ICLRDecomposed Prompting模块化递归分解

Agent / ReAct

年份作者标题要点
2023Yao et al., ICLRReAct: Synergizing Reasoning and ActingThought-Action-Observation 循环,LangChain 的直接先驱
2023Shinn et al., NeurIPSReflexion语言自我反思,HumanEval 91% pass@1
2023Schick et al., NeurIPSToolformerLM 自主决定调用哪些 API

DSPy 与自动化提示优化

年份作者标题要点
2024Khattab et al., ICLR SpotlightDSPy: Compiling Declarative LM CallsSignature / Module / Teleprompter 三层抽象
2024Opsahl-Ong et al., EMNLPMIPRO: Optimizing Multi-Stage LM Programs贝叶斯优化联合搜索指令与示例
2023Zhou et al., ICLRAPE: Large Language Models as Human-Level Prompt EngineersLLM 作为 prompt 生成器,发现比 "Let's think" 更优的触发语
2024Yang et al., ICLROPRO: Large Language Models as Optimizers把优化问题用自然语言描述给 LLM
2024Guo et al., ICLREvoPrompt进化算法 + LLM 作为变异/交叉算子
2023Pryzant et al., EMNLPProTeGi / APO自然语言"梯度"从错误示例中提取

TextGrad 与文本梯度

年份作者标题要点
2025Yuksekgonul et al., NatureTextGrad: Automatic "Differentiation" via TextPyTorch 风格 API,文本梯度反向传播
2024Suzgun and KalaiMeta-Prompting"全新视角"原则,单 LLM 变指挥家

理论与机制解释

年份作者标题要点
2022Xie et al., ICLRAn Explanation of In-Context Learning as Implicit Bayesian Inference贝叶斯后验更新视角
2023Von Oswald et al., ICMLTransformers Learn In-Context by Gradient DescentICL 等价于一步 GD
2022Olsson et al., AnthropicIn-context Learning and Induction Heads机制可解释性的关键电路
2022Chan et al., NeurIPSData Distributional Properties Drive Emergent ICL齐普夫分布与突发性是 ICL 的前提

推荐综述

作者标题收录
Liu et al.Pre-train, Prompt, and Predict: A Systematic SurveyACM Computing Surveys, 2023
Schulhoff et al.The Prompt Report: A Systematic Survey2024,1500+ 论文
Sahoo et al.A Systematic Survey of Prompt Engineering Techniques2024
Besta et al.Demystifying Chains, Trees, and Graphs of Thoughts2024

课程推荐阅读清单(按时间投入排序)

15 分钟:快速了解

  • 课程内部综述第 1–2 章(范式演进 + 下游任务)
  • DSPy 论文中文翻译的 §3 与 §4

1 小时:理解 CoT 家族

  • Wei et al. 2022 CoT 原文(§1–3)
  • Kojima et al. 2022 Zero-shot CoT
  • Wang et al. 2023 Self-Consistency

3 小时:搞懂 DSPy + TextGrad

一个周末:理论基础

  • 课程内部综述第 3 章(ICL 的贝叶斯 / GD 两种解释)
  • Olsson et al. 2022 Induction Heads
  • Min et al. 2022 Rethinking Demonstrations

工具与代码仓库

项目地址用途
DSPyhttps://github.com/stanfordnlp/dspy声明式 LM pipeline 框架
TextGradhttps://github.com/zou-group/textgrad文本梯度优化
LangChainhttps://github.com/langchain-ai/langchain工具链与 Agent 编排
LlamaIndexhttps://github.com/run-llama/llama_indexRAG 与文档问答
Promptfoohttps://github.com/promptfoo/promptfooPrompt 的 A/B 测试与评估

阅读建议:优先读综述建立心智地图,再按你的应用方向(推理 / RAG / Agent / 优化)深入 2–3 篇代表作。直接开读 100 篇 prompt 论文会让你迷路——这个领域的噪声远大于信号。