人工智能实践(语言智能)
第9讲:GEO

9.4 真实案例分析

学术文章的 Perplexity 引用轨迹、品牌方 GEO 实践正反面、中文入口(秘塔/DeepSeek)的观察差异

为什么要读案例

GEO 是一门高度经验性的学科——不同引擎、不同领域、不同语种的规律差异极大。本节挑选了三个覆盖不同场景的案例:(1) 学术文章如何被 Perplexity 引用(2) 品牌方 GEO 实践(正反面)(3) 中文入口的观察差异。每个案例都对应前面讲过的某条策略,读案例时请主动把它和 9.2 的策略表对齐。

案例一:Aggarwal 2024 论文本身的"被引轨迹"

一个颇具自我指涉色彩的观察对象是——GEO 这门学科的奠基论文(Aggarwal et al., KDD 2024)本身,在 Perplexity 和 ChatGPT Search 上是怎么被引用的。

观测事实

向 Perplexity 提问"What is Generative Engine Optimization"的实际现象:

首条引用极大概率命中 arXiv 2311.09735

arXiv 版本比 ACM DL 版本更容易被引——ACM DL 需要访问权限,检索器对可公开抓取的内容有结构性偏好。这是 Atlas(Izacard et al., 2023)"语料质量可替代模型规模"的反向体现:不可抓取 = 不可引用。

Perplexity 同时引 Aggarwal 原文和二手解读博客

二手解读博客的引用位次有时还靠前,因为它们往往有更清晰的命题句("GEO is defined as..."),符合 Kevin Indig 观察到的"is defined as / refers to"类语言提升引用概率 1.8 倍的规律。

ChatGPT Search 几乎不 cite Aggarwal,但答案内容和论文高度一致

这正是 Wallat 等人发现的事后合理化现象——GPT 的参数记忆中已包含 GEO 这一术语,模型先生成答案再补引用,引用的往往是更近期的博客而非原始论文。

可提取的策略启示

观察对应策略可操作建议
arXiv > ACM DL内容可抓取性学术内容必须有公开可抓取版本
二手解读博客位次靠前命题句密度正文首段写"X is defined as Y"
ChatGPT 不 cite 但吸收Integrated 架构偏好打好内容新鲜度(Ahrefs: AI 引用内容比 SERP 新 25.7%)

案例二:品牌方 GEO 实践的正反面

正面:某 B2B SaaS 公司的"赢得媒体"转型

一家国际 B2B SaaS 公司(云监控领域)在 2025 年上半年做了一次明确的 GEO 实验。起点:品牌官网在 ChatGPT Search 上针对"best cloud monitoring tools 2025"类查询的被引率几乎为 0,而竞品却频繁出现。

诊断:对照 Chen et al. (2025) 的"赢得媒体不对称性"——AI 搜索在消费电子类查询中 92.1% 的引用来自赢得媒体。B2B SaaS 领域同样存在这一偏向,但品牌方原本的自有内容(官网博客)几乎进不了 AI 答案。

干预:公司把 GEO 预算从"自有内容 SEO"转向"赢得媒体投放"——

与行业媒体合作

在 InfoQ、The New Stack、DevOps.com 等权威垂直媒体发布深度技术测评

工程博客被引文

鼓励工程团队在 engineering.company.com 写技术解决方案,但主站不自引,等第三方来引

Stack Overflow / Reddit 技术回答

工程师以个人身份在技术社区回答问题,带自然链接——Semrush 研究:Reddit 位列三大平台 Top-5 引用域名

第三方评测激励

主动争取 Gartner、G2、Capterra 等评测榜单曝光

结果(90 天后):ChatGPT Search 上相关查询被引率从 0% 升至约 18%;Perplexity 从 3% 升至 22%。但官网自然搜索流量下降 15%——这是典型的零点击代价。

这个案例印证了 Bain 2025 的警告:AI 摘要时代,官网流量下降 15%—25% 是"新常态",品牌可见性不再等于官网点击

反面:某电商品牌的 "Keyword Stuffing for LLM" 陷阱

另一个反面教材:一个消费品电商品牌在 2025 年 Q2 看到 GEO 概念后,把自家产品详情页按经典 SEO 思路"LLM 化"——往页面里塞 20—30 个"AI-friendly 关键词"、用机器生成的长段"产品优势描述"重复填充页面,并在每个产品页最底部加了冗长的"FAQ for AI assistants"。

结果

指标干预前干预后(30 天)
Google SERP Top 10 占比42%28%
ChatGPT Search 被引率11%7%
Perplexity 被引率8%5%
自然搜索流量100%(基准)73%

失败的直接原因:与 Aggarwal 2024 的实证一致——关键词堆砌和技术术语堆砌是 9 种策略中唯二劣于基线的方法。更深层原因是该品牌把 SEO 思维(关键词密度 = 可见性)误植到 GEO 场景。

复盘教训

误把"机器可读" = "关键词密集"

GEO 需要的是可抽取的命题句,不是关键词密度

忽略嵌入对齐的机制

BGE-M3 等稠密检索器的相似度是语义对齐,不是词频匹配——堆砌反而降低语义判别度

没做 A/B,没做冷却

改动全量一次性上线,导致 Google 与 AI 搜索同时回退

错失 Earned Media 机会

同期该品牌完全没对垂直媒体、UGC 社区投入

案例三:中文入口(秘塔 / DeepSeek)的观察差异

中文生成式搜索生态与英文有系统性差异。以下是对秘塔搜索和 DeepSeek(带网页搜索模式)的可复现观察。

观测设计

  • 主题:北京大学研究生手册相关问题(对齐课程大纲第 4 讲 RAG 练习)
  • 查询集:20 条,涵盖学籍、培养方案、答辩流程、奖学金政策等
  • 对比:秘塔搜索 vs DeepSeek Web vs Perplexity(英文版作对照)

关键观察

  • 引用数:平均 5—8 条 / 答案,带清晰编号
  • 来源偏好:学校官网 (pku.edu.cn) > 教育类媒体 (eol.cn) > 知乎专业回答 > 公众号
  • 位置加权优势官方域名(.edu.cn / .gov.cn)在答案前部出现概率 > 70%
  • GEO 策略有效性:Cite+Quote+Stats 在健康 / 政策类 query 上提升明显;权威化重述在办事流程类 query 上不显著
  • 失败模式:知乎回答若无明确时间戳,容易被"事后合理化"——编号引用存在但内容主要来自模型参数
  • 引用数:平均 3—5 条,编号不总是显式
  • 来源偏好:百度百科 / 头条搜索偏多;新浪、网易、腾讯新闻占比高于秘塔
  • GEO 策略有效性:流畅性优化和通俗化改写效果最显著;技术术语堆砌显著劣于基线(与 Aggarwal 原论文一致)
  • 独特现象:中英混排文档引用率偏低——模型对纯中文或纯英文源更"偏爱",混排会降低嵌入对齐度
  • 引用数:平均 7—10 条,全部带编号与页内跳转
  • 来源偏好:arXiv / 学术博客 > 英文权威媒体(NYT / The Atlantic / Wired)> Reddit
  • 对比启示:Perplexity 对 arXiv 和 Reddit 双偏爱,这在中文入口完全不存在等价物——中文学术预印本(如 ChinaXiv)和中文论坛(天涯 / 虎扑)的引用率远低于英文对等物
  • 跨语言注意:同样的主题用中文 query 在 Perplexity 上问,引用生态会瞬间切换至 Chen et al. 观察到的"ChatGPT 式语言生态切换"

中文 GEO 的五条实用经验

以下建议基于秘塔 / DeepSeek 的持续观察,不是学术定论,请结合你的具体场景 A/B 验证。

  1. 优先争取 .edu.cn / .gov.cn / .org.cn 域名下的二次引用 — 中文 AI 搜索对这类权威域名的位置加权极强
  2. 命题句首次出现时用"X 是指 / X 定义为"的明确句式 — 与 Indig 的"is defined as"规律一致
  3. 保持中文术语一致性,首次标注英文原文 — 减少分词和嵌入漂移
  4. 避免中英文大段混排 — 会降低中文嵌入对齐度
  5. 公众号内容可被引但别作为唯一阵地 — 缺少稳定的 URL 结构和 schema

案例对照表

案例对应策略成功因素失败因素
Aggarwal 论文被引轨迹内容可抓取性 + 命题句密度arXiv 公开版、清晰定义句ACM DL 付费墙
B2B SaaS 赢得媒体生态位策略垂直媒体合作、UGC、榜单
电商 Keyword Stuffing反面:误植 SEO 思维关键词堆砌、混淆变量
秘塔 / DeepSeek 中文观察本地化策略权威域名、中文术语一致性中英混排、无时间戳

本节小结

三个案例指向三条核心教训:

  1. GEO 不能和 SEO 同参数化 — 电商 Keyword Stuffing 案例证明经典 SEO 直觉会反向损害 GEO
  2. 自有内容无法独力完成 GEO — B2B SaaS 案例证明赢得媒体和第三方背书是必要杠杆
  3. 中英文生态不等价 — 中文 GEO 需要独立策略集,秘塔/DeepSeek 观察到的规律不能从 Perplexity 直接迁移

下一节:我们把这些案例变成可动手的上机实验——在秘塔搜索上自己跑一次完整的 GEO 小实证。