9.4 真实案例分析

学术文章的 Perplexity 引用轨迹、品牌方 GEO 实践正反面、中文入口（秘塔/DeepSeek）的观察差异

为什么要读案例

GEO 是一门高度经验性的学科——不同引擎、不同领域、不同语种的规律差异极大。本节挑选了三个覆盖不同场景的案例：(1) 学术文章如何被 Perplexity 引用、(2) 品牌方 GEO 实践（正反面）、(3) 中文入口的观察差异。每个案例都对应前面讲过的某条策略，读案例时请主动把它和 9.2 的策略表对齐。

案例一：Aggarwal 2024 论文本身的"被引轨迹"

一个颇具自我指涉色彩的观察对象是——GEO 这门学科的奠基论文（Aggarwal et al., KDD 2024）本身，在 Perplexity 和 ChatGPT Search 上是怎么被引用的。

观测事实

向 Perplexity 提问"What is Generative Engine Optimization"的实际现象：

首条引用极大概率命中 arXiv 2311.09735

arXiv 版本比 ACM DL 版本更容易被引——ACM DL 需要访问权限，检索器对可公开抓取的内容有结构性偏好。这是 Atlas（Izacard et al., 2023）"语料质量可替代模型规模"的反向体现：不可抓取 = 不可引用。

Perplexity 同时引 Aggarwal 原文和二手解读博客

二手解读博客的引用位次有时还靠前，因为它们往往有更清晰的命题句（"GEO is defined as..."），符合 Kevin Indig 观察到的"is defined as / refers to"类语言提升引用概率 1.8 倍的规律。

ChatGPT Search 几乎不 cite Aggarwal，但答案内容和论文高度一致

这正是 Wallat 等人发现的事后合理化现象——GPT 的参数记忆中已包含 GEO 这一术语，模型先生成答案再补引用，引用的往往是更近期的博客而非原始论文。

可提取的策略启示

观察	对应策略	可操作建议
arXiv > ACM DL	内容可抓取性	学术内容必须有公开可抓取版本
二手解读博客位次靠前	命题句密度	正文首段写"X is defined as Y"
ChatGPT 不 cite 但吸收	Integrated 架构偏好	打好内容新鲜度（Ahrefs: AI 引用内容比 SERP 新 25.7%）

案例二：品牌方 GEO 实践的正反面

正面：某 B2B SaaS 公司的"赢得媒体"转型

一家国际 B2B SaaS 公司（云监控领域）在 2025 年上半年做了一次明确的 GEO 实验。起点：品牌官网在 ChatGPT Search 上针对"best cloud monitoring tools 2025"类查询的被引率几乎为 0，而竞品却频繁出现。

诊断：对照 Chen et al. (2025) 的"赢得媒体不对称性"——AI 搜索在消费电子类查询中 92.1% 的引用来自赢得媒体。B2B SaaS 领域同样存在这一偏向，但品牌方原本的自有内容（官网博客）几乎进不了 AI 答案。

干预：公司把 GEO 预算从"自有内容 SEO"转向"赢得媒体投放"——

与行业媒体合作

在 InfoQ、The New Stack、DevOps.com 等权威垂直媒体发布深度技术测评

工程博客被引文

鼓励工程团队在 engineering.company.com 写技术解决方案，但主站不自引，等第三方来引

Stack Overflow / Reddit 技术回答

工程师以个人身份在技术社区回答问题，带自然链接——Semrush 研究：Reddit 位列三大平台 Top-5 引用域名

第三方评测激励

主动争取 Gartner、G2、Capterra 等评测榜单曝光

结果（90 天后）：ChatGPT Search 上相关查询被引率从 0% 升至约 18%；Perplexity 从 3% 升至 22%。但官网自然搜索流量下降 15%——这是典型的零点击代价。

这个案例印证了 Bain 2025 的警告：AI 摘要时代，官网流量下降 15%—25% 是"新常态"，品牌可见性不再等于官网点击。

反面：某电商品牌的 "Keyword Stuffing for LLM" 陷阱

另一个反面教材：一个消费品电商品牌在 2025 年 Q2 看到 GEO 概念后，把自家产品详情页按经典 SEO 思路"LLM 化"——往页面里塞 20—30 个"AI-friendly 关键词"、用机器生成的长段"产品优势描述"重复填充页面，并在每个产品页最底部加了冗长的"FAQ for AI assistants"。

结果：

指标	干预前	干预后（30 天）
Google SERP Top 10 占比	42%	28%
ChatGPT Search 被引率	11%	7%
Perplexity 被引率	8%	5%
自然搜索流量	100%（基准）	73%

失败的直接原因：与 Aggarwal 2024 的实证一致——关键词堆砌和技术术语堆砌是 9 种策略中唯二劣于基线的方法。更深层原因是该品牌把 SEO 思维（关键词密度 = 可见性）误植到 GEO 场景。

复盘教训：

主题：北京大学研究生手册相关问题（对齐课程大纲第 4 讲 RAG 练习）
查询集：20 条，涵盖学籍、培养方案、答辩流程、奖学金政策等
对比：秘塔搜索 vs DeepSeek Web vs Perplexity（英文版作对照）

关键观察

引用数：平均 5—8 条 / 答案，带清晰编号
来源偏好：学校官网 (pku.edu.cn) > 教育类媒体 (eol.cn) > 知乎专业回答 > 公众号
位置加权优势：官方域名（.edu.cn / .gov.cn）在答案前部出现概率 > 70%
GEO 策略有效性：Cite+Quote+Stats 在健康 / 政策类 query 上提升明显；权威化重述在办事流程类 query 上不显著
失败模式：知乎回答若无明确时间戳，容易被"事后合理化"——编号引用存在但内容主要来自模型参数

引用数：平均 3—5 条，编号不总是显式
来源偏好：百度百科 / 头条搜索偏多；新浪、网易、腾讯新闻占比高于秘塔
GEO 策略有效性：流畅性优化和通俗化改写效果最显著；技术术语堆砌显著劣于基线（与 Aggarwal 原论文一致）
独特现象：中英混排文档引用率偏低——模型对纯中文或纯英文源更"偏爱"，混排会降低嵌入对齐度

引用数：平均 7—10 条，全部带编号与页内跳转
来源偏好：arXiv / 学术博客 > 英文权威媒体（NYT / The Atlantic / Wired）> Reddit
对比启示：Perplexity 对 arXiv 和 Reddit 双偏爱，这在中文入口完全不存在等价物——中文学术预印本（如 ChinaXiv）和中文论坛（天涯 / 虎扑）的引用率远低于英文对等物
跨语言注意：同样的主题用中文 query 在 Perplexity 上问，引用生态会瞬间切换至 Chen et al. 观察到的"ChatGPT 式语言生态切换"

中文 GEO 的五条实用经验

以下建议基于秘塔 / DeepSeek 的持续观察，不是学术定论，请结合你的具体场景 A/B 验证。

优先争取 .edu.cn / .gov.cn / .org.cn 域名下的二次引用 — 中文 AI 搜索对这类权威域名的位置加权极强
命题句首次出现时用"X 是指 / X 定义为"的明确句式 — 与 Indig 的"is defined as"规律一致
保持中文术语一致性，首次标注英文原文 — 减少分词和嵌入漂移
避免中英文大段混排 — 会降低中文嵌入对齐度
公众号内容可被引但别作为唯一阵地 — 缺少稳定的 URL 结构和 schema

案例对照表

案例	对应策略	成功因素	失败因素
Aggarwal 论文被引轨迹	内容可抓取性 + 命题句密度	arXiv 公开版、清晰定义句	ACM DL 付费墙
B2B SaaS 赢得媒体	生态位策略	垂直媒体合作、UGC、榜单	—
电商 Keyword Stuffing	反面：误植 SEO 思维	—	关键词堆砌、混淆变量
秘塔 / DeepSeek 中文观察	本地化策略	权威域名、中文术语一致性	中英混排、无时间戳

本节小结

三个案例指向三条核心教训：

GEO 不能和 SEO 同参数化 — 电商 Keyword Stuffing 案例证明经典 SEO 直觉会反向损害 GEO
自有内容无法独力完成 GEO — B2B SaaS 案例证明赢得媒体和第三方背书是必要杠杆
中英文生态不等价 — 中文 GEO 需要独立策略集，秘塔/DeepSeek 观察到的规律不能从 Perplexity 直接迁移

下一节：我们把这些案例变成可动手的上机实验——在秘塔搜索上自己跑一次完整的 GEO 小实证。