AI引用率基准：结构化地理数据将列表曝光率提升六倍的实测数据

TL;DR: 在覆盖 ChatGPT、Perplexity 和 Gemini 的 100 条列表审计中，仅包含描述性文本的列表引用率为 12%，而具有完整结构化地理数据的列表引用率升至 71%。最能提升效果的三项信号分别是经过验证的地理坐标、nearby context 字段，以及跨平台的 NAP 一致性。

2026 年 4 月的前两周，我们对 100 条基于位置的列表进行了一次受控审计，目的是回答一个问题：结构化地理数据究竟能在多大程度上改变 AI 助手引用某条列表的比率。

简短的答案是，最差桶与最佳桶之间大约相差六倍。以下是完整方法论、各桶结果，以及对任何在为 AI 搜索做列表优化的人而言的实际意义。

方法论

列表。 覆盖四个行业的 100 条列表：30 条度假租赁、25 家精品酒店、25 家独立餐厅、20 处本地景点。地域覆盖欧洲 14 个城市，以避免单一市场偏差。所有列表都有活跃、可索引的主页，并且至少在一家第三方目录上有存在。

查询集。 每条列表 15 个发现意图的提示模板，涵盖通用发现（「波尔图安静的精品酒店」）、特性相关发现（「波尔图可步行到地铁的酒店」）和具名召回（「Casa do Vale 是波尔图一家好的民宿吗」）。每个模板都在干净会话中、无对话历史的情况下新发起。

模型。 ChatGPT（GPT-5 级）、Perplexity、Gemini。每条提示在每个模型上发送一次，每条列表 45 条回复，总共 4,500 条回复。

评分。 回复中列表作为链接来源出现、在答案中被明确具名，或两者都满足时，计为一次引用。部分名称匹配由人工复核以排除误报。

分桶。 每条列表按 MapAtlas AEO Checker 在 29 个结构化信号上的得分分组为四个完整度桶。桶的阈值在评分开始之前就已设定。

核心结果

最低桶与最高桶之间的引用率差距比我们预期的要大。

来源：MapAtlas 基准测试，2026 年 4 月，n=100 条列表，4,500 条回复。

最低桶，即只有丰富散文但无结构化数据的列表，引用率为 12%。最高桶，即具有完整 Place schema、验证过的地理坐标、附近上下文字段、FAQ schema 以及跨平台一致的 NAP 的列表，达到 71%。

逐信号拆解

为了弄清是哪些单项信号推动了最高桶的结果，我们做了一次特征消融分析。对六个权重最高的信号，我们在其他变量大致恒定的情况下，比较了拥有该信号的列表与没有该信号的列表之间的引用率。

信号	含该信号	不含该信号	提升
带 geo 的完整 `Place` JSON-LD	58%	19%	3.1x
经过验证的附近 POI 数据	62%	24%	2.6x
通勤邻近性字段	54%	22%	2.5x
含位置问题的 FAQ schema	49%	26%	1.9x
跨 3 个及以上平台的 NAP 一致性	56%	21%	2.7x
外部标识符（Wikidata / Place ID）	51%	27%	1.9x

来源：MapAtlas 基准测试，2026 年 4 月。

该表有四点值得注意：

地理坐标是单一最强的提升项。 不带 geo 的 Place 块只比完全没有 schema 稍好一点。
附近上下文几乎同样强。 与具名 POI 和交通的邻近性是引用率第二大的预测因素。
FAQ schema 有帮助，但不如位置相关信号。 回答位置问题的 FAQ（如「最近的地铁有多远」）远优于通用运营类 FAQ。
外部标识符的效能超出其直觉权重。 把列表对齐到 Wikidata QID 或 Google Place ID，在消融中几乎让引用率翻倍，可能是因为它让 AI 系统可以在多个来源之间去重。

行业差异

效果大小在各行业中并不一致。起点最弱的度假租赁，从结构化数据中获得的绝对增益最大；训练数据中本已充分代表的地标，增益最小。

行业	最低桶	最高桶	差距
度假租赁	7%	68%	+61
精品酒店	14%	74%	+60
独立餐厅	13%	69%	+56
本地景点	18%	72%	+54

来源：MapAtlas 基准测试，2026 年 4 月。

度假租赁是最明显的赢家。一条一开始隐身的列表，仅通过结构化数据就能成为一个被稳定引用的来源。对于在公众中已具有较强代表性的场所，效果较弱但仍显著。

模型实际在做什么

在对 200 条回复的定性复核中，有一种反复出现的模式。当列表具有完整结构化数据时，助手倾向于引用具体事实：到车站的步行时间、300 米范围内的餐厅数量、街区名称、营业时间。当同一条列表被剥离结构化数据后，助手要么完全省略它，要么用泛泛的措辞来描述。

这与检索增强型模型的行为一致。它们倾向于引用那些以具体、可核实的事实来回答问题的来源。把列表描述为「安静、适合步行」的散文，会输给说明「walk score 92、noise index 18 dB average」的结构化字段。后者更容易提取、更容易与用户查询对比、也更容易归因。

如何把一条列表从第 1 桶带到第 4 桶

根据消融分析，四项变更贡献了大部分的提升：

1. 添加带地理坐标的完整 Place 或 LodgingBusiness JSON-LD 块。 坐标与邮政地址匹配、有规范的外部标识符，并且所有必需的 Schema.org 字段齐全。Google 官方的本地业务结构化数据指南列出了权重最高的字段。字段层面的细节见用于本地业务 AI 引用的 JSON-LD schema。

2. 用经过验证的附近上下文丰富列表。 到最近公交站的步行时间、附近餐厅和咖啡馆的数量、指定半径内的具名 POI。MapAtlas GeoEnrich 可以在规模化场景下从经过验证的来源生成这些数据，从而既可以嵌入 schema 也可以嵌入页面文案。

3. 发布位置相关的 FAQ schema。 问题要与用户表述位置查询的方式直接对应。见面向 AI 搜索的位置相关 FAQ。

4. 跨平台对齐 NAP。 列表主页、Google Business Profile 以及至少一家第三方目录，应显示相同的名称、地址和电话。机制见 AI 搜索中的 NAP 一致性。

注意事项

本基准具有方向性，而非定论。有三点局限值得指出：

样本量。 100 条列表足以看出较大效应，但不足以解析细粒度差异。
模型漂移。 AI 助手更新频繁。绝对数值会变动；信号之间的相对排序相对更稳定。
查询组合。 我们的模板偏向发现意图。交易型查询（「今晚在波尔图订一个房间」）走的是不同的链路，不在本次研究范围内。

更宏观的要点不在于某一个数字是否精确，而在于结构化与非结构化列表之间的差距是大的、可测量的，并且在列表方自己可控的工作范围内基本上可以缩小。

测量你自己的基线

MapAtlas AEO Checker 使用本基准相同的 29 个信号对列表进行评分。把你表现最好的房源和最弱的房源都跑一次；得分的差距通常与两者在 AI 助手实际回答中被浮现的频率差距相吻合。

对于通过 AI 进行搜索的这一代用户来说，引用率正在成为自然排名的对应物。赢得的列表是那些能给模型可提取内容的，其他一切只是模型会礼貌地忽略的散文。

延伸阅读：

常见问题

什么是 AI 引用率？

AI 引用率指的是在相关用户查询中，AI 助手把某条列表作为已引用来源之一，或在答案中按名称提及该列表的比例。它是 AI 搜索中的自然排名等价物，但衡量的是答案层面而非结果页层面。引用率为 40% 的列表意味着，在被测助手的相关答案中每五条就有两条会出现它。

这个基准是如何进行的？

我们挑选了覆盖四个行业的 100 条列表：度假租赁、精品酒店、独立餐厅和本地景点。每条列表在 ChatGPT、Perplexity 和 Gemini 上使用一套标准发现意图问题模板被查询 15 次。回复按列表是否作为引用来源或具名推荐出现进行评分。随后，列表按 MapAtlas AEO Checker 所测得的结构化数据完整度被分桶。

对引用率影响最大的是什么？

最能影响引用率的三个信号是：带有地理坐标的完整 Place 或 LodgingBusiness JSON-LD 块；经过验证的附近上下文，例如通勤时间和距离具名 POI 的距离；以及 Google Business Profile、列表主页和至少一个第三方目录之间的 NAP 一致性。在这三项上都得分高的列表，引用率大约是三项都得分低的列表的六倍。

单靠散文描述有没有帮助？

帮助有限。包含位置关键词但没有结构化数据的长篇描述，引用率基线约为 12%。加上没有验证过的地理字段的 Schema.org 标记，把它提升到大约 28%。再加上验证过的附近上下文和一致的 NAP 数据，最高分桶达到约 71%。一旦列表被引用，散文质量对用户信任很重要，但对列表最初是否被引用影响有限。

我该如何测量自己的引用率？

把你的列表 URL 输入 mapatlas.eu/ai-seo-checker 的免费 MapAtlas AEO Checker 中。该检查器对本次基准使用的 29 个信号进行评分，并标出缺失项。把得分与周期性的 ChatGPT、Perplexity、Gemini 手动提示结合起来，可以追踪列表随时间在 AI 答案中的出现频率。

TL;DR: 在覆盖 ChatGPT、Perplexity 和 Gemini 的 100 条列表审计中，仅包含描述性文本的列表引用率为 12%，而具有完整结构化地理数据的列表引用率升至 71%。最能提升效果的三项信号分别是经过验证的地理坐标、nearby context 字段，以及跨平台的 NAP 一致性。

简短的答案是，最差桶与最佳桶之间大约相差六倍。以下是完整方法论、各桶结果，以及对任何在为 AI 搜索做列表优化的人而言的实际意义。

方法论

模型。 ChatGPT（GPT-5 级）、Perplexity、Gemini。每条提示在每个模型上发送一次，每条列表 45 条回复，总共 4,500 条回复。

评分。 回复中列表作为链接来源出现、在答案中被明确具名，或两者都满足时，计为一次引用。部分名称匹配由人工复核以排除误报。

分桶。 每条列表按 MapAtlas AEO Checker 在 29 个结构化信号上的得分分组为四个完整度桶。桶的阈值在评分开始之前就已设定。

核心结果

最低桶与最高桶之间的引用率差距比我们预期的要大。

来源：MapAtlas 基准测试，2026 年 4 月，n=100 条列表，4,500 条回复。

逐信号拆解

信号	含该信号	不含该信号	提升
带 geo 的完整 `Place` JSON-LD	58%	19%	3.1x
经过验证的附近 POI 数据	62%	24%	2.6x
通勤邻近性字段	54%	22%	2.5x
含位置问题的 FAQ schema	49%	26%	1.9x
跨 3 个及以上平台的 NAP 一致性	56%	21%	2.7x
外部标识符（Wikidata / Place ID）	51%	27%	1.9x

来源：MapAtlas 基准测试，2026 年 4 月。

该表有四点值得注意：

地理坐标是单一最强的提升项。 不带 geo 的 Place 块只比完全没有 schema 稍好一点。
附近上下文几乎同样强。 与具名 POI 和交通的邻近性是引用率第二大的预测因素。
FAQ schema 有帮助，但不如位置相关信号。 回答位置问题的 FAQ（如「最近的地铁有多远」）远优于通用运营类 FAQ。
外部标识符的效能超出其直觉权重。 把列表对齐到 Wikidata QID 或 Google Place ID，在消融中几乎让引用率翻倍，可能是因为它让 AI 系统可以在多个来源之间去重。

行业差异

效果大小在各行业中并不一致。起点最弱的度假租赁，从结构化数据中获得的绝对增益最大；训练数据中本已充分代表的地标，增益最小。

行业	最低桶	最高桶	差距
度假租赁	7%	68%	+61
精品酒店	14%	74%	+60
独立餐厅	13%	69%	+56
本地景点	18%	72%	+54

来源：MapAtlas 基准测试，2026 年 4 月。

模型实际在做什么

如何把一条列表从第 1 桶带到第 4 桶

根据消融分析，四项变更贡献了大部分的提升：

3. 发布位置相关的 FAQ schema。 问题要与用户表述位置查询的方式直接对应。见面向 AI 搜索的位置相关 FAQ。

4. 跨平台对齐 NAP。 列表主页、Google Business Profile 以及至少一家第三方目录，应显示相同的名称、地址和电话。机制见 AI 搜索中的 NAP 一致性。

注意事项

本基准具有方向性，而非定论。有三点局限值得指出：

样本量。 100 条列表足以看出较大效应，但不足以解析细粒度差异。
模型漂移。 AI 助手更新频繁。绝对数值会变动；信号之间的相对排序相对更稳定。
查询组合。 我们的模板偏向发现意图。交易型查询（「今晚在波尔图订一个房间」）走的是不同的链路，不在本次研究范围内。

测量你自己的基线

延伸阅读：

常见问题

什么是 AI 引用率？

这个基准是如何进行的？

对引用率影响最大的是什么？

单靠散文描述有没有帮助？

我该如何测量自己的引用率？

AI引用率基准：结构化地理数据将列表曝光率提升六倍的实测数据

方法论

核心结果

逐信号拆解

行业差异

模型实际在做什么

如何把一条列表从第 1 桶带到第 4 桶

注意事项

测量你自己的基线

常见问题

相关产品

AI引用率基准：结构化地理数据将列表曝光率提升六倍的实测数据

方法论

核心结果

逐信号拆解

行业差异

模型实际在做什么

如何把一条列表从第 1 桶带到第 4 桶

注意事项

测量你自己的基线

常见问题

相关产品

AI引用率基准：结构化地理数据将列表曝光率提升六倍的实测数据

方法论

核心结果

逐信号拆解

行业差异

模型实际在做什么

如何把一条列表从第 1 桶带到第 4 桶

注意事项

测量你自己的基线

常见问题

相关 API

相关产品

AI引用率基准：结构化地理数据将列表曝光率提升六倍的实测数据

方法论

核心结果

逐信号拆解

行业差异

模型实际在做什么

如何把一条列表从第 1 桶带到第 4 桶

注意事项

测量你自己的基线

常见问题

相关 API

相关产品