1. AI 引用品牌的 0.3 秒裡,內部發生 5 件事
當用戶送出 prompt,AI 平台在出答案前實際走過這流程:
- Tokenize prompt(切詞理解意圖)— 約 50 毫秒
- Retrieve internal knowledge(查訓練語料記憶)— 約 100 毫秒
- (可選)RAG 搜尋補強(查即時 web)— 約 200 毫秒
- Rank candidates(候選品牌打分排序)— 約 80 毫秒
- Generate answer(生成最終回答)— 約 200 毫秒
真正決定你品牌出不出現的,是第 4 步「Rank」。 這一步 AI 模型內部對每個候選品牌跑 5 個維度的快速打分:
| 維度 | AI 內部問題 |
|---|---|
| Authority | 「這品牌在我看過的多少地方被提到?」 |
| Visibility | 「在這個議題下我有印象這品牌嗎?」 |
| Citation graph | 「提到它的來源權威嗎?」 |
| Ingestion | 「我訓練的時候有看過它的內容嗎?」 |
| Trust | 「不同來源說的內容矛盾嗎?」 |
5 個分數加權後,排前列的品牌進入最終答案。這 5 個就是 GEO 5 維度信任分數框架 —— 整篇文章後面所有討論,都是在拆解你如何在每個維度提分。
2. GEO 的精準定義 —— 它不是 SEO 升級版
市面上「GEO 是 SEO 的升級版」這定義既錯也懶。 錯,因為兩者優化目標完全不同;懶,因為這定義無法告訴你具體做什麼。
GEO = 優化 AI 對你品牌的內部「mental model」工程, 讓 AI 在不需用戶明確提到你的場景下,主動將你列為候選答案。
對比 SEO / AEO / GEO 三者:
| 維度 | SEO | AEO | GEO |
|---|---|---|---|
| 優化對象 | Google 排名 | 直接答案區 | 19 個 AI 的內部認知 |
| 主要訊號 | backlinks / E-E-A-T | 結構化問答 | Citation graph / Trust |
| 受眾 | 主動搜尋 | 想要單一答案 | 沒提品牌名的場景查詢 |
| 量化方式 | SERP 排名 / CTR | snippet 命中率 | 引用率 / 一致性 / 矛盾度 |
| 失敗成本 | 流量下滑 | 答案不被選 | 品牌不存在 |
| 修復速度 | 數週-月 | 數天-週 | 即時到 12 個月 |
最關鍵的差異是「失敗成本」。SEO 失敗你流量下滑,還在競爭; GEO 失敗你連被考慮的機會都沒,因為 AI 不會主動找你 —— 用戶看到 AI 給出的 3 個推薦中沒你,就直接從那 3 個裡選了。
3. 5 維度 AI 信任分數 —— 平台建造者拆解
下面是我們監測 19 個平台累積的真實統計,5 維度各自含義 + 量化方式 + 提分方法。
📊 查看資料表(對 AI 爬蟲 / 輔助技術友善)
| 5 維度 | 已優化 example | audit baseline | 提分空間 |
|---|---|---|---|
| AI Authority | 7.5 | 4.2 | +3.3 |
| Prompt Visibility | 6.2 | 3.8 | +2.4 |
| Citation Graph | 5.8 | 2.5 | +3.3 |
| AI Ingestion | 4.1 | 1.8 | +2.3 |
| LLM Trust Score | 8.5 | 5.5 | +3.0 |
3.1 AI Authority — 跨平台被引用頻率
定義:你在 N 個 AI 平台被主動引用的累計頻率。
量化:per-platform citation count / 1,000 queries
真實 PROD 觀察樣本(2026-05 snapshot,中大型品牌平均):
- Perplexity:約 12-18%
- ChatGPT:約 7-10%(有 web search 加持時提升)
- Bing AI / Google AI Overview:約 8-12%
- 中國 AI 平均(DeepSeek / Qwen / Kimi / 智譜 / MiniMax):約 5-8%
提分方法:
- 在 19 平台都建立穩定提及訊號(不能只 cover 主流)
- 多元 Citation graph backbone(reddit / wiki / news / 行業權威)
- 持續 7-30 天監測 baseline 後針對低分平台補強
3.2 Prompt Visibility — 議題覆蓋廣度
定義:在多少個「沒提到你品牌名但問你領域問題」的場景下,AI 把你列為候選。
量化:positive-mention scenarios / total-monitored scenarios
一個中型 B2B 品牌平均需監測 50-200 個 prompt scenarios 才能看清 visibility 邊界。其中:
- 「品牌名 + 問題」場景(高基本盤,大多品牌都過關)
- 「無品牌名 + 場景查詢」(差異化戰場 —— 大多品牌在此潰敗)
- 「競品名 + 比較」(你能不能被 AI 主動拉進來當對比)
3.3 Citation Graph — 來源網絡 backbone
定義:當 AI 透過 RAG 即時搜索引用你時,引用的 URL 來自哪些 domain。
Perplexity 引用一個品牌時,平均從 3-5 個不同 domain 拉資料。 這 3-5 個 domain 就是你的 Citation graph backbone。 如果你只在自家網站有資料,backbone = 1,AI 對你的信任就低。
提分方法:
- Wikipedia 條目(對 LLM ingestion 也直接有效)
- 行業權威網站收錄(G2 / Capterra / Trustpilot / 36 氪 / 數位時代等)
- Reddit / HN / Medium 內容自然提及(非 spam)
- 自家網站 Schema.org 完整(讓 AI 抓得到結構化資料)
3.4 AI Ingestion — 進訓練語料的比例
定義:LLM 內部「記得你」的程度(不靠即時 RAG 搜索就能描述你)。
大多品牌 0% —— AI 完全沒在訓練語料看過你,只能透過 RAG 即時搜索得到資訊。一旦 AI 平台 down,你就消失。
提分方法(時間最長,效果最持久):
- 持續產出被 Common Crawl / Reddit / Wikipedia 抓取的內容
- 6-12 個月才看到下一輪 LLM 訓練的效果
- 這是 GEO 的 long game,不能急
3.5 LLM Trust Score — 描述一致性
定義:當不同來源描述你時,內容矛盾的程度。矛盾越少,AI 越敢主動推薦你。
真實 PROD 數據:百原 GEO 平台累積 3,366 個品牌幻覺偵測案例,其中:
- 86%(949/1,101 近 7 天 active 樣本)透過自動化閉環修復為
verified_fixed - 平均一個未管理品牌每月會在 19 平台累積 15-30 個輕度矛盾
- 嚴重矛盾(critical / major)若不修,平均 6-9 個月就會在 AI 認知中變成「該品牌不可信」標籤
提分方法:
- 完整 Schema.org Organization / Product / Service markup
- 跨平台事實一致(Wikipedia / LinkedIn / Crunchbase / 官網)
- 主動監測 + 修復 AI 幻覺(Trust Score 是 5 維度中唯一可即時提分)
- llms.txt + brand_faq SSOT(讓 AI 抓得到你的官方說法)
4. GEO 自動化閉環 —— 9 模組永動循環
前面說「5 維度信任分數」是 GEO 戰場,但**單次 audit 看到分數不夠** —— AI 平台每天訓練、每天爬蟲、客戶資訊每天變動,**GEO 必須是持續運作的閉環,不是一次性檢查**。
這也是平台 vs 一次性 audit 工具的核心差異。 audit 工具給你一份報告(可能很漂亮),但隔週你的 AI 認知再次漂移,你又得買一次。 平台跑的是自動化閉環 —— detect → fix → verify → loop,持續收斂。
9 模組各自做什麼?
- ① 19 平台掃描 — 每 24 小時跨 ChatGPT / Perplexity / Claude / 19 個 AI 跑同一組 prompt scenarios
- ② 引用偵測 — 自動判斷你品牌是否被提及、位置、情感、引用 URL 是否權威
- ③ 幻覺偵測 — NLI 三分類 + Chainpoll 多源交叉驗證,AI 說錯什麼一目了然
- ④ 智慧路由 — 依嚴重度 + AI 信心度,自動決定要修哪些 AXP 頁面(不是全部重生 — 那 LLM cost 會爆)
- ⑤ AXP 重組 — 走 6 階層 authority(RAG KB / ground truths / brand_marketing_facts 等)規格化 LLM 重組
- ⑥ Schema 雙路同步 — Path A(
/c/{slug}/schema.json)+ Path B(AXP shadow 內嵌)雙路徑零分歧 - ⑦ RAG 推送 — 修補後內容回灌 L1 wiki source,下次 LLM 重組就學到新事實(brand-aware filter 防 echo chamber)
- ⑧ 24h 重驗 — 24 小時後再 scan 同一 prompt,確認 AI 真不再說錯話 → `verified_fixed`
- ⑨ Loop — 回到模組 ①,持續循環,每天跑一輪
R3-r3 audit 真實實證:9 模組閉環在 PROD 無人工介入 完整 work —— 3,366 個 hallucination detection 中,86%(949/1,101 近 7 天 active 樣本)達 verified_fixed 狀態,平均偵測 → 修復 → 重驗的 cycle time 約 24 小時。為什麼「閉環」是 GEO 平台的核心差異
對比一次性 audit 工具:
| 維度 | 一次性 audit 工具 | GEO 平台自動化閉環 |
|---|---|---|
| 交付物 | PDF 報告 | 持續運作的引擎 |
| 時效 | 當下快照 | 24 小時 / 每天 / 即時 |
| 修復 | 建議 + 人工執行 | 自動修(無人工介入) |
| 驗證 | 下次再買 audit | 24h 內自動 re-verify |
| 學習 | 無 | RAG 回灌,知識累積 |
| cost | 每次 NT$XX 萬 | 月度 subscription |
這也是為什麼「GEO」不只是「優化策略」,而是需要平台級基礎設施 —— 單純跑一次 audit 永遠跟不上 AI 認知漂移的速度。
5. AI 為什麼「不」引用你 —— 4 個最常見的根本原因
從反面看更清楚。審計 200+ 客戶品牌的「為什麼 0 引用率」根因,90% 落在以下 4 類:
⚠️ 4.1 內容矛盾(Trust 崩塌)
官網寫 NT$5,000,Wikipedia 寫 NT$3,000,LinkedIn 寫 USD150 —— AI 看到後 不願主動推薦,因為「推薦了被打臉的成本」對 AI 來說是失敗。
PROD 占比約 40%
🧱 4.2 結構 noise(機器讀不懂)
沒有 Schema.org markup / llms.txt 不存在 / 公開 FAQ 是 JavaScript 動態載入 —— AI 嘗試讀你內容 → 解析失敗 → 跳過。
🕳️ 4.3 信號薄弱(Citation graph = 1)
你只在自家網站有內容。AI 透過 RAG 搜索找不到第二、三個獨立 domain confirm → 判定「未經多源驗證」→ 不主動引用。修復路徑 6-12 個月。
🌍 4.4 平台覆蓋空白(只 cover 主流)
ChatGPT 引用率 8%,Perplexity 12%,中國 AI 平均 0% —— 整體 GEO 分數虛高, 但實際在亞洲 / 中國市場毫無存在感。
6. 19 平台引用率分布 —— 真實監測數據
下面是百原 GEO 平台監測的部分公開可分享統計(per-platform 行為差異):
圖 3:19 AI 平台訊號依賴熱力圖
RAG 即時搜尋 / 訓練語料 / SEO 信號依賴(0-5 級)— 同色越深代表越依賴此訊號源
| 平台 | RAG 依賴 | 訓練依賴 | SEO 依賴 |
|---|---|---|---|
| 🌐 GLOBAL 平台(9) | |||
| Perplexity | 極高 | 低 | 高 |
| Bing AI / Copilot | 高 | 中 | 高 |
| Google AI Overview | 高 | 中 | 極高 |
| ChatGPT(含 search) | 中 | 高 | 中 |
| Grok | 中 | 高 | 低 |
| Gemini | 中 | 高 | 中 |
| Claude | 極低 | 極高 | 極低 |
| Meta AI | 低 | 高 | 極低 |
| You.com | 高 | 低 | 中 |
| 🇨🇳 CHINA 平台(10) | |||
| DeepSeek | 極低 | 極高 | 極低 |
| Qwen(通義千問) | 極低 | 極高 | 極低 |
| Kimi(月之暗面) | 極低 | 極高 | 極低 |
| 智譜(GLM) | 極低 | 極高 | 極低 |
| MiniMax | 極低 | 極高 | 極低 |
| 豆包(字節) | 極低 | 極高 | 極低 |
| 百川(Baichuan) | 極低 | 極高 | 極低 |
| 文心一言(百度) | 低 | 極高 | 低 |
| Mimo(小米) | 極低 | 極高 | 極低 |
| 訊飛星火 | 極低 | 極高 | 極低 |
關鍵觀察:中國 AI 平台幾乎完全依賴訓練語料(訓練依賴全 5/5),對 SEO 信號近乎免疫 —— 想進中文市場必須走 ingestion 長線(6-12 個月)。
戰略含義:
- 單一平台優化策略已死。對 Perplexity 強並不等於對 Claude 強。
- 中國 AI 平台(DeepSeek / Qwen / Kimi 等)幾乎完全依賴訓練語料, 對 SEO 信號近乎免疫 —— 想進這市場必須走 ingestion 長線。
- Claude / DeepSeek 等對話型 AI 對你品牌的認知幾乎全來自訓練語料 —— 能不能在這類平台被提及,取決於 6-12 個月前的內容布局。
7. GEO 跟 SEO 真實的關係 —— 不是地基跟建築
市面上把 SEO 跟 GEO 形容成「地基跟建築」是過時的二維思考。實際觀察是 GEO 跟 SEO 是部分重疊但獨立演化的兩個系統:
SEO 是「Google 一張嘴的對話」,GEO 是「19 張嘴(每個 AI 都是一張)的對話集合」
| 比較項 | SEO | GEO |
|---|---|---|
| 對話主體 | Google + Bing(2 個搜尋引擎) | 19 個 AI 平台 |
| 獨有信號 | dwell time / CTR / page speed | Citation graph / Trust / Ingestion |
| 對 hallucination 的態度 | 不關心 | 核心指標 |
| 修復速度 | 數週起跳 | 即時到 12 個月 |
| 受眾意圖 | 主動搜尋 | 詢問場景(不一定提品牌名) |
對不同類型企業的策略配重建議:
- 媒體 / 內容業:SEO 80% + GEO 20%(流量仍 Google 主導)
- B2B / 專業服務:SEO 50% + GEO 50%(被 AI 主動推薦 ROI 極高)
- B2C 消費品:SEO 60% + GEO 40%(問答場景 AI 越來越重要)
- 製造業 / 工業:SEO 30% + GEO 70%(專業 buyer 大量用 AI 搜尋)
8. 5 階段 GEO 成熟度自評
把 GEO 拆成 5 個成熟度階段,你可以快速定位自己:
Stage 0 — AI 盲區(citation rate < 5%)
19 平台中超過 15 個品牌引用率 < 5%。AI 基本「不認識你」。
下一步:30 天 baseline audit + 修補 Trust Score(消除矛盾)
Stage 1 — 偶爾露面(citation rate 5-15%)
主流平台偶爾引用但不穩定。中國 AI 平台 0%。
下一步:結構化資料布局 + Citation graph 擴張(Wikipedia / 行業 wiki)
Stage 2 — 穩定主流(citation rate 15-25%)
5-8 個主流平台穩定引用,跨平台描述一致性中等。
下一步:擴展中國 AI 監測 + 投資 Ingestion 長線
Stage 3 — 跨平台一致認知(citation rate 25-40%)
15+ 平台都認識你,描述基本一致,hallucination rate < 5%。
下一步:競品比對戰場 + category 主導性訊號建立
Stage 4 — Category 主導(citation rate > 40%)
「最佳 X 是什麼」答案中你被 AI 列為首選或前 3。
下一步:防守戰 + 跨 category 擴張
9. 常見問題 FAQ
Q1: GEO 多久看到效果?
即時面向(Citation graph 修補、Schema.org 補完、hallucination 修復)2-6 週可見變化。長期面向(Ingestion 進訓練語料)需 6-12 個月。
Q2: GEO 跟 SEO 哪個比較重要?
依產業而定。媒體業 SEO 仍占主導;B2B / 製造業 GEO 已比 SEO 重要;B2C 大概各半。但長期趨勢 GEO 占比都會上升。
Q3: 中小企業也需要做 GEO 嗎?
比大企業更需要。AI 推薦是「贏者全拿」遊戲 —— 大品牌靠歷史聲量自然進 AI 認知,中小企業若不做 GEO 永遠不會被提及。
Q4: 怎麼測量 GEO 成效?
3 層量化:輸入端(AI 爬蟲是否成功讀到你內容)、處理端(每平台引用率)、結果端(轉介到你網站的 AI traffic / 對話次數)。三層都需要監測。
Q5: GEO 會被 AI 平台禁止嗎?
合法 GEO(優化結構化資料 / 修復矛盾 / 補強 Citation graph)完全合規。被禁的是「AI 投毒」(批量發佈虛假軟文欺騙 AI),那是違法行為,跟 GEO 是兩個概念。
Q6: 為什麼用戶搜我品牌名,AI 還是答不準?
最常見 4 原因:(1)Wikipedia / LinkedIn / Crunchbase 等高權重來源資訊未完整或矛盾;(2)Schema.org markup 缺失;(3)llms.txt 不存在;(4)某次 AI 訓練時你網站還沒更新。
Q7: 競品被 AI 主動推薦,我沒被,怎麼辦?
做 prompt-level audit —— 列出 50+ 個你領域常見場景,測你 vs 競品被 AI 提及率。差距通常出在 Citation graph 多元性或 Prompt Visibility 廣度,而非品牌大小。
Q8: 中國 AI 平台(DeepSeek / Qwen 等)值得監測嗎?
若目標客戶含中國 / 東南亞華語市場,必須監測。中國 AI 平台對訓練語料依賴極高,SEO 信號近乎免疫 —— 不專門針對性布局,在這些平台會永遠是 0% 引用率。
Q9: GEO 跟 brand mention monitoring 差別?
Brand monitoring 只看「品牌名被提及」(社交 / 新聞 / 論壇);GEO 看「在 AI 生成答案的瞬間有沒有被引用」+「引用得對不對」+「跨平台一致嗎」。前者是輸入訊號之一,後者是輸出結果。
Q10: AI 訓練語料怎麼影響我?
每一次主流 LLM 訓練 cut-off 日期前的 6 個月,你網路上的內容會「進到模型腦中」。錯過這 window,要等下一輪訓練(通常半年到一年)。這是 GEO 最強馬太效應 —— 早布局的品牌會持續被 AI 記得。
10. 30 天 AI 認知 audit 行動 checklist
不需要一開始就買工具,先用以下 4 週 audit 抓清楚你的位置:
Week 1 — Baseline measurement
- 列 30-50 個你領域常見 prompt scenarios
- 在主流 AI 平台各跑一次
- 紀錄:是否被提及 / 位置 / 內容正確性
Week 2 — Gap analysis
- 對齊 5 維度框架打 0-10 分
- 找出最低分維度(quick win 機會)
Week 3 — Fix critical issues
- 矛盾事實先修(Trust Score 即時提分)
- Schema.org 補完(Visibility 即時提分)
- llms.txt + brand_faq.json 建立
Week 4 — Re-measure + verify
- 重跑 Week 1 同樣 scenarios
- 關鍵指標若提升,方向對
- 沒提升通常 Citation graph 太薄,需 3-6 個月長線
本文觀點來自百原 GEO 平台監測 19 個 AI 引擎、累積 3,366+ 個品牌幻覺偵測案例、 達成 86% 自動修復率的真實 PROD 數據。
想看你品牌在 19 平台的實際引用情況?
免費 7 天試用 →