為什麼 Wikipedia 收錄是 GEO 的最強信號之一？

#GEO #Wikipedia #training data #brand authority

LLM 訓練語料中，Wikipedia 是「第一公民」

研究 LLM 訓練資料的人都知道一個共識：

Wikipedia 在主流大型語言模型的訓練語料中，比重遠高於其他單一網站。

OpenAI、Anthropic、Google、Meta 等廠商在訓練 GPT、Claude、Gemini、Llama 時都大量使用 Wikipedia 內容。理由：

內容經過編輯共識（多人審查）
結構化（有 infobox、citation）
持續更新
完全免費可商用（CC BY-SA）
多語言齊全

這代表：被 Wikipedia 收錄的品牌，在 LLM 的「腦袋裡」有一個專屬條目。當使用者問相關問題時，LLM 直接從這個條目產生回答。

一個直觀對比

打開 ChatGPT，問兩家公司的差別：

「介紹一下 OpenAI 跟 Apple」

LLM 會給出豐富的回答——因為兩家都有 Wikipedia 條目，訓練時 LLM 已經把它們的歷史、產品、創辦人、主要事件都「記下來」。

換成：

「介紹一下我朋友的咖啡店『慢意手作 coffee』」

LLM 會說「我沒這個品牌的資訊」——因為它從來沒在訓練語料中看過這個品牌。

差別不是「品牌好不好」，是「進不進得了 LLM 的訓練腦」。

為什麼 GeoWeb 把 Wikipedia 列為站外能見度的第一信號

GeoWeb 的「站外能見度」（不計入 GEO 體質總分，獨立計算）有 5 個子信號：

信號	權重	為什麼重要
Wikipedia 收錄	25%	LLM 訓練語料最大來源
Wayback Machine 歷史	20%	網站長期存在的證據
Domain 註冊年資	20%	品牌年資與穩定性
DuckDuckGo 知識圖譜	15%	公開知識庫的實體匹配
AI 平台回測度	20%	直接量測 LLM 引用率

Wikipedia 是權重最高的信號——因為它的影響跨「訓練資料」與「即時引用」兩個層面，且難以造假。

你不能「買」Wikipedia 條目

Wikipedia 是反商業化最徹底的網站之一：

編輯利益衝突政策：自己（或受雇）編輯自家品牌條目會被反查、條目被刪
可信來源原則：條目內容必須有第三方可信來源支持，不能引用品牌官網
顯著性原則（notability）：品牌必須達到某種「值得收錄」的門檻——通常需要多家獨立媒體報導

這代表 Wikipedia 收錄不能花錢買，只能慢慢建立顯著性 + 等社群編輯來寫。

建立 Wikipedia 條目的合法路徑

不能自己寫，那能做什麼？

1. 累積媒體報導（基礎工程）

獲得 3–5 篇以上獨立媒體（不是付費業配）的報導。Wikipedia 編輯查 notability 時會找這些當引用。

媒體類型：

主流新聞（聯合報、自由時報、商業周刊、天下、數位時代等）
產業專業媒體
學術期刊或會議

避免：付費置入、品牌公關稿、自家部落格、個人 KOL 業配。

2. 累積客觀第三方提及

政府公開資料（公司登記、產業統計）
行業協會出版品
學術論文引用
相關書籍提到的章節

3. 等社群編輯來寫，或請他們協助

當前面兩項累積到一定量，常會自然有編輯者注意到品牌並建立條目。也可以參與相關 WikiProject 社群，誠實揭露利益關係（COI）後請第三方編輯協助。

4. 提供高品質媒體資源

維護一頁「媒體與學術引用」（Press / About）列出所有報導與學術提及——這是編輯者建立條目時的第一手資料。

短期 vs 長期策略

短期（6 個月內無法達成）：

Wikipedia 條目通常需要 6–24 個月累積
但同一時間可以做的：補強其他 4 個站外能見度信號
Wayback Machine：主動提交 archive
DuckDuckGo：透過 Wikidata 條目（門檻較低）建立實體

長期（1–3 年）：

持續媒體公關
累積學術引用
建立行業協會 / 論壇 / 開放資料貢獻

健檢看你的站外能見度起點

👉 免費 GEO 健檢 — 站外能見度區塊會逐項顯示：

Wikipedia 是否有條目（含名稱衝突偵測）
Wayback 首次存檔時間
Domain 註冊年資
DuckDuckGo 是否識別此實體

這 4 個信號決定你品牌在 AI 訓練語料中的「身分」是否成立。

如果你需要長期媒體公關 + Wikipedia 條目策略規劃，我們提供 GEO 顧問服務含這部分執行：[email protected]

GEO 進階系列 #11。前一篇：「內容可引用性：什麼樣的段落 AI 才願意拿來用？」

這篇有共鳴嗎？

161 人回應了這篇

討論 26

D
data_nerd_tw會員1 個月前
想問一下那個25% 的權重是怎麼定出來的?表格裡wikipedia 25、wayback 20、domain 20這些數字感覺很精準，是有實驗數據還是團隊抓個感覺?
- C
  策略長 Clarence作者3 週前
  老實說一開始是抓感覺😅 我們先依對llm影響的層面數排序，wikipedia同時吃到訓練語料 + 即時引用兩層，所以給最高;wayback / domain是存在證據性質、量級接近就並列20%。後來才用一批客戶站的實測結果回頭微調。所以它是有依據的主觀，不是跑出某個神奇公式得到的，這點我不想唬你。
電
電商苦主會員6 個月前
實務問一下，文章說自己編自家條目會被反查刪掉，那像我們這種連notability門檻都搆不到的小電商，是不是根本不用想維基這條路，直接把資源放在schema跟自己官網就好?
做
做內容的小郭會員4 個月前
補充一個文章沒講的:Wikipedia條目被建立後也不是放著就好，如果來源失效或被掛notability模板還是會被提刪，要持續維護的
電
電商苦主會員6 個月前
聽下來結論就是notability門檻搆得到的品牌才玩得起這套，我們這種小電商連邊都摸不到，geo到頭來還是拼家底ㄏㄏ
做
做SEO的阿宏會員5 個月前
先收藏，正在幫客戶評估要不要砸資源弄Wikipedia，這篇剛好
N
newbie2026會員1 個月前
短期策略那段說Wikidata門檻較低可以先做，但Wikidata不也要有來源跟notability嗎?跟直接弄Wikipedia差在哪?
- C
  策略長 Clarence作者1 個月前
  差在"結構化實體"vs"百科文章"。wikidata收的是一筆筆事實(這家公司、成立年、領域)，它對來源的嚴格度跟"要不要值得寫成一篇文章"的門檻，比wikipedia正文低不少，duckduckgo那種知識圖譜也吃wikidata。所以它常是先有wikidata實體、媒體報導累積夠了、wikipedia條目才水到渠成。順序別反過來。
喵
喵會員6 個月前
進不進得了llm的訓練腦這句蠻精準的，以前都只想到seo排名，沒想過品牌是不是根本沒被記進去==
做
做SEO的阿宏會員4 小時前
schema / JSON-LD那種站內結構化我懂，但Wikipedia這種純站外信號第一次看人講權重，蠻新的角度推
老
老闆叫我來看的會員4 個月前
那個『慢意手作coffee』的例子笑死，我也拿我們公司名字問過AI，它直接說沒資料QQ原來不是它笨是我們根本沒進語料，這下要怎麼跟老闆解釋比較好
竹
竹科工程師會員7 個月前
等等所以cc by-sa那點是重點吧?因為免費可商用各家才敢大量拿去訓練，如果wikipedia是付費或限制授權根本進不了語料，文章好像輕輕帶過
加
加盟總部會員6 個月前
母湯啦，叫中小企業去拼三五篇主流新聞報導，那個門檻根本不是一般老闆做得到的，這篇比較適合已經有點規模的品牌看
蝦
蝦皮賣家小美會員7 個月前
ddg知識圖譜那項15% 老實說我第一次知道它跟wikidata綁這麼緊，平常根本沒在管duckduckgo，長知識
區
區域行銷SamVIP7 個月前
我自己接案做在地服務業的，客戶就是小吃店、做工程的，這種一輩子也上不了三五篇主流媒體吧，那這篇等於跟我們無關?
- C
  策略長 Clarence作者7 個月前
  不會無關，但要誠實:wikipedia那25% 對在地小店確實多半碰不到，別硬攻。你能先把另外幾項顧好，wayback主動存檔、domain年資、wikidata實體、把政府登記/在地報導兜起來，這些對在地業者cp值高很多。我自己看在地案會直接跟客戶說wikipedia先放掉，不丟資源在6-24個月都不見得成的事上。
小
小編會員4 個月前
6-24個月那段很真，我們公司光累積到三篇像樣的獨立報導就搞了快兩年，中間還被退過一次說來源是業配orz
無
無名氏會員7 個月前
半信半疑...真的有人因為「沒有Wikipedia條目」所以AI都查不到他公司嗎?我覺得現在AI不是都會即時上網搜?
- 加
  加盟總部會員6 個月前
  我也半信半疑欸+1 我們連鎖店開十幾年了 Wikipedia條目這種東西聽都沒聽過要去哪申請母湯喔是不是又是一項要補的功課
老
老闆叫我來看的會員3 週前
那個ai平台回測度20% 寫規劃中(暫不計分)，所以現在實際上是只有80% 在算分?那權重表不就怪怪的?
- 顧
  顧問業飄過會員2 週前
  對，目前實際就是wikipedia25+wayback20+domain20+ddg15 = 80% 在跑，圖裡那條虛線框就是還沒上線的意思。我猜它先把欄位佔好是因為這個信號最直接(直接量到llm真的引用你幾次)，但這種東西要穩定量測應該不容易，所以才先掛著不計分。等哪天真的上線，其他幾項權重大概也要跟著重算。
無
無名氏會員2 個月前
看到最後有放健檢連結跟顧問信箱...所以這篇是不是其實就是要賣GEO顧問服務?媒體公關那段也太剛好
- C
  策略長 Clarence作者1 個月前
  哈哈我不否認最後有放服務連結，要恰我也不會裝清高。但媒體公關那段是真的，wikipedia收錄的本質就是先有獨立報導才有條目，這不是我們發明的規則是wikipedia自己的notability/coi政策，你不找我們、自己照這個邏輯做也是對的。健檢那塊是免費的，看你站外四項起點長怎樣，要不要後面找人做隨你。
A
Anna｜品牌行銷會員1 週前
有個地方想吐槽，標題寫最強信號之一結果表格Wikipedia 25% 也才比Wayback/Domain的20% 多5%，這樣叫遠遠最強會不會有點...
P
PM打雜王會員1 週前
文章說不能引用品牌官網當來源，那如果我們公司有發過募資新聞稿、上過一些新聞，但內容其實是我們自己給的，這種算第三方獨立來源嗎?
- C
  策略長 Clarence作者6 天前
  通常不算，這就是文章裡避免:品牌公關稿那條的精神。判斷點不是登在哪，是編輯方有沒有獨立查證跟改寫。你發的稿被原文照登 = 還是你的聲音;但如果記者拿你的題目去採訪、加了第三方觀點重寫，那篇的可信度就高很多。notability審查的人很會分這個。

data_nerd_tw會員1 個月前

想問一下那個25% 的權重是怎麼定出來的?表格裡wikipedia 25、wayback 20、domain 20這些數字感覺很精準，是有實驗數據還是團隊抓個感覺?

C
策略長 Clarence作者3 週前
老實說一開始是抓感覺😅 我們先依對llm影響的層面數排序，wikipedia同時吃到訓練語料 + 即時引用兩層，所以給最高;wayback / domain是存在證據性質、量級接近就並列20%。後來才用一批客戶站的實測結果回頭微調。所以它是有依據的主觀，不是跑出某個神奇公式得到的，這點我不想唬你。

電

電商苦主會員6 個月前

實務問一下，文章說自己編自家條目會被反查刪掉，那像我們這種連notability門檻都搆不到的小電商，是不是根本不用想維基這條路，直接把資源放在schema跟自己官網就好?

做

做內容的小郭會員4 個月前

補充一個文章沒講的:Wikipedia條目被建立後也不是放著就好，如果來源失效或被掛notability模板還是會被提刪，要持續維護的

聽下來結論就是notability門檻搆得到的品牌才玩得起這套，我們這種小電商連邊都摸不到，geo到頭來還是拼家底ㄏㄏ

做SEO的阿宏會員5 個月前

先收藏，正在幫客戶評估要不要砸資源弄Wikipedia，這篇剛好

newbie2026會員1 個月前

短期策略那段說Wikidata門檻較低可以先做，但Wikidata不也要有來源跟notability嗎?跟直接弄Wikipedia差在哪?

C
策略長 Clarence作者1 個月前
差在"結構化實體"vs"百科文章"。wikidata收的是一筆筆事實(這家公司、成立年、領域)，它對來源的嚴格度跟"要不要值得寫成一篇文章"的門檻，比wikipedia正文低不少，duckduckgo那種知識圖譜也吃wikidata。所以它常是先有wikidata實體、媒體報導累積夠了、wikipedia條目才水到渠成。順序別反過來。

喵

喵會員6 個月前

進不進得了llm的訓練腦這句蠻精準的，以前都只想到seo排名，沒想過品牌是不是根本沒被記進去==

做SEO的阿宏會員4 小時前

schema / JSON-LD那種站內結構化我懂，但Wikipedia這種純站外信號第一次看人講權重，蠻新的角度推

老

老闆叫我來看的會員4 個月前

那個『慢意手作coffee』的例子笑死，我也拿我們公司名字問過AI，它直接說沒資料QQ原來不是它笨是我們根本沒進語料，這下要怎麼跟老闆解釋比較好

竹

竹科工程師會員7 個月前

等等所以cc by-sa那點是重點吧?因為免費可商用各家才敢大量拿去訓練，如果wikipedia是付費或限制授權根本進不了語料，文章好像輕輕帶過

加

加盟總部會員6 個月前

母湯啦，叫中小企業去拼三五篇主流新聞報導，那個門檻根本不是一般老闆做得到的，這篇比較適合已經有點規模的品牌看

蝦

蝦皮賣家小美會員7 個月前

ddg知識圖譜那項15% 老實說我第一次知道它跟wikidata綁這麼緊，平常根本沒在管duckduckgo，長知識

區

區域行銷SamVIP7 個月前

我自己接案做在地服務業的，客戶就是小吃店、做工程的，這種一輩子也上不了三五篇主流媒體吧，那這篇等於跟我們無關?

C
策略長 Clarence作者7 個月前
不會無關，但要誠實:wikipedia那25% 對在地小店確實多半碰不到，別硬攻。你能先把另外幾項顧好，wayback主動存檔、domain年資、wikidata實體、把政府登記/在地報導兜起來，這些對在地業者cp值高很多。我自己看在地案會直接跟客戶說wikipedia先放掉，不丟資源在6-24個月都不見得成的事上。

小

小編會員4 個月前

6-24個月那段很真，我們公司光累積到三篇像樣的獨立報導就搞了快兩年，中間還被退過一次說來源是業配orz

無

無名氏會員7 個月前

半信半疑...真的有人因為「沒有Wikipedia條目」所以AI都查不到他公司嗎?我覺得現在AI不是都會即時上網搜?

加
加盟總部會員6 個月前
我也半信半疑欸+1 我們連鎖店開十幾年了 Wikipedia條目這種東西聽都沒聽過要去哪申請母湯喔是不是又是一項要補的功課

老闆叫我來看的會員3 週前

那個ai平台回測度20% 寫規劃中(暫不計分)，所以現在實際上是只有80% 在算分?那權重表不就怪怪的?

顧
顧問業飄過會員2 週前
對，目前實際就是wikipedia25+wayback20+domain20+ddg15 = 80% 在跑，圖裡那條虛線框就是還沒上線的意思。我猜它先把欄位佔好是因為這個信號最直接(直接量到llm真的引用你幾次)，但這種東西要穩定量測應該不容易，所以才先掛著不計分。等哪天真的上線，其他幾項權重大概也要跟著重算。

無名氏會員2 個月前

看到最後有放健檢連結跟顧問信箱...所以這篇是不是其實就是要賣GEO顧問服務?媒體公關那段也太剛好

C
策略長 Clarence作者1 個月前
哈哈我不否認最後有放服務連結，要恰我也不會裝清高。但媒體公關那段是真的，wikipedia收錄的本質就是先有獨立報導才有條目，這不是我們發明的規則是wikipedia自己的notability/coi政策，你不找我們、自己照這個邏輯做也是對的。健檢那塊是免費的，看你站外四項起點長怎樣，要不要後面找人做隨你。

Anna｜品牌行銷會員1 週前

有個地方想吐槽，標題寫最強信號之一結果表格Wikipedia 25% 也才比Wayback/Domain的20% 多5%，這樣叫遠遠最強會不會有點...

PM打雜王會員1 週前

文章說不能引用品牌官網當來源，那如果我們公司有發過募資新聞稿、上過一些新聞，但內容其實是我們自己給的，這種算第三方獨立來源嗎?

C
策略長 Clarence作者6 天前
通常不算，這就是文章裡避免:品牌公關稿那條的精神。判斷點不是登在哪，是編輯方有沒有獨立查證跟改寫。你發的稿被原文照登 = 還是你的聲音;但如果記者拿你的題目去採訪、加了第三方觀點重寫，那篇的可信度就高很多。notability審查的人很會分這個。