想「不被 AI 訓練」？你有這些工具，但每個都有但書

#GEO #AI opt-out #robots.txt #AIPREF #noai

沒有一個「關掉」按鈕

想 opt-out AI 訓練，方法不少，但分散、各管一段：

機制	管什麼	但書
robots.txt（AI UA）	哪隻爬蟲能抓哪些路徑	靠自願；小爬蟲不甩
AIPREF `Content-Usage`	標準化「訓練 vs 搜尋」偏好	投遞草案 2026/5 已過期，尚無 RFC
`noai` / `noimageai` meta	頁面級「別拿去訓練」	非標準；大廠多半遵守
W3C TDMRep	`/.well-known` 宣告訓練保留，有 EU 法源	仍是 CG 報告
trust.txt `datatrainingallowed`	站台級訓練保留	主流 AI 未強制遵循
IPTC 最佳實務	把上述綁成發布者套裝	是指引，不是新權力
CC Signals	互惠／署名訴求	試點、無強制力

共同的但書：全靠自願

這些機制沒有一個有法律或技術強制力，全靠爬蟲自願遵守。大廠通常會認 robots 與 noai，小爬蟲照抓不誤。連最想做成正式標準的 AIPREF，可部署的那半草案到 2026/5 都過期了——這層離「定案」還很遠。

最大的陷阱：opt-out 過頭＝自傷

「擋訓練」跟「保留被引用」是兩回事。很多人為了擋訓練，把搜尋／引用 bot 一起擋了，結果從 AI 答案裡消失而不自知（見別擋錯 bot）。動手前先想清楚：你要擋的是「訓練」，還是「全部」？

務實建議

真要擋訓練，挑大廠認的機制（robots 的 AI UA + noai）做好就夠，別貪多；務必放行搜尋 bot。其餘新標準（TDMRep、CC Signals、IPTC）知道有就好，別為了它們重做網站。opt-out 設太細太雜，維護成本高、又容易誤傷——這也是該交給人定期對照、而非設一次就忘的原因。

這篇有共鳴嗎？

52 人回應了這篇

想「不被 AI 訓練」？你有這些工具，但每個都有但書

沒有一個「關掉」按鈕

共同的但書：全靠自願

最大的陷阱：opt-out 過頭＝自傷

務實建議

討論 0