← 技術文章 想「不被 AI 訓練」?你有這些工具,但每個都有但書
1 分鐘閱讀322 次閱讀

想「不被 AI 訓練」?你有這些工具,但每個都有但書

#GEO #AI opt-out #robots.txt #AIPREF #noai

沒有一個「關掉」按鈕

想 opt-out AI 訓練,方法不少,但分散、各管一段:

機制 管什麼 但書
robots.txt(AI UA) 哪隻爬蟲能抓哪些路徑 靠自願;小爬蟲不甩
AIPREF Content-Usage 標準化「訓練 vs 搜尋」偏好 投遞草案 2026/5 已過期,尚無 RFC
noai / noimageai meta 頁面級「別拿去訓練」 非標準;大廠多半遵守
W3C TDMRep /.well-known 宣告訓練保留,有 EU 法源 仍是 CG 報告
trust.txt datatrainingallowed 站台級訓練保留 主流 AI 未強制遵循
IPTC 最佳實務 把上述綁成發布者套裝 是指引,不是新權力
CC Signals 互惠/署名訴求 試點、無強制力

共同的但書:全靠自願

這些機制沒有一個有法律或技術強制力,全靠爬蟲自願遵守。大廠通常會認 robots 與 noai,小爬蟲照抓不誤。連最想做成正式標準的 AIPREF,可部署的那半草案到 2026/5 都過期了——這層離「定案」還很遠。

最大的陷阱:opt-out 過頭=自傷

「擋訓練」跟「保留被引用」是兩回事。很多人為了擋訓練,把搜尋/引用 bot 一起擋了,結果從 AI 答案裡消失而不自知(見 別擋錯 bot)。動手前先想清楚:你要擋的是「訓練」,還是「全部」?

務實建議

真要擋訓練,挑大廠認的機制(robots 的 AI UA + noai)做好就夠,別貪多;務必放行搜尋 bot。其餘新標準(TDMRep、CC Signals、IPTC)知道有就好,別為了它們重做網站。opt-out 設太細太雜,維護成本高、又容易誤傷——這也是該交給人定期對照、而非設一次就忘的原因。

這篇有共鳴嗎?

16 人回應了這篇

討論 19