為什麼「語言自然度」會獨立成一個維度?
過去兩年 LLM 大量自動生成「為了排名而寫」的灌水內容——同質化嚴重、套話密度高、缺乏具體性。AI 廠商很快開始反制:訓練 reranking 模型時加入「自然度判讀」,把疑似 LLM 套式的內容降權。
直接結論:即使內容主題相關、結構正確,但語氣套式被偵測到,引用機率會大幅降低。
GeoWeb 在 M3-14 加入「語言自然度」維度(6% 權重),用 7 個子指標模擬 AI 廠商的判讀邏輯。下面逐項說明。
子指標 1:套話密度(18% 權重)
偵測什麼
預定義一份「LLM 套話 phrase bank」,包含中英雙語約 80 個常見短語:
- 中文:「在當今這個」「綜上所述」「值得注意的是」「至關重要」「不可忽視」「眾所周知」「毋庸置疑」「讓我們深入了解」「在這個快速變化的環境中」…
- 英文:「In today’s digital landscape」「It’s important to note」「In conclusion」「leverage cutting-edge」「unlock the full potential」…
計算每千字命中數。
評分邏輯
- < 1 次/千字:100 分(自然)
- 1–2 次/千字:80 分
- 2–4 次/千字:60 分
- 4–8 次/千字:35 分
-
8 次/千字:10 分(高度疑似 LLM 套式)
為什麼權重最高
這是最強的單一信號——一個自然寫作的人不會在每段都用這些套話。命中率高 = 高度疑似生成內容。
子指標 2:段落開頭重複度(15%)
偵測什麼
連續段落是否用相同 transition 詞開頭:「首先…其次…再者…最後…」「另外…此外…再者…最後…」。
為什麼重要
AI 生成內容很愛這種「教科書式硬結構」。真人專家寫文章時會混用問句、案例、引述、定義等多種開頭——多樣性是真人特徵。
評分標準
最常見開頭詞的出現比例:
- < 8%:自然(多樣化)
- 8–15%:稍微單調
- 15–30%:明顯重複
-
30%:教科書式硬結構
子指標 3:句法多樣性(15%)
偵測什麼
三個獨立子指標合成:
- 句長變異係數(CV):句子長度的標準差/平均。CV 高 = 長短交錯
- 句末標點熵(entropy):「。!?」分布的 Shannon entropy
- 長句比例:> 50 字句子的占比
為什麼重要
LLM 生成內容的句長分布常呈現「集中化」——多數句子長度落在某個窄區間(通常 25–35 字)。真人寫作會有極短句(強調用)和極長句(複合論述)混雜。
子指標 4:局部詞彙循環(12%)
偵測什麼
用 100 字滑動視窗,計算每個視窗內的「unique 詞數 / 總詞數」(type-token ratio)。
為什麼重要
LLM 在生成時容易在小範圍內反覆用同義詞——「提供 / 提升 / 改善 / 優化 / 強化」會在同一段內各出現一次。真人較少這樣。
為什麼用滑動視窗而不是全文統計
全文 TTR 在長文章中天然偏低(因為總詞彙會循環使用)。滑動視窗的局部 TTR 更能精準偵測「同段反覆」這個 LLM 特徵。
子指標 5:具體 vs 抽象(18% 權重,與套話並列最高)
偵測什麼
- 具體標記:數字、日期、引述符號(「」”」’)、命名實體
- 抽象標記(hedge words):「許多」「一些」「significantly」「possibly」「generally」「relatively」
計算「具體標記密度 / 抽象標記密度」的比例。
為什麼權重高
這是最能分辨「真實研究 / 案例分享」 vs 「AI 灌水」的信號之一:
- 真實內容:「2024 年 3 月我們服務的 12 家客戶中…」「Princeton 研究在 KDD 2024 提出…」
- AI 灌水:「許多公司在面臨挑戰時…」「研究顯示這對企業有幫助…」
Hedge words 多 = 沒落點的轉述 = 高度疑似生成。
子指標 6:連接詞分布(12%)
偵測什麼
預定義的連接詞詞表(「然而」「因此」「不過」「另外」「此外」「再者」…)出現分布的 Shannon entropy。
為什麼重要
LLM 喜歡反覆用 1–2 個連接詞(最常見:「然而」「因此」「另外」)。真人會自然用各種同義替代,分布更均勻 = entropy 更高。
子指標 7:第一人稱適度性(10%)
偵測什麼
「我們」「In our experience」「我發現」這類第一人稱經驗 marker 的密度。
評分邏輯(parabolic 倒 U 曲線)
- 太少(< 0.5/千字):50 分以下——疏離、像 generic LLM 輸出
- 適中(1–5/千字):100 分——展現 Experience(E-E-A-T 的 E)
- 太多(> 8/千字):50 分以下——自我推銷感過重
不是越多越好。中道才好。
7 個子指標的綜合判讀
GeoWeb 的「語言自然度」分數是這 7 項加權平均。常見組合:
- 真人專家文:套話低 + 具體高 + 第一人稱適中 → 90+
- SEO 灌水文:套話高 + 抽象高 + 段落開頭單調 → 30–
- 混合文(部分 AI 修飾):套話中 + 具體中 → 60–70
為什麼這個維度權重「只有」6%?
LLM 的反 slop 偵測仍在演進中——目前主要 AI 平台對「結構化準備度」的權重高於「語言自然度」。但這個權重會隨時間提高。
我們建議:內容真的是真人專家寫的比「故意把指標調漂亮」重要。靠 prompt engineering 把 LLM 文章調得更像真人——短期可能過得了偵測,但 AI 廠商的偵測模型也在更新。長期靠真人寫作 + 真實案例 + 具體數據才安全。
健檢看你的語言自然度
👉 免費 GEO 健檢 — 「語言自然度」維度會逐項列出 7 個子指標分數,並指出哪幾項拖累整體。
如果你的網站內容需要批量調整以達到自然度標準(含內容重寫策略、寫手指引、自動化偵測流程),我們提供 GEO 顧問服務:[email protected]
GEO 深度系列 #15。前一篇:「12 維度逐項拆解:FAQ/Q&A 就緒度的 5 個檢查點」