← 部落格

12 維度逐項拆解:語言自然度的 7 個子指標

#GEO #content quality #language naturalness #anti-AI-slop

為什麼「語言自然度」會獨立成一個維度?

過去兩年 LLM 大量自動生成「為了排名而寫」的灌水內容——同質化嚴重、套話密度高、缺乏具體性。AI 廠商很快開始反制:訓練 reranking 模型時加入「自然度判讀」,把疑似 LLM 套式的內容降權。

直接結論:即使內容主題相關、結構正確,但語氣套式被偵測到,引用機率會大幅降低

GeoWeb 在 M3-14 加入「語言自然度」維度(6% 權重),用 7 個子指標模擬 AI 廠商的判讀邏輯。下面逐項說明。

子指標 1:套話密度(18% 權重)

偵測什麼

預定義一份「LLM 套話 phrase bank」,包含中英雙語約 80 個常見短語:

計算每千字命中數。

評分邏輯

為什麼權重最高

這是最強的單一信號——一個自然寫作的人不會在每段都用這些套話。命中率高 = 高度疑似生成內容。

子指標 2:段落開頭重複度(15%)

偵測什麼

連續段落是否用相同 transition 詞開頭:「首先…其次…再者…最後…」「另外…此外…再者…最後…」。

為什麼重要

AI 生成內容很愛這種「教科書式硬結構」。真人專家寫文章時會混用問句、案例、引述、定義等多種開頭——多樣性是真人特徵。

評分標準

最常見開頭詞的出現比例:

子指標 3:句法多樣性(15%)

偵測什麼

三個獨立子指標合成:

為什麼重要

LLM 生成內容的句長分布常呈現「集中化」——多數句子長度落在某個窄區間(通常 25–35 字)。真人寫作會有極短句(強調用)和極長句(複合論述)混雜。

子指標 4:局部詞彙循環(12%)

偵測什麼

用 100 字滑動視窗,計算每個視窗內的「unique 詞數 / 總詞數」(type-token ratio)。

為什麼重要

LLM 在生成時容易在小範圍內反覆用同義詞——「提供 / 提升 / 改善 / 優化 / 強化」會在同一段內各出現一次。真人較少這樣。

為什麼用滑動視窗而不是全文統計

全文 TTR 在長文章中天然偏低(因為總詞彙會循環使用)。滑動視窗的局部 TTR 更能精準偵測「同段反覆」這個 LLM 特徵。

子指標 5:具體 vs 抽象(18% 權重,與套話並列最高)

偵測什麼

計算「具體標記密度 / 抽象標記密度」的比例。

為什麼權重高

這是最能分辨「真實研究 / 案例分享」 vs 「AI 灌水」的信號之一:

Hedge words 多 = 沒落點的轉述 = 高度疑似生成。

子指標 6:連接詞分布(12%)

偵測什麼

預定義的連接詞詞表(「然而」「因此」「不過」「另外」「此外」「再者」…)出現分布的 Shannon entropy。

為什麼重要

LLM 喜歡反覆用 1–2 個連接詞(最常見:「然而」「因此」「另外」)。真人會自然用各種同義替代,分布更均勻 = entropy 更高。

子指標 7:第一人稱適度性(10%)

偵測什麼

「我們」「In our experience」「我發現」這類第一人稱經驗 marker 的密度。

評分邏輯(parabolic 倒 U 曲線)

不是越多越好。中道才好。

7 個子指標的綜合判讀

GeoWeb 的「語言自然度」分數是這 7 項加權平均。常見組合:

為什麼這個維度權重「只有」6%?

LLM 的反 slop 偵測仍在演進中——目前主要 AI 平台對「結構化準備度」的權重高於「語言自然度」。但這個權重會隨時間提高。

我們建議:內容真的是真人專家寫的比「故意把指標調漂亮」重要。靠 prompt engineering 把 LLM 文章調得更像真人——短期可能過得了偵測,但 AI 廠商的偵測模型也在更新。長期靠真人寫作 + 真實案例 + 具體數據才安全。

健檢看你的語言自然度

👉 免費 GEO 健檢 — 「語言自然度」維度會逐項列出 7 個子指標分數,並指出哪幾項拖累整體。

如果你的網站內容需要批量調整以達到自然度標準(含內容重寫策略、寫手指引、自動化偵測流程),我們提供 GEO 顧問服務:[email protected]


GEO 深度系列 #15。前一篇:「12 維度逐項拆解:FAQ/Q&A 就緒度的 5 個檢查點」