詳細解釋
Perplexity 指標是語言模型的標準評估指標,衡量模型預測下一個詞的不確定性,可理解為模型在選擇下一個詞時面臨的平均「選擇數」。數值越低表示模型預測越準。
定義:
- PP(W) = exp(-1/N Σ log P(w_i|w_1...w_{i-1}))
- 幾何平均的倒數
- 與交叉熵指數相關
解釋:
- Perplexity 100 ≈ 每次面臨 100 個等可能選擇
- 越低越好
- 人類水平:約 100(英語)
與交叉熵:
- 數學等價:最小化交叉熵 ≡ 最小化 Perplexity
- Perplexity 更易直觀解釋
應用:
- 語言模型:GPT、BERT 評估
- 機器翻譯:目標語言 Perplexity
- 語音識別:語言模型評估
- 主題模型:LDA 評估
注意事項:
- 不可比較不同詞表
- 受詞表大小影響
- 長度歸一化:處理不同長度
(本條目為評估指標;若要找搜尋型 AI 產品請見 Perplexity AI。)