Perplexity 指標

Perplexity (metric)

衡量語言模型預測不確定性的評估指標

詳細解釋

Perplexity 指標是語言模型的標準評估指標,衡量模型預測下一個詞的不確定性,可理解為模型在選擇下一個詞時面臨的平均「選擇數」。數值越低表示模型預測越準。

定義:

  • PP(W) = exp(-1/N Σ log P(w_i|w_1...w_{i-1}))
  • 幾何平均的倒數
  • 與交叉熵指數相關

解釋:

  • Perplexity 100 ≈ 每次面臨 100 個等可能選擇
  • 越低越好
  • 人類水平:約 100(英語)

與交叉熵:

  • 數學等價:最小化交叉熵 ≡ 最小化 Perplexity
  • Perplexity 更易直觀解釋

應用:

  • 語言模型:GPT、BERT 評估
  • 機器翻譯:目標語言 Perplexity
  • 語音識別:語言模型評估
  • 主題模型:LDA 評估

注意事項:

  • 不可比較不同詞表
  • 受詞表大小影響
  • 長度歸一化:處理不同長度

(本條目為評估指標;若要找搜尋型 AI 產品請見 Perplexity AI。)

探索更多AI詞彙

查看所有分類,繼續學習AI知識