對數似然

Log-Likelihood

模型擬合數據的對數機率

詳細解釋

對數似然(Log-Likelihood)是統計和機器學習中評估模型參數的核心函數,表示模型對觀測數據的解釋能力。

似然函數:

  • L(θ|X) = P(X|θ):給定參數θ,觀測到數據X的概率
  • 對數似然:ℓ(θ) = log L(θ|X)
  • 為何取對數:
  • 數值穩定:避免概率連乘下溢
  • 簡化計算:乘積變求和
  • 單調性:最大化似然 = 最大化對數似然

最大似然估計(MLE):

  • 尋找使對數似然最大的參數
  • θ̂ = argmax ℓ(θ|X)
  • 直觀:選擇使觀測數據最可能的參數

與損失函數的關係:

  • 最大化對數似然 = 最小化負對數似然
  • 負對數似然作為損失函數
  • 交叉熵 = 負對數似然(分類任務)
  • MSE ∝ 負對數似然(高斯噪聲假設下的回歸)

應用場景:

  • 邏輯回歸:最大化對數似然
  • 線性回歸:最小化MSE等價於MLE(高斯誤差假設)
  • 混合模型:EM算法最大化對數似然
  • 語言模型:最大化序列的對數概率
  • 貝葉斯推斷:對數後驗 = 對數似然 + 對數先驗

性質:

  • 一致性:樣本量大時收斂到真實參數
  • 漸近正態:大樣本下估計量近似正態分布
  • 效率:達到Cramér-Rao下界(最小方差)

對數似然是統計建模和機器學習的基石。

探索更多AI詞彙

查看所有分類,繼續學習AI知識