損失函數 (Loss Scaling)

Loss Function (Loss Scaling)

衡量模型預測與真實值差異的指標

詳細解釋

損失函數(Loss Function)衡量模型預測與真實值的差距,是優化的目標函數,指導模型參數更新方向。

常見損失函數:

  • 回歸:
  • MSE(均方誤差):連續值
  • MAE(平均絕對誤差):魯棒
  • Huber:結合兩者
  • 分類:
  • 交叉熵:多分類
  • 二元交叉熵:二分類
  • 合頁損失(Hinge):SVM
  • 序列:
  • CTC:語音識別
  • 交叉熵:語言模型

選擇原則:

  • 匹配任務:回歸/分類
  • 匹配輸出:概率/值
  • 考慮異常值:MSE敏感,MAE魯棒
  • 計算效率

與優化的關係:

  • 損失函數定義優化目標
  • 梯度下降最小化損失
  • 損失曲線監測訓練

正則化項:

  • L1/L2:權重懲罰
  • Dropout:隨機失活
  • 早停:間接正則化

損失曲線:

  • 訓練損失:應持續下降
  • 驗證損失:檢測過擬合
  • 收斂:損失穩定

損失函數是訓練的優化目標。

亦稱「Loss Scaling」。

探索更多AI詞彙

查看所有分類,繼續學習AI知識