標籤平滑

Label Smoothing

軟化硬標籤以減輕過擬合的技術

詳細解釋

標籤平滑(Label Smoothing)是一種正則化技術,將硬標籤(0/1)替換為軟標籤(如0.1/0.9),防止模型過度自信並提升泛化能力。

核心思想:

  • 硬標籤:[0, 1, 0] 表示絕對確定
  • 軟標籤:[0.1, 0.8, 0.1] 保留小概率給其他類
  • 防止過度擬合訓練數據的標籤噪聲
  • 鼓勵模型產生更平滑的概率分布

數學表達:

y' = (1 - ε) × y + ε / K

  • y:原始標籤(one-hot)
  • ε:平滑參數(通常0.1)
  • K:類別數
  • y':平滑後的標籤

為何有效:

  • 正則化效果:懲罰過度自信的預測
  • 防止過擬合:不強迫模型記住訓練標籤
  • 校準:改善模型概率的校準性(信心=準確率)
  • 泛化提升:在多個任務上驗證有效

應用場景:

與其他正則化的關係:

注意事項:

  • ε過大:模型信心不足
  • ε過小:效果不明顯
  • 類別不平衡:可能需要調整策略
  • 知識蒸餾:與教師模型軟標籤類似

標籤平滑是提升分類模型泛化的簡單有效技術。

探索更多AI詞彙

查看所有分類,繼續學習AI知識