詳細解釋
溫度縮放(Temperature Scaling)是調整模型輸出機率分布溫度的後處理方法,常用於模型校準。
與生成時溫度的區別:
- 生成溫度:採樣時調整
- 溫度縮放:訓練後校準調整
應用:
- 模型校準:讓機率更準確反映信心
- 知識蒸餾:軟目標溫度調整
- 對抗魯棒性:平滑決策邊界
數學:
- p_i = exp(z_i/T) / Σexp(z_j/T)
- T=1:原始機率
- T<1:更尖銳,更確定
- T>1:更平坦,更保守
校準目標:
- 完美校準:信心=準確率
- 例如:模型說80%信心,實際80%正確
- 深度網絡常過度自信,T>1改善
與Label Smoothing的關係:
- 都是軟化目標的方法
- 溫度縮放:後處理
- Label Smoothing:訓練時
簡單有效的模型改進技術。