穩健性

Robustness

模型面對干擾或異常輸入仍保持正確的能力

詳細解釋

AI 系統在面對輸入變化、噪聲、攻擊或環境變化時保持性能和穩定的能力,是從實驗室走向生產的關鍵指標。

魯棒性類型:

  • 輸入魯棒性:噪聲、模糊、裁剪下的識別能力
  • 對抗魯棒性:抵抗故意設計的對抗樣本
  • 分布魯棒性:訓練分布與測試分布不同時仍表現良好
  • 語義魯棒性:同義詞替換、語法變化不改變輸出

評估方法:

  • 對抗性測試:FGSM、PGD、AutoAttack 生成攻擊樣本
  • 壓力測試:極端輸入、邊界情況、長尾分布
  • A/B 測試:生產環境的真實用戶行為

提升技術:

  • 數據增強:訓練時加入變換,提升泛化
  • 對抗訓練:在訓練中加入對抗樣本
  • 集成方法:多模型投票,降低單點失效
  • 預處理正規化:輸入標準化減少敏感度
  • 檢測與防禦:識別異常輸入並拒絕

生產考量:

  • 輸入驗證:API 層過濾明顯錯誤輸入
  • 異常監控:追踪預測置信度分布變化
  • 降級策略:高不確定時切換到安全默認
  • 人類接管:關鍵決策保留人工審核

與準確率的區別:

  • 準確率:乾淨測試集上的平均性能
  • 魯棒性:惡劣條件下的最差情況性能
  • 魯棒性好的模型,準確率通常也高

行業重要性:

  • 自動駕駛:魯棒性 = 生命安全
  • 金融:魯棒性 = 避免巨額損失
  • 醫療:魯棒性 = 防止誤診

這是「可靠 AI」的核心—— 不僅要「通常對」,還要「總是合理」。

探索更多AI詞彙

查看所有分類,繼續學習AI知識