詳細解釋
AI 系統在面對輸入變化、噪聲、攻擊或環境變化時保持性能和穩定的能力,是從實驗室走向生產的關鍵指標。
魯棒性類型:
- 輸入魯棒性:噪聲、模糊、裁剪下的識別能力
- 對抗魯棒性:抵抗故意設計的對抗樣本
- 分布魯棒性:訓練分布與測試分布不同時仍表現良好
- 語義魯棒性:同義詞替換、語法變化不改變輸出
評估方法:
- 對抗性測試:FGSM、PGD、AutoAttack 生成攻擊樣本
- 壓力測試:極端輸入、邊界情況、長尾分布
- A/B 測試:生產環境的真實用戶行為
提升技術:
- 數據增強:訓練時加入變換,提升泛化
- 對抗訓練:在訓練中加入對抗樣本
- 集成方法:多模型投票,降低單點失效
- 預處理正規化:輸入標準化減少敏感度
- 檢測與防禦:識別異常輸入並拒絕
生產考量:
- 輸入驗證:API 層過濾明顯錯誤輸入
- 異常監控:追踪預測置信度分布變化
- 降級策略:高不確定時切換到安全默認
- 人類接管:關鍵決策保留人工審核
與準確率的區別:
- 準確率:乾淨測試集上的平均性能
- 魯棒性:惡劣條件下的最差情況性能
- 魯棒性好的模型,準確率通常也高
行業重要性:
- 自動駕駛:魯棒性 = 生命安全
- 金融:魯棒性 = 避免巨額損失
- 醫療:魯棒性 = 防止誤診
這是「可靠 AI」的核心—— 不僅要「通常對」,還要「總是合理」。