詳細解釋
F1分數(F1 Score)是分類任務的綜合評估指標,結合精確率(Precision)和召回率(Recall),適合類別不平衡的數據集。
定義:
- F1 = 2 × (Precision × Recall) / (Precision + Recall)
- 精確率和召回率的調和平均數
- 取值範圍 0-1,越高越好
與準確率的對比:
- 準確率:正確預測佔比
- 類別不平衡時可能誤導
- 99%負樣本時,全預測負也有99%準確率
- F1分數:關注正例的預測質量
- 平衡考慮精確和召回
- 更適合不平衡數據
應用場景:
- 醫療診斷:避免漏診(高召回)和誤診(高精確)
- 搜索系統:平衡相關結果和覆蓋率
- 欺詐檢測:識別欺詐同時減少誤報
- 信息抽取:命名實體識別等
變體:
- Fβ分數:調整精確召回權重
- F2:更重視召回
- F0.5:更重視精確
- Macro F1:各類F1的平均
- Weighted F1:加權平均
- Micro F1:全局計算
使用建議:
- 類別平衡:準確率足夠
- 類別不平衡:使用F1
- 多類別:Macro或Weighted F1
F1分數是處理不平衡數據的標準指標。