詳細解釋
EasyEnsemble 是 Liu、Wu、Zhou(2009)提出的不平衡學習方法:反覆對多數類做隨機欠採樣,得到多個與少數類數量相當的平衡子集,再在每個子集上訓練一個基學習器(常用 AdaBoost),最後以集成方式預測。結合欠採樣與集成,避免單次欠採樣丟失過多資訊。
參數包括子集數量、採樣策略與基學習器數量等,實作見 imbalanced-learn 的 EasyEnsembleClassifier。與 SMOTE (合成少數過採樣)、ADASYN (自適應合成採樣) 等同屬不平衡學習;EasyEnsemble 偏欠採樣+集成,SMOTE/ADASYN 為過採樣。適用於詐騙偵測、異常檢測等正負樣本懸殊場景。