ADASYN (自適應合成採樣)

ADASYN (Adaptive Synthetic Sampling)

針對不平衡資料的過採樣方法,依少數類樣本難度自適應生成合成樣本。

詳細解釋

ADASYN(Adaptive Synthetic Sampling)是 2008 年由 He、Bai、Garcia、Li 在 IEEE IJCNN 提出的過採樣演算法,用於處理機器學習 (ML)中的類別不平衡問題。與 SMOTE (合成少數過採樣) 同屬合成少數類過採樣,差別在於 ADASYN 會根據「學習難度」分配權重:越難分類的少數類樣本周圍,會生成越多合成樣本,使決策邊界往難例移動,同時減輕不平衡帶來的偏差。

實作上通常以少數類的 k 近鄰生成新樣本,並在 imbalanced-learn 等套件中提供。適用於二分類與多分類,參數包含採樣比例、近鄰數等。適合與 SMOTE (合成少數過採樣)、欠採樣或集成學習方法搭配,用於詐騙偵測、異常檢測、疾病篩檢等正負樣本懸殊的場景。

探索更多AI詞彙

查看所有分類,繼續學習AI知識