詳細解釋
對比學習(Contrastive Learning)是讓相似樣本靠近、不相似樣本遠離的學習範式,學習判別性表示。
核心思想:
- 正樣本:相似的樣本對(同一圖像的兩種增強)
- 負樣本:不相似的樣本對(不同圖像)
- 目標:拉近正樣本,推遠負樣本
損失函數:
- InfoNCE:負對數似然
- NT-Xent:歸一化溫度縮放交叉熵
- 三元損失:錨點-正樣本-負樣本
數據增強(關鍵):
- 圖像:裁剪、顏色抖動、模糊
- 文本:回譯、刪除、替換
- 創建不同視圖但語義相同的樣本
代表工作:
- SimCLR:簡單框架,大批次
- MoCo:動量編碼器,動態字典
- CLIP:跨模態對比
- DINO:自監督,無需標註
應用:
- 無監督預訓練:無需標註學習好表示
- 嵌入向量 (嵌入 / 詞嵌入 / 向量嵌入) (Embedding Lookup):語義相似度
- 跨模態:圖文對齊(CLIP)
與生成式學習的對比:
- 對比:判別式,學習區分
- 生成:重建式,學習分布
- 現代常結合使用
是自我監督學習的主流方法。