詳細解釋
變分自編碼器(VAE, Variational Autoencoder)是結合深度學習和機率圖模型的生成模型,學習數據的機率潛在表示。
核心創新:
- 編碼器:輸出潛在分布的參數(均值、方差)
- 重參數技巧:採樣可微分
- 先驗正則:潛在分布接近標準正態
- 解碼器:從潛在樣本重建數據
損失函數:
- 重建損失:輸入輸出相似
- KL散度:潛在分布與先驗接近
- 平衡兩者:β-VAE調節權重
與標準自編碼器的區別:
- 確定性編碼 → 機率性編碼
- 點估計 → 分布估計
- 可生成新樣本
應用:
- 圖像生成:人臉、數字生成
- 半監督學習:利用未標註數據
- 異常檢測:低機率樣本為異常
- Stable Diffusion:潛在空間基礎
後續發展:
- β-VAE:解耦表示
- VQ-VAE:離散潛在空間
- 擴散模型:超越VAE成為主流
是生成模型的基礎技術之一。