變分自編碼器 (VAE)

VAE (Variational Autoencoder)

結合生成與壓縮的機率自編碼器架構

詳細解釋

變分自編碼器(VAE, Variational Autoencoder)是結合深度學習和機率圖模型的生成模型,學習數據的機率潛在表示。

核心創新:

  • 編碼器:輸出潛在分布的參數(均值、方差)
  • 重參數技巧:採樣可微分
  • 先驗正則:潛在分布接近標準正態
  • 解碼器:從潛在樣本重建數據

損失函數:

  • 重建損失:輸入輸出相似
  • KL散度:潛在分布與先驗接近
  • 平衡兩者:β-VAE調節權重

與標準自編碼器的區別:

  • 確定性編碼 → 機率性編碼
  • 點估計 → 分布估計
  • 可生成新樣本

應用:

  • 圖像生成:人臉、數字生成
  • 半監督學習:利用未標註數據
  • 異常檢測:低機率樣本為異常
  • Stable Diffusion:潛在空間基礎

後續發展:

  • β-VAE:解耦表示
  • VQ-VAE:離散潛在空間
  • 擴散模型:超越VAE成為主流

是生成模型的基礎技術之一。

探索更多AI詞彙

查看所有分類,繼續學習AI知識