U-Net擴散

U-Net Diffusion

擴散模型中的U-Net骨幹

詳細解釋

U-Net擴散是指在擴散模型中使用U-Net作為去噪網絡的架構設計,是Stable Diffusion等模型的核心組件。

U-Net在擴散中的作用:

  • 輸入:帶噪的潛在表示 + 時間步 + 條件
  • 輸出:預測的噪聲或原始信號
  • 時間嵌入:告知當前擴散時間步
  • 條件嵌入:文本、類別等控制信號

架構細節:

  • 編碼路徑:多層ResNet下採樣
  • 中間層:最低解析度處理
  • 解碼路徑:上採樣+跳躍連接
  • 自注意力:高層解析度加注意力
  • 交叉注意力:條件(如文本)注入

條件注入方式:

  • 交叉注意力層:文本Q,圖像KV
  • AdaGN:群歸一化中注入條件
  • Concat:直接拼接條件特徵

優勢:

  • 多解析度:同時處理細節和語義
  • 條件靈活:支援多種控制信號
  • 計算高效:適合高解析度
  • 訓練穩定:架構成熟魯棒

擴散模型 (擴散生成模型)事實標準架構。

探索更多AI詞彙

查看所有分類,繼續學習AI知識