詳細解釋
U-Net擴散是指在擴散模型中使用U-Net作為去噪網絡的架構設計,是Stable Diffusion等模型的核心組件。
U-Net在擴散中的作用:
- 輸入:帶噪的潛在表示 + 時間步 + 條件
- 輸出:預測的噪聲或原始信號
- 時間嵌入:告知當前擴散時間步
- 條件嵌入:文本、類別等控制信號
架構細節:
- 編碼路徑:多層ResNet下採樣
- 中間層:最低解析度處理
- 解碼路徑:上採樣+跳躍連接
- 自注意力:高層解析度加注意力
- 交叉注意力:條件(如文本)注入
條件注入方式:
- 交叉注意力層:文本Q,圖像KV
- AdaGN:群歸一化中注入條件
- Concat:直接拼接條件特徵
優勢:
- 多解析度:同時處理細節和語義
- 條件靈活:支援多種控制信號
- 計算高效:適合高解析度
- 訓練穩定:架構成熟魯棒
是擴散模型 (擴散生成模型)事實標準架構。