擴散模型 (擴散生成模型)

Diffusion Model

通過逐步去除噪聲來生成數據的生成式模型

詳細解釋

擴散模型(Diffusion Model)是一種生成式AI架構,通過學習如何逐步去除噪聲來生成高質量的圖像、音訊或其他數據。

工作原理:

  • 前向過程:逐步向圖像添加噪聲,直到變成純噪聲
  • 反向過程:學習如何逐步去除噪聲,恢復清晰圖像
  • 條件生成:根據文本描述(文生圖 (文字生圖 / Text-to-Image))或其他條件指導生成

著名模型:

  • Stable Diffusion:開源,可本地運行
  • DALL-E(OpenAI):高質量圖像生成
  • Midjourney:藝術風格圖像
  • Imagen(Google):高解析度生成

優勢:

  • 生成質量高,細節豐富
  • 訓練穩定,不收斂問題困擾
  • 可進行圖生圖編輯

擴散模型是當前電腦視覺文生圖 (文字生圖 / Text-to-Image)領域的主流技術。

探索更多AI詞彙

查看所有分類,繼續學習AI知識