詳細解釋
Black Forest Labs 於 2024 年發布的開源圖像生成模型,Stable Diffusion 原團隊出走後的作品,以高質量、快速、開源為特點,迅速成為社區熱門。
技術特點:
- 架構:改良的 Diffusion Transformer(DiT)
- 流匹配(Flow Matching):比傳統擴散更快收斂
- 參數規模:12B(pro)、可商用(dev)、快速(schnell)
- 開源:非營利組織,堅持開源理念
三個版本:
- FLUX.1 [pro]:最高質量,API 訪問
- FLUX.1 [dev]:可商用,本地運行
- FLUX.1 [schnell]:極速生成,本地免費
優勢:
- 文本渲染:準確生成圖中文字(SD 的弱點)
- 人體解剖:手、肢體結構更準確
- 提示遵循:更準確理解複雜描述
- 開源生態:ComfyUI、WebUI 迅速支持
與 Midjourney/DALL-E 的對比:
- 開源 vs 閉源:可自定義、本地部署
- 可控性:更強的 ControlNet、Inpainting 支持
- 社區:快速發展的工具和模型(LoRA、IP-Adapter)
使用場景:
- 概念藝術:遊戲、電影前期設計
- 插畫:書籍、文章配圖
- 產品設計:快速原型可視化
- 教育:教學材料生成
這是「開源 AI 藝術」的新標杆—— Stable Diffusion 精神的延續。