詳細解釋
U-Net是對稱的編解碼器架構,因形似字母U得名,廣泛用於醫學影像分割等像素級預測任務。
結構特徵:
- 編碼路徑:逐層下採樣提取特徵
- 瓶頸:最抽象特徵表示
- 解碼路徑:逐層上採樣恢復解析度
- 跳躍連接:編解碼對應層特徵拼接
為何有效:
- 跳躍連接保留細節資訊
- 解碼時融合高低層特徵
- 高精度邊界分割
- 小數據集也可訓練
應用:
- 醫學影像:腫瘤、器官分割
- 衛星圖像:地物分割
- 工業檢測:缺陷分割
- 擴散模型:Stable Diffusion骨幹
變體:
- U-Net++:密集跳躍連接
- Attention U-Net:注意力門控
- 3D U-Net:體積數據
- TransUNet:結合Transformer
與普通編解碼器的區別:
- 跳躍連接是關鍵創新
- 專為高精度分割設計
是電腦視覺分割任務的標準架構。