詳細解釋
語義分割(Semantic Segmentation)是為圖像每個像素分配語義類別的電腦視覺任務,比目標檢測更精細。
輸出:
- 與輸入圖像相同尺寸的掩碼
- 每個像素標註類別(人、車、路等)
- 不區分同類別的不同實例
經典架構:
- FCN:全卷積網絡,端到端
- U-Net:編解碼對稱,跳躍連接
- DeepLab:空洞卷積擴大感受野
- PSPNet:金字塔池化捕獲多尺度
應用場景:
- 自動駕駛:可通行區域識別
- 醫學影像:器官、病灶分割
- 圖像編輯:背景替換、美顏
- 工業檢測:缺陷區域標註
- 虛擬試穿:人體與服裝分割
與實體分割的區別:
- 語義分割:只分類別,不區分個體
- 實例分割:區分同類別不同個體
挑戰:
- 邊界精度:物體邊緣準確性
- 小物體:低解析度易遺漏
- 實時性:高解析度處理速度
- 遮擋:重疊物體處理
是電腦視覺的核心任務之一。