語義分割

Semantic Segmentation

為影像每個像素標註類別

詳細解釋

語義分割(Semantic Segmentation)是為圖像每個像素分配語義類別的電腦視覺任務,比目標檢測更精細。

輸出:

  • 與輸入圖像相同尺寸的掩碼
  • 每個像素標註類別(人、車、路等)
  • 不區分同類別的不同實例

經典架構:

  • FCN:全卷積網絡,端到端
  • U-Net:編解碼對稱,跳躍連接
  • DeepLab:空洞卷積擴大感受野
  • PSPNet:金字塔池化捕獲多尺度

應用場景:

  • 自動駕駛:可通行區域識別
  • 醫學影像:器官、病灶分割
  • 圖像編輯:背景替換、美顏
  • 工業檢測:缺陷區域標註
  • 虛擬試穿:人體與服裝分割

實體分割的區別:

  • 語義分割:只分類別,不區分個體
  • 實例分割:區分同類別不同個體

挑戰:

  • 邊界精度:物體邊緣準確性
  • 小物體:低解析度易遺漏
  • 實時性:高解析度處理速度
  • 遮擋:重疊物體處理

電腦視覺的核心任務之一。

探索更多AI詞彙

查看所有分類,繼續學習AI知識