詳細解釋
使用深度學習(主要是 GAN 和自編碼器)生成或篡改視頻、音頻、圖像,讓人物做出從未做過的動作或說出從未說過的話。
技術原理:
- 自動編碼器:學習人臉的壓縮表示,再重建另一個人的臉
- GAN:生成器創建假視頻,判別器區分真假,對抗訓練
- 換臉(Face Swap):將目標臉部疊加到源視頻
- 唇形同步:根據音頻生成匹配的口型動作
- 語音克隆:模仿特定人的聲音
正面應用:
- 影視製作:已故演員「復活」、年齡變化
- 配音本地化:口型匹配的外語配音
- 教育:歷史人物「講課」
- 娛樂:社交媒體濾鏡、表情包
負面風險:
- 假新聞:政治人物發表虛假言論
- 詐騙:冒充親友視頻通話騙錢
- 色情:未經同意的換臉色情內容
- 信任崩潰:「眼見不為實」的社會後果
檢測技術:
- 深度學習檢測器:訓練模型識別偽造痕跡
- 生理信號:不自然的眨眼、呼吸、血流
- 數字取證:壓縮痕跡、噪聲模式
- 區塊鏈驗證:內容溯源和認證
法律與監管:
- 歐盟 AI 法案:限制 deepfake 使用
- 美國:部分州立法禁止惡意 deepfake
- 平台政策:Twitter、Facebook 標記或刪除
現狀:
- 技術門檻降低:手機 App 即可製作
- 檢測難度增加:生成器與檢測器的軍備競賽
- 社會適應:「懷疑主義」成為新常態
這是「媒體真實性」的挑戰—— 技術雙刃劍的典型案例。