合成媒體

Synthetic Media

AI 生成的圖像、影片、語音

詳細解釋

AI 生成的圖像、視頻、音頻、文本內容的統稱,也稱生成式媒體(Generative Media)。這些內容由算法創造,而非人類直接創作或拍攝。

生成技術:

  • 圖像:DALL-E、Midjourney、Stable Diffusion(擴散模型)
  • 視頻:Sora、Runway Gen-3(時空擴散)
  • 音頻:ElevenLabs、MusicLM(語音合成、音樂生成)
  • 文本:GPT-4、Claude(雖然文本是最早的生成媒體,常單獨討論)

應用場景:

  • 娛樂:虛擬影響、數字人、互動故事
  • 廣告:個性化營銷素材、A/B 測試無限創意
  • 教育:歷史場景重現、科學可視化
  • 無障礙:語音克隆幫助失語者
  • 新聞:自動生成財報、體育賽事摘要

風險與挑戰:

  • 深偽(Deepfake):虛假政治視頻、非自願色情內容
  • 版權:訓練數據涉及未授權作品
  • 信任崩塌:「眼見不再為實」,媒體可信度下降
  • 失業:創意產業從業者面臨替代

檢測與溯源:

  • 數字水印:C2PA、SynthID 標記 AI 內容
  • 檢測器:專門模型識別生成內容(但軍備競賽中)
  • 人機協作:強調「AI 輔助」而非「AI 替代」

監管:歐盟 AI 法案要求 AI 生成內容標記,中國要求深度合成服務備案。

這是「創意經濟」的顛覆—— 從「人類創作」到「人類指導 AI 創作」,門檻和成本都大幅下降。

探索更多AI詞彙

查看所有分類,繼續學習AI知識