詳細解釋
Application-Specific Integrated Circuit(專用集成電路),為特定任務(如 AI 推理)定制設計的芯片,與通用 CPU/GPU 相對。
與通用芯片的對比:
- CPU:通用,靈活,能效比低
- GPU:並行計算,圖形/AI 通用,仍有一定靈活性
- ASIC:專用,極致性能/能效,無靈活性
- FPGA:可編程硬件,介於 GPU 和 ASIC 之間
AI ASIC 代表:
- Google TPU:專為 TensorFlow 優化
- 華為昇騰:AI 訓練推理
- 寒武紀:中國 AI 芯片
- Graphcore IPU:圖計算優化
- Cerebras:晶圓級超大芯片
- Groq:LPU(語言處理單元)
優勢:
- 性能:特定任務比 GPU 快 10-100 倍
- 能效:每瓦性能遠超 GPU,適合邊緣部署
- 成本:大規模部署時 TCO(總擁有成本)更低
劣勢:
- 開發成本:設計需數億美元,僅大規模才划算
- 靈活性:算法變化可能使 ASIC 過時
- 生態:軟體工具鏈不如 NVIDIA 成熟
- 風險:流片失敗損失巨大
採用考量:
- 超大規模:Google、Meta、Microsoft 自建或定制
- 初創公司:通常先 GPU 證明,後 ASIC 優化
- 邊緣設備:手機 NPU、IoT 芯片必須 ASIC(功耗限制)
趨勢:
- 雲端:TPU、AWS Trainium/Inferentia 挑戰 NVIDIA
- 邊緣:每個手機、攝像頭都有 NPU
- 存算一體:新型架構進一步突破能效
這是「計算架構多樣化」的體現—— 通用計算(CPU)→ 並行計算(GPU)→ 專用計算(ASIC)。