詳細解釋
具有物理身體、能與真實環境交互的 AI 系統,與純軟體 AI(如 ChatGPT)相對。這是 AI 從「思考」到「行動」的進化。
核心要素:
- 感知:攝像頭、傳感器、麥克風接收環境信息
- 行動:機械臂、輪子、腿改變環境
- 反饋:行動結果影響下一步決策
- 持續學習:在交互中積累經驗
典型平台:
- 機械臂:工業自動化、實驗室自動化
- 自動駕駛:輪式機器人
- 人形機器人:Atlas、Optimus、Figure 01
- 無人機:空中交互
- 仿真環境:Isaac Gym、Habitat(先仿真後真實)
挑戰(與純軟體 AI 對比):
- 數據稀缺:物理交互數據收集昂貴危險
- 實時性:毫秒級決策,不能批次處理
- 安全性:錯誤可能導致物理損壞或傷害
- 泛化:仿真到真實的「現實鴻溝」
學習方法:
- 模仿學習:觀察人類示範
- 強化學習:在仿真中試錯,遷移到真實
- 模型預測控制:規劃未來行動序列
- 大模型驅動:VLM 理解場景,輸出動作計劃
應用:
- 製造:裝配、質檢、包裝
- 物流:倉儲自動化
- 家庭:清潔、助理、護理
- 科研:自動化實驗室
這是「AGI 的最後一英里」—— 真正的智能需要與世界互動,而非僅處理符號。