詳細解釋
Alan Turing 於 1950 年提出的智能測試:若人類無法區分機器和真人對話,則機器可視為智能。這是 AI 的奠基性概念。
測試設計:
- 三方對話:人類評判者、人類參與者、機器
- 僅文字:避免語音、外貌等干擾
- 開放領域:不限定話題
- 通過標準:評判者無法可靠區分
歷史意義:
- 避開「機器能否思考」的哲學爭議
- 提出可操作的智能定義
- 預言到 2000 年機器有 30% 概率通過
現代評估:
- 2014:Eugene Goostman 聊天機器人聲稱通過(爭議)
- 2023-2024:GPT-4 在多種設定下被認為通過
- 批評:僅測試「欺騙能力」而非真正智能
變體與擴展:
- 完全圖靈測試:包含視覺、聽覺、操作
- Winograd Schema:常識推理測試
- Lovelace Test:創造性測試
- 就業測試:能否勝任人類工作
哲學爭議:
- 行為主義:智能 = 行為表現
- 中文房間:Searle 的反驳,認為符號操作≠理解
- 意識問題:通過測試是否意味著有意識?
當前地位:
- 不再是 AI 研究的主要目標(太狹隘)
- 但仍是有意義的概念測試
- 某些聊天機器人競賽的形式基礎
這是「智能哲學」的起點—— 至今仍激發關於 AI 本質的討論。