圖靈測試

Turing Test

判斷機器是否具有人類智慧的傳統測試方法

詳細解釋

Alan Turing 於 1950 年提出的智能測試:若人類無法區分機器和真人對話,則機器可視為智能。這是 AI 的奠基性概念。

測試設計:

  • 三方對話:人類評判者、人類參與者、機器
  • 僅文字:避免語音、外貌等干擾
  • 開放領域:不限定話題
  • 通過標準:評判者無法可靠區分

歷史意義:

  • 避開「機器能否思考」的哲學爭議
  • 提出可操作的智能定義
  • 預言到 2000 年機器有 30% 概率通過

現代評估:

  • 2014:Eugene Goostman 聊天機器人聲稱通過(爭議)
  • 2023-2024:GPT-4 在多種設定下被認為通過
  • 批評:僅測試「欺騙能力」而非真正智能

變體與擴展:

  • 完全圖靈測試:包含視覺、聽覺、操作
  • Winograd Schema:常識推理測試
  • Lovelace Test:創造性測試
  • 就業測試:能否勝任人類工作

哲學爭議:

  • 行為主義:智能 = 行為表現
  • 中文房間:Searle 的反驳,認為符號操作≠理解
  • 意識問題:通過測試是否意味著有意識?

當前地位:

  • 不再是 AI 研究的主要目標(太狹隘)
  • 但仍是有意義的概念測試
  • 某些聊天機器人競賽的形式基礎

這是「智能哲學」的起點—— 至今仍激發關於 AI 本質的討論。

探索更多AI詞彙

查看所有分類,繼續學習AI知識