Token (詞元 / 標記)

Token (Text Token)

語言模型處理文本時使用的最小單位

詳細解釋

Token是大型語言模型 (大語言模型 / 大模型)處理文本時使用的最小單位,可以是一個字、一個詞的一部分、或一個標點符號。不同語言的token數量差異很大。

Token化過程:

  • 英文:1個token約等於4個字符或0.75個單詞
  • 中文:1個中文字通常需要1-2個token
  • 程式碼:語法和關鍵字有特定編碼

為何重要:

優化建議:

了解token計算對控制AI使用成本至關重要。

探索更多AI詞彙

查看所有分類,繼續學習AI知識