文本分類

Text Classification

將文本標註為預定義類別

詳細解釋

文本分類(Text Classification)是將文本自動歸類到預定義類別的NLP任務,廣泛應用於內容審核、垃圾郵件檢測和主題分類。

分類類型:

  • 二元分類:是/否(垃圾郵件檢測)
  • 多分類:選擇一個類別(主題分類)
  • 多標籤:可歸多個類別(新聞標籤)
  • 層級分類:類別有層級關係

應用場景:

  • 垃圾郵件:檢測垃圾郵件和釣魚郵件
  • 情感分析:正面/負面/中性
  • 主題分類:新聞歸類(體育、科技等)
  • 內容審核:檢測違規內容
  • 意圖識別:客服對話分類
  • 語言檢測:識別文本語言

技術演進:

評估指標:

  • 準確率:整體分類正確率
  • 精確率/召回率:權衡誤報和漏報
  • F1分數:綜合衡量

實現工具:Scikit-learn、Hugging Face Transformers、OpenAI API。

探索更多AI詞彙

查看所有分類,繼續學習AI知識