嵌入模型

Embedding Model

將文本或圖像轉為向量的模型

詳細解釋

嵌入模型(Embedding Model)是將離散數據(文本、圖像)轉換為連續向量表示的模型,是現代AI的基礎組件。

文本嵌入模型:

圖像嵌入模型:

  • 殘差網絡:經典CNN特徵提取
  • CLIP:對齊圖文的多模態嵌入
  • dino v2:自監督視覺嵌入

關鍵特性:

  • 語義相似:相似內容向量相近
  • 降維:高維離散→低維連續
  • 可計算:可進行數學運算

應用:

選擇考量:

  • 維度:常用384、768、1024、1536
  • 上下文長度:支援最大token數
  • 多語言:是否支援中文等
  • MTEB分數:標準評估基準

探索更多AI詞彙

查看所有分類,繼續學習AI知識