文本編碼器

Text Encoder

將文本轉為向量的編碼器

詳細解釋

文本編碼器(Text Encoder)是將文本轉換為語義向量的神經網絡組件,是多模態模型和檢索系統的核心。

在CLIP中:

  • 與圖像編碼器並行訓練
  • 對齊文本和圖像的表示空間
  • 相同語義的文本和圖像向量相近
  • 實現跨模態檢索和生成

在文本生成中:

  • 條件編碼:將提示編碼為條件向量
  • 指導生成:控制擴散模型的輸出
  • 分類器引導:結合分類器信號

架構類型:

應用:

品質關鍵:

  • 預訓練數據的多樣性
  • 維度大小(通常768-1024)
  • 上下文長度支援

探索更多AI詞彙

查看所有分類,繼續學習AI知識