HyDE

HyDE

用假設性文件嵌入提升檢索的RAG技巧

詳細解釋

HyDE(Hypothetical Document Embeddings,假設文檔嵌入)是一種檢索增強生成 (RAG)查詢改寫技術,將問題轉換為假設答案文檔,再用該文檔的嵌入進行檢索,解決查詢-文檔語義差距問題。

核心思想:

  • 問題:用戶問題和答案文檔的語義空間不同
  • 觀察:答案文檔與其他答案文檔更相似
  • 方法:LLM生成假設答案 → 嵌入假設答案 → 用嵌入檢索真實文檔

工作流程:

  1. 用戶輸入查詢(如「如何訓練LLM?」)
  2. LLM生成假設答案(無需真實知識,只需合理格式)
  3. 編碼假設答案為向量嵌入
  4. 用此嵌入在向量數據庫中檢索相似的真實文檔
  5. 檢索到的文檔用於最終回答生成

優勢:

  • 語義對齊:將查詢轉換到與文檔相同的語義空間
  • 零樣本學習:無需訓練,直接使用
  • 性能提升:通常優於直接查詢嵌入
  • 查詢理解:LLM先「理解」問題意圖

局限:

  • 依賴LLM質量:假設答案質量影響檢索
  • 成本:需要額外LLM調用
  • 延遲:增加生成假設答案的時間
  • 錯誤傳播:假設答案錯誤可能導致檢索偏差

與查詢擴展的對比:

  • 查詢擴展:添加相關詞彙到查詢
  • HyDE:生成完整答案文檔
  • HyDE通常效果更強

應用場景:

  • 文檔檢索:複雜問題的精準檢索
  • 知識問答:專業領域的問答系統
  • 客戶支持:基於文檔的客服機器人
  • 法律檢索:案例和法規檢索

實現:

HyDE是提升RAG檢索質量的有效技巧。

探索更多AI詞彙

查看所有分類,繼續學習AI知識