詳細解釋
HyDE(Hypothetical Document Embeddings,假設文檔嵌入)是一種檢索增強生成 (RAG)查詢改寫技術,將問題轉換為假設答案文檔,再用該文檔的嵌入進行檢索,解決查詢-文檔語義差距問題。
核心思想:
- 問題:用戶問題和答案文檔的語義空間不同
- 觀察:答案文檔與其他答案文檔更相似
- 方法:LLM生成假設答案 → 嵌入假設答案 → 用嵌入檢索真實文檔
工作流程:
- 用戶輸入查詢(如「如何訓練LLM?」)
- LLM生成假設答案(無需真實知識,只需合理格式)
- 編碼假設答案為向量嵌入
- 用此嵌入在向量數據庫中檢索相似的真實文檔
- 檢索到的文檔用於最終回答生成
優勢:
- 語義對齊:將查詢轉換到與文檔相同的語義空間
- 零樣本學習:無需訓練,直接使用
- 性能提升:通常優於直接查詢嵌入
- 查詢理解:LLM先「理解」問題意圖
局限:
- 依賴LLM質量:假設答案質量影響檢索
- 成本:需要額外LLM調用
- 延遲:增加生成假設答案的時間
- 錯誤傳播:假設答案錯誤可能導致檢索偏差
與查詢擴展的對比:
- 查詢擴展:添加相關詞彙到查詢
- HyDE:生成完整答案文檔
- HyDE通常效果更強
應用場景:
- 文檔檢索:複雜問題的精準檢索
- 知識問答:專業領域的問答系統
- 客戶支持:基於文檔的客服機器人
- 法律檢索:案例和法規檢索
實現:
HyDE是提升RAG檢索質量的有效技巧。