🚀 2026 全民被動收入指南，賺錢就是 Easy Job

關於我們聯絡我們

易賺AiEasyJobAi

4高級產業術語

HyDE

HyDE

用假設性文件嵌入提升檢索的RAG技巧

詳細解釋

HyDE（Hypothetical Document Embeddings，假設文檔嵌入）是一種檢索增強生成 (RAG)查詢改寫技術，將問題轉換為假設答案文檔，再用該文檔的嵌入進行檢索，解決查詢-文檔語義差距問題。

核心思想：

問題：用戶問題和答案文檔的語義空間不同
觀察：答案文檔與其他答案文檔更相似
方法：LLM生成假設答案 → 嵌入假設答案 → 用嵌入檢索真實文檔

工作流程：

用戶輸入查詢（如「如何訓練LLM？」）
LLM生成假設答案（無需真實知識，只需合理格式）
編碼假設答案為向量嵌入
用此嵌入在向量數據庫中檢索相似的真實文檔
檢索到的文檔用於最終回答生成

優勢：

語義對齊：將查詢轉換到與文檔相同的語義空間
零樣本學習：無需訓練，直接使用
性能提升：通常優於直接查詢嵌入
查詢理解：LLM先「理解」問題意圖

局限：

依賴LLM質量：假設答案質量影響檢索
成本：需要額外LLM調用
延遲：增加生成假設答案的時間
錯誤傳播：假設答案錯誤可能導致檢索偏差

與查詢擴展的對比：

查詢擴展：添加相關詞彙到查詢
HyDE：生成完整答案文檔
HyDE通常效果更強

應用場景：

文檔檢索：複雜問題的精準檢索
知識問答：專業領域的問答系統
客戶支持：基於文檔的客服機器人
法律檢索：案例和法規檢索

實現：

LangChain：HypotheticalDocumentEmbedder
自定義實現：LLM + 嵌入模型 + 向量資料庫

HyDE是提升RAG檢索質量的有效技巧。

相關詞彙

檢索增強生成 (RAG)3

結合外部知識檢索和語言生成的AI技術

探索更多AI詞彙

查看所有分類，繼續學習AI知識

基礎概念模型架構技術工具應用場景全部詞彙