詳細解釋
需要跨越多個信息片段、建立多步連接的複雜推理。例如:「喬布斯創立的公司總部在哪個城市?」需要連接「喬布斯→蘋果→總部→庫比蒂諾」。
與單跳對比:
- 單跳:答案直接在一個文檔中
- 多跳:答案分散在多個文檔,需組合
應用場景:
- 科學文獻:「藥物 A 抑制蛋白 B,蛋白 B 參與疾病 C,所以 A 可治療 C?」
- 法律分析:「條款 X 引用條款 Y,條款 Y 受修正案 Z 影響」
- 歷史研究:「人物 A 認識 B,B 影響了 C,C 導致事件 D」
- 企業分析:「公司 A 投資 B,B 收購 C,C 的 CEO 曾是 D 的高管」
RAG 中的挑戰:
- 迭代檢索:先檢索 A,發現需要 B,再檢索 B
- 實體鏈接:識別不同文檔中的同一實體(「蘋果公司」vs「Apple Inc.」)
- 中間結果存儲:維護推理狀態
- 錯誤累積:一步錯導致全錯
技術方法:
- 顯式推理:模型輸出「第一步...第二步...」
- 圖神經網絡:知識圖譜上的多步傳播
- 迭代檢索:動態生成查詢,逐步收集證據
- 記憶網絡:顯式存儲和檢索中間結果
評估基準:
- HotpotQA:維基百科多跳問答
- MuSiQue:更難的多跳推理
- 2WikiMultiHopQA:結構化知識的多跳
當前局限:即使最強 LLM(GPT-4)在複雜多跳上仍常失敗,特別當跳數 >3 或涉及隱含關係。
這是「深度理解」vs「表面檢索」的試金石—— 真正的知識運用需要連接分散的事實。