詳細解釋
將知識圖譜(結構化的實體-關係-實體網絡)與 RAG 結合的增強檢索技術,解決傳統向量 RAG 的「黑箱」和「關係缺失」問題。
傳統 RAG 的局限:
- 語義相似不等於邏輯相關:「蘋果公司」和「蘋果水果」向量可能相近
- 關係丟失:「A 的 CEO 是 B」這一事實在純向量中難以查詢
- 可解釋性差:為什麼檢索到這段文本?難以說明
知識圖譜增強:
- 實體鏈接:將用戶查詢中的實體映射到圖譜節點(「喬布斯」→ Apple 創始人)
- 關係遍歷:沿圖譜邊緣查找多跳關係(「喬布斯的女兒的職業」)
- 結構化上下文:將實體屬性和關係作為獨立信息源提供給 LLM
- 可驗證性:每個事實都有來源追溯
實現架構:
- Neo4j + 向量索引:圖數據庫與向量搜索結合
- RDF + LLM:將三元組序列化為文本輸入
- 專用框架:LangChain 的 GraphRAG、LlamaIndex 的 KnowledgeGraphIndex
代表應用:
- 醫療:藥物相互作用查詢(需精確的關係推理)
- 金融:企業關聯分析(股東、子公司、交易對手)
- 法律:法規條款的條件引用(第 X 條適用於 Y 情況)
挑戰:知識圖譜構建成本高(需專家或大量標註),且動態更新困難(新聞事件不斷改變實體關係)。