詳細解釋
記憶檢索(Memory Retrieval)是從長期記憶中找回與當前查詢相關資訊的過程,是AI代理的關鍵能力。
檢索方法:
- 語義檢索:向量相似度匹配(最常用)
- 關鍵字檢索:精確或模糊匹配
- 時間檢索:按時間範圍查找
- 混合檢索:結合多種方法
語義檢索流程:
- 查詢編碼:將當前問題轉為向量
- 相似度計算:與記憶庫向量比較
- 排序篩選:取Top-K最相似
- 重排序:用更精確模型精排
- 載入上下文:放入工作記憶
優化技術:
- 分層檢索:粗檢+精檢
- 緩存熱門:常用記憶常駐
- 摘要壓縮:長記憶先摘要
- 去重合併:合併相似記憶
檢索增強生成(檢索增強生成 (RAG)):
- 將檢索到的記憶作為上下文
- 結合大型語言模型 (大語言模型 / 大模型)生成回應
- 是知識密集型任務的標準做法
挑戰:
- 相關性判斷:準確理解需要什麼
- 資訊過載:檢索太多導致噪音
- 時效性:新舊記憶的權衡