詳細解釋
工作記憶(Working Memory)是AI Agent在當前對話或任務中短期維持的資訊,類似人類的短期記憶。
特徵:
- 有限容量:受限於上下文長度
- 短暫持續:對話結束後丟失
- 活躍使用:頻繁讀寫存取
- 上下文相關:與當前任務緊密相關
內容類型:
- 對話歷史:最近的交流記錄
- 中間結果:多步計算的臨時值
- 用戶偏好:當前對話的個人化資訊
- 任務狀態:流程中的進度和參數
與長期記憶的區別:
- 工作記憶:當前對話、短期、易失
- 長期記憶:跨對話、持久、可檢索
技術實現:
- 上下文窗口:利用LLM的有限上下文
- 緩衝區:維護固定大小的資訊佇列
- 摘要壓縮:將歷史摘要為緊湊形式
挑戰:
- 容量限制:上下文長度有限
- 遺忘問題:早期資訊被後期擠出
- 資訊重要性:如何決定保留什麼
是AI代理設計的關鍵組件。