詳細解釋
自我修正(Self-Correction)是AI Agent檢測自身錯誤並主動修正的能力,提升魯棒性和可靠性。
修正類型:
- 事實錯誤:檢測並修正錯誤資訊
- 語法錯誤:修正語言錯誤
- 邏輯錯誤:發現推理漏洞
- 執行錯誤:修正工具使用錯誤
實現方式:
- 反思:生成後自我審查
- 驗證:檢查事實和邏輯
- 回饋循環:觀察結果並調整
- 人類反饋:學習修正模式
技術框架:
- 思維鏈 (CoT / Few Shot CoT):展示推理過程便於檢查
- 驗證鏈:專門驗證步驟
- 驗證器模型:專門評估輸出品質
- 批評模型:專門找出問題
應用:
- 程式生成:編譯錯誤後自動修復
- 數學推理:檢查計算結果
- 事實問答:驗證事實準確性
- 對話系統:修正誤解用戶意圖
挑戰:
- 自知之明:難意識到自己錯誤
- 修正方向:知道錯但不知如何修
- 過度修正:反而改錯正確內容
是AI代理進階能力的關鍵。