詳細解釋
將多個 AI 組件(模型、檢索器、工具、記憶)組合成複雜系統來解決問題,而非依賴單一模型,是當前 AI 應用的主流架構模式。
系統組成:
- 多模型:不同任務用不同模型(小模型路由、大模型生成)
- 檢索增強:RAG 系統連接外部知識
- 工具使用:計算器、API、數據庫的調用
- 記憶系統:長期存儲和檢索對話歷史
- 反思/驗證:自我檢查和錯誤修正機制
設計模式:
- 路由:根據查詢選擇最適合的處理路徑
- 並行:多個模型同時處理,結果融合
- 級聯:一個模型的輸出是下一個的輸入
- 循環:迭代改進直到滿足條件
代表系統:
- AlphaCode:多模型生成 + 測試過濾
- ChatGPT + Plugins:模型 + 各種工具
- Copilot:代碼模型 + 語義搜索 + 終端集成
- Perplexity:搜索 + 多模型回答 + 源追蹤
優勢:
- 模塊化:各組件獨立優化和替換
- 可靠性:單點故障不影響全局
- 成本:簡單任務用便宜組件
- 可擴展:容易添加新能力
挑戰:
- 複雜性:系統設計和調試更難
- 延遲:多組件串聯增加響應時間
- 錯誤傳播:一個組件的錯誤影響下游
- 優化困難:全局最優 vs 局部最優
與端到端模型的對比:
- 複合系統:靈活、可控、可解釋
- 端到端:簡潔、潛在更優化、黑盒
這是「實用 AI」的主流範式—— 不追求單一超級模型,而是組合最強組件。