LangSmith

LangSmith

LangChain 的偵錯與評估平台

詳細解釋

LangChain 的官方可觀測性和評估平台,2023 年推出,用於追踪、監控和評估 LLM 應用的生產性能。

核心功能:

  • 追踪(Tracing):記錄每次 LLM 調用的輸入、輸出、延遲、token 使用、成本
  • 數據集:管理和版本化測試數據集
  • 評估:運行自動化評估(準確性、相關性、有害性)
  • 監控:儀表板查看生產指標,設置警報
  • 反饋:收集用戶反饋(點讚/點踩)改進模型

與通用 APM 對比:

  • Datadog/New Relic:監控整體應用性能
  • LangSmith:專為 LLM 設計,理解嵌入、檢索、鏈式調用
  • 可追踪 RAG 流程:哪個文檔被檢索、重排序分數、最終生成

使用場景:

  • 調試:為什麼這個查詢回答錯了?查看完整調用鏈
  • 成本優化:識別昂貴的調用,優化提示減少 tokens
  • A/B 測試:比較提示版本 A vs B 的指標
  • 合規:審計日誌,追踪數據洩露

定價:

  • 免費層:每月 5K 次追踪
  • Developer:$39/月,50K 次追踪
  • Plus:$199/月,200K 次追踪
  • Enterprise:定制價格,無限追踪

生態位置:與 LangChain 深度整合,但也支持原生 OpenAI、其他框架。

競爭對手:Weights & Biases、Helicone、HoneyHive、Context。

這是「LLM Ops」基礎設施的關鍵組件—— 沒有監控就無法改進,LangSmith 填補了傳統 APM 不理解 LLM 的空白。

探索更多AI詞彙

查看所有分類,繼續學習AI知識