詳細解釋
2022 年成立的美國 AI 推理託管平台,主打「Serverless API for Open Source Models」。讓開發者無需管理 GPU 服務器,即可通過 OpenAI-compatible API 調用 Llama、Mistral、Stable Diffusion 等開源模型。
核心賣點是性價比。由於使用閒置 GPU 資源聚合和自動擴展技術,其價格通常比專有模型(GPT-4)低 5-10 倍,比自建 GPU 叢集運維成本更低。支援文本生成、嵌入向量、圖像生成、語音識別等多種任務。
企業級功能包括:自動批處理提升吞吐量、請求/響應日誌記錄、SSO 集成、VPC 隔離。與 Together AI、Fireworks.ai 同屬「開源模型 API 層」競爭對手。
挑戰在於開源模型迭代快,需持續跟進最新版本;且與專有模型相比,開源模型在特定任務上可能性能不足。適合預算敏感、願意權衡性能與成本的應用。