無伺服器

Serverless

無需管理伺服器的按需執行模式

詳細解釋

無伺服器(Serverless)是一種計算模式,開發者無需管理伺服器,只需編寫和部署代碼,由平台自動處理資源分配和擴展。

核心概念:

  • 函數即服務(FaaS):AWS Lambda、Azure Functions
  • 後端即服務(BaaS):託管數據庫、認證、存儲
  • 事件驅動:代碼由事件(HTTP請求、文件上傳、定時器)觸發
  • 按需計費:按實際執行時間和資源付費

與傳統對比:

  • 傳統:預配伺服器,持續運行,閒置也計費
  • 無伺服器:按需啟動,執行完畢釋放,閒置免費
  • 擴展性:自動從0擴展到數千並發
  • 運維:平台管理補丁、安全、可用性

在AI中的應用:

  • 輕量推理:圖像分類、文本分析、數據預處理
  • 數據管道:觸發式數據處理(文件上傳→處理→存儲)
  • 模型預熱:定期調用保持模型熱狀態
  • 邊緣推理:Cloudflare Workers、Vercel Edge

限制:

  • 冷啟動延遲:首次調用或閒置後啟動需數百毫秒
  • 執行時間限制:通常15分鐘內(AWS Lambda)
  • 記憶體限制:通常最多10GB
  • 狀態管理:無狀態設計,狀態需外置存儲
  • GPU支持:有限(AWS Lambda無GPU,需用專用服務)

冷啟動優化:

  • 預置並發:保留熱實例(Provisioned Concurrency)
  • 輕量運行時:Python、Node.js啟動快
  • 容器優化:精簡鏡像,減少啟動時間
  • 架構選擇:狀態分離,計算輕量

成本考量:

  • 低頻率請求:比常駐伺服器便宜
  • 高頻率請求:可能更貴,需計算比較
  • 記憶體vs時間:權衡配置優化成本
  • 免費額度:開發和測試常足夠

使用場景:

  • 事件處理:Webhook、消息隊列消費
  • API後端:輕量REST/GraphQL服務
  • 定時任務:數據清理、報告生成
  • 不適合:長時間訓練、GPU推理、有狀態服務

無伺服器是特定AI應用的經濟高效選擇。

探索更多AI詞彙

查看所有分類,繼續學習AI知識