🚀 2026 全民被動收入指南，賺錢就是 Easy Job

關於我們聯絡我們

易賺AiEasyJobAi

3中級訓練與優化

Medusa (推論加速)

Medusa

為大型語言模型 (大語言模型 / 大模型) 設計的推論加速方法：以多頭解碼一次產出多個候選 token，再以驗證頭篩選，可減少推理 (模型推理) (Inference Optimization) (Variational Inference) 步數。

詳細解釋

Medusa 在大型語言模型 (大語言模型 / 大模型) 自回歸解碼時，於主幹上掛多個「樹狀」解碼頭，一次預測多個未來的 token 候選，並用輕量驗證頭篩掉不一致的候選，從而每步可接受多個 token、降低總步數與延遲。常與投機採樣並論；二者皆為推理 (模型推理) (Inference Optimization) (Variational Inference) 加速技術。與大型語言模型 (大語言模型 / 大模型)、推理 (模型推理) (Inference Optimization) (Variational Inference) 相關；若有 speculative-decoding 可加為 related。

相關詞彙

大型語言模型 (大語言模型 / 大模型)1

在大量文本數據上訓練、能理解和生成自然語言的AI模型

推理 (模型推理) (Inference Optimization) (Variational Inference)2

使用訓練好的AI模型對新數據進行預測的過程

探索更多AI詞彙

查看所有分類，繼續學習AI知識

基礎概念模型架構技術工具應用場景全部詞彙