2026 年上半年的模型新聞很多,但不是每一個「新模型發布」都值得當成產業訊號來看。MiniMax M3 之所以特別,不是因為它也喊了更長的上下文,而是它一次把幾個原本常常分開宣傳的賣點綁在一起:前沿 coding、Agent 任務、1M token 長上下文、原生多模態,以及相對完整的開放與商業化路徑。
如果只看宣傳標語,這很像又一個什麼都想做的大型語言模型。但把官方博客、API 訂閱頁面、GitHub 倉庫與第三方媒體整理放在一起看,M3 真正想證明的是另一件事:公開模型的競爭,接下來不會只比榜單分數,而是比誰更像一個能直接接進開發流程的完整產品。
今天 MiniMax 端出的重點,可以先濃縮成四件事:
- 它把 coding 與AI代理能力放在最前面,而不是先談通用聊天。
- 它把 1M 上下文窗口跟新的稀疏注意力架構一起講,表示這不是只拿來做行銷的數字。
- 它強調模型從訓練起點就是原生多模態,目標不只是讀圖,而是支援更完整的工具使用與 computer use 任務。
- 它同步給出 GitHub 倉庫、即將開放權重的時間表,以及 API 與訂閱價格,等於把「能不能用」與「用起來貴不貴」一起搬上桌。
為什麼這次的 1M 上下文不是裝飾數字
長上下文這個詞,過去一年幾乎已經被用到有點失真。很多模型確實能收下更長文件,但一旦進入真實任務,成本、延遲與穩定性就會快速變成問題。MiniMax 這次特別值得注意的地方,在於它不是只說自己支援 1M token,而是直接把底層架構 MSA(MiniMax Sparse Attention)推到台前。
按照官方說法,M3 在 1M 上下文規模下,單一 token 的計算量大約只有前代模型的 1/20;在推理效率上,prefill 超過 9 倍、decoding 超過 15 倍,相關算子速度也比常見的開源稀疏注意力方案高出 4 倍以上。這些數字當然還需要更多社群實測,但它至少揭露了一個清楚方向:MiniMax 知道長上下文要變成真能力,不能只靠把上限往上抬,而是必須把推理成本真的打下來。
這件事對開發者特別重要,因為真正需要長上下文的場景,本來就不是單純聊天,而是大型程式碼倉庫、長文件審閱、跨多個工具的工作流、長時間執行的代理任務,或需要保留完整歷史軌跡的研究與自動化流程。官方展示裡甚至拿出近 12 小時的論文復現任務,以及透過大量工具呼叫逐步把 CUDA kernel 效率拉高的案例,目的就是要把 M3 從「會回答問題」推向「能在長鏈條任務裡持續工作」。
它真正想搶的,是 coding 與 agent 工作流入口
從基準來看,MiniMax 這次最用力強調的是軟體工程與 agent 執行能力。官方列出的指標包括 SWE-Bench Pro 59.0%、Terminal-Bench 2.1 66.0%、SWE-fficiency 34.8%、KernelBench Hard 28.8% 與 MCP Atlas 74.2%。第三方報導則補上,M3 在 SVG-Bench、OmniDocBench 與自主 agent 評測上也被包進「國際前列」的敘事裡。
這些分數本身當然不是結論,因為不同 benchmark 各有偏差;但它們共同指向的訊號很明確:MiniMax 不想把 M3 定位成又一個通用對話模型,而是想把它放進 AI coding 與代理工作流的核心位置。這也是為什麼它同一天不只發博客,還同步更新 MiniMax Code、公開 GitHub 倉庫,並在官方說明中提到會陸續釋出技術報告與模型權重。
這裡的市場意義在於,很多前沿模型雖然能力很強,但開發者實際導入時常常面臨三個門檻:價格難預估、可觀測性不足、權重與部署選項不夠開放。MiniMax 嘗試用一套比較完整的組合拳來回答這些問題。官方 API 價格顯示,在 512K 以內上下文時,M3 的輸入價格是每百萬 token 0.6 美元、輸出 0.3 美元;進到 512K 到 1M 區間後,輸入升到 1.2 美元、輸出 4.8 美元,並另外列出快取讀取價格。它的 Token Plan 也直接提供 20、50、120 美元三個月費檔位。
價格不一定代表最便宜,但它讓開發者比較容易先做預算與架構規劃。對公開模型陣營來說,這種透明度本身就是競爭力。
原生多模態與即將開放權重,讓它不只是一個榜單故事
MiniMax 在博客裡反覆強調,M3 是從訓練起點就混合文本、圖像與影片資料的原生多模態模型,而不是後面再補一個視覺模組。它也提到交錯式多模態資料管線已擴張到 100 兆 token 等級。這件事的重要性,不只是讓模型「看得懂圖」,而是讓它更適合處理跨模態任務,例如帶圖文件理解、影片分析、桌面操作與需要結合工具回傳結果的複合流程。
這代表 M3 想切進的,不只是聊天市場,而是更貼近「工作」本身的任務層。這一點其實也能和今天另一條新聞互相對照:當 NVIDIA 在台北把 AI PC、伺服器與機器人綁成一條線 時,MiniMax 給出的答案則是,模型層要能承接這些新硬體與新工作流,關鍵不只是更聰明,而是更能長時間工作、更能調工具,也更容易被接進產品。
所以,MiniMax M3 真正值得注意的地方,不是又一個「中國模型追上誰」的標題,而是它把能力、架構、價格、工具入口與即將開放的權重路線一起拉到同一張桌上。當公開模型競賽開始這樣打,之後大家比較的就不再只是誰在排行榜多高幾分,而是誰最先變成開發者真的願意放進工作流的那一個。
