MiniMax M3 把前沿 coding、1M 上下文與原生多模態塞進同一模型，公開模型競賽開始改看整體可用性

2026 年上半年的模型新聞很多，但不是每一個「新模型發布」都值得當成產業訊號來看。MiniMax M3 之所以特別，不是因為它也喊了更長的上下文，而是它一次把幾個原本常常分開宣傳的賣點綁在一起：前沿 coding、Agent 任務、1M token 長上下文、原生多模態，以及相對完整的開放與商業化路徑。

如果只看宣傳標語，這很像又一個什麼都想做的大型語言模型。但把官方博客、API 訂閱頁面、GitHub 倉庫與第三方媒體整理放在一起看，M3 真正想證明的是另一件事：公開模型的競爭，接下來不會只比榜單分數，而是比誰更像一個能直接接進開發流程的完整產品。

今天 MiniMax 端出的重點，可以先濃縮成四件事：

它把 coding 與AI代理能力放在最前面，而不是先談通用聊天。
它把 1M 上下文窗口跟新的稀疏注意力架構一起講，表示這不是只拿來做行銷的數字。
它強調模型從訓練起點就是原生多模態，目標不只是讀圖，而是支援更完整的工具使用與 computer use 任務。
它同步給出 GitHub 倉庫、即將開放權重的時間表，以及 API 與訂閱價格，等於把「能不能用」與「用起來貴不貴」一起搬上桌。

為什麼這次的 1M 上下文不是裝飾數字

長上下文這個詞，過去一年幾乎已經被用到有點失真。很多模型確實能收下更長文件，但一旦進入真實任務，成本、延遲與穩定性就會快速變成問題。MiniMax 這次特別值得注意的地方，在於它不是只說自己支援 1M token，而是直接把底層架構 MSA（MiniMax Sparse Attention）推到台前。

按照官方說法，M3 在 1M 上下文規模下，單一 token 的計算量大約只有前代模型的 1/20；在推理效率上，prefill 超過 9 倍、decoding 超過 15 倍，相關算子速度也比常見的開源稀疏注意力方案高出 4 倍以上。這些數字當然還需要更多社群實測，但它至少揭露了一個清楚方向：MiniMax 知道長上下文要變成真能力，不能只靠把上限往上抬，而是必須把推理成本真的打下來。

這件事對開發者特別重要，因為真正需要長上下文的場景，本來就不是單純聊天，而是大型程式碼倉庫、長文件審閱、跨多個工具的工作流、長時間執行的代理任務，或需要保留完整歷史軌跡的研究與自動化流程。官方展示裡甚至拿出近 12 小時的論文復現任務，以及透過大量工具呼叫逐步把 CUDA kernel 效率拉高的案例，目的就是要把 M3 從「會回答問題」推向「能在長鏈條任務裡持續工作」。

它真正想搶的，是 coding 與 agent 工作流入口

從基準來看，MiniMax 這次最用力強調的是軟體工程與 agent 執行能力。官方列出的指標包括 SWE-Bench Pro 59.0%、Terminal-Bench 2.1 66.0%、SWE-fficiency 34.8%、KernelBench Hard 28.8% 與 MCP Atlas 74.2%。第三方報導則補上，M3 在 SVG-Bench、OmniDocBench 與自主 agent 評測上也被包進「國際前列」的敘事裡。

這些分數本身當然不是結論，因為不同 benchmark 各有偏差；但它們共同指向的訊號很明確：MiniMax 不想把 M3 定位成又一個通用對話模型，而是想把它放進 AI coding 與代理工作流的核心位置。這也是為什麼它同一天不只發博客，還同步更新 MiniMax Code、公開 GitHub 倉庫，並在官方說明中提到會陸續釋出技術報告與模型權重。

這裡的市場意義在於，很多前沿模型雖然能力很強，但開發者實際導入時常常面臨三個門檻：價格難預估、可觀測性不足、權重與部署選項不夠開放。MiniMax 嘗試用一套比較完整的組合拳來回答這些問題。官方 API 價格顯示，在 512K 以內上下文時，M3 的輸入價格是每百萬 token 0.6 美元、輸出 0.3 美元；進到 512K 到 1M 區間後，輸入升到 1.2 美元、輸出 4.8 美元，並另外列出快取讀取價格。它的 Token Plan 也直接提供 20、50、120 美元三個月費檔位。

價格不一定代表最便宜，但它讓開發者比較容易先做預算與架構規劃。對公開模型陣營來說，這種透明度本身就是競爭力。

原生多模態與即將開放權重，讓它不只是一個榜單故事

MiniMax 在博客裡反覆強調，M3 是從訓練起點就混合文本、圖像與影片資料的原生多模態模型，而不是後面再補一個視覺模組。它也提到交錯式多模態資料管線已擴張到 100 兆 token 等級。這件事的重要性，不只是讓模型「看得懂圖」，而是讓它更適合處理跨模態任務，例如帶圖文件理解、影片分析、桌面操作與需要結合工具回傳結果的複合流程。

這代表 M3 想切進的，不只是聊天市場，而是更貼近「工作」本身的任務層。這一點其實也能和今天另一條新聞互相對照：當 NVIDIA 在台北把 AI PC、伺服器與機器人綁成一條線時，MiniMax 給出的答案則是，模型層要能承接這些新硬體與新工作流，關鍵不只是更聰明，而是更能長時間工作、更能調工具，也更容易被接進產品。

所以，MiniMax M3 真正值得注意的地方，不是又一個「中國模型追上誰」的標題，而是它把能力、架構、價格、工具入口與即將開放的權重路線一起拉到同一張桌上。當公開模型競賽開始這樣打，之後大家比較的就不再只是誰在排行榜多高幾分，而是誰最先變成開發者真的願意放進工作流的那一個。