DeepSeek 把 V4-Pro 永久砍到四分之一價格後，前沿模型競賽先變成成本戰

一條數字就足以解釋這則消息為什麼重要: DeepSeek 把 V4-Pro 的 75% 折扣直接變成永久價格後，標準輸入成本降到每 100 萬 Token 0.435 美元，輸出成本降到 0.87 美元，快取命中時的輸入成本更只剩 0.003625 美元。對還在把生成式AI當成實驗的人來說，這可能只是又一輪價格戰；但對已經真的在跑長任務、批次處理、客服流程或智能體工作流的團隊來說，這是會直接改寫採購試算表的變化。

更關鍵的是，DeepSeek 並不是只把單價壓低而已。官方 API 文件顯示，V4-Pro 保留 1M context window、最高 384K 輸出，並同時支援 OpenAI 與 Anthropic 兩種 API 格式。換句話說，它賣的不只是便宜模型，而是一個足夠便宜、上下文夠長、而且切換摩擦刻意被壓低的替代選項。只要公司內部已經開始在意Token計費和總任務成本，DeepSeek 這次就不是新聞稿上的促銷，而是一次真正能進採購會議的報價。

模型	1M 輸入 Token	1M 輸出 Token	Context
DeepSeek V4-Pro	$0.435	$0.87	1M
GPT-5.5	$5.00	$30.00	標準價，長上下文另計
Claude Opus 4.7	$5.00	$25.00	依供應商設定

只看這張表，就知道 DeepSeek 為什麼會讓西方前沿模型公司不舒服。它不是在某個邊角規格便宜一點，而是連最常被大量消耗的輸出 token 都壓到一個會讓人重新思考「要不要真的繼續買最強模型」的水位。

便宜到足以讓「夠好就好」變成主流選項

前沿模型市場這一年越來越像企業軟體，而不像消費者 App。公司真正在意的從來不只是模型榜單誰排第一，而是能不能接既有系統、能不能穩定出結果、延遲與吞吐量能不能接受，以及月帳單最後會不會失控。這也是為什麼站內前幾天才剛寫到 Gemini 3.5 Flash 正式 GA 後，Google 把前沿模型價格戰與代理戰綁成同一件事: 當模型開始真的跑進流程，價格就不再是附帶資訊，而會變成主戰場。

DeepSeek 這次的殺傷力尤其在輸出端。很多AI 代理或長流程任務不是吃很多輸入，而是會產生大量中間推理、工具呼叫回應、摘要、重寫和最終輸出。你如果只看輸入 token 單價，很容易低估總成本；但一旦輸出價格差到數十倍，企業就會開始問一個更現實的問題: 我到底是需要最強的答案，還是需要一個夠好、夠便宜、能長時間跑下去的系統？

這也是為什麼 The Decoder 特別提醒，原始單價只是一半故事，另一半是模型每完成一個任務實際會燒掉多少 token。若某個模型表面便宜，但因為回合更長、推理標記消耗更多、需要更多重試，最後總帳單仍可能偏高。不過 DeepSeek 現在的價格低到足以讓它先拿到一張很有力的入場券: 即使效率沒有全面勝過 GPT-5.5 或 Opus 4.7，很多團隊也會願意先拿來跑「不是最核心但最燒量」的工作。

DeepSeek 想賣的不只是模型，而是切換成本更低的替代路徑

官方文件把 OpenAI 與 Anthropic 格式相容直接寫進 API 說明，這是一個非常商業化的動作。因為企業導入新模型最大的阻力，常常不是模型本身，而是整個工程鏈要不要重寫。只要 API 介面、工具呼叫邏輯與請求格式不用大改，評估門檻就會大幅下降。對技術主管來說，這代表可以先把一部分流量切過去做 A/B 測試，而不需要發動一次大型遷移專案。

這點和單純喊「我們更便宜」差很多。真正有效的價格戰，一定要同時配合切換便利性，否則便宜只是理論優勢。DeepSeek 現在給出的組合是: 足夠長的 context、極低的單價、雙格式相容，以及一個讓開發者可以先小規模替換的路徑。這才是它對 OpenAI、Anthropic 甚至 Google 形成壓力的原因。

還有兩個現實問題，會決定這波價格戰能吃下多少市場

第一個問題是穩定性與交付品質。企業不會只因為便宜就把核心流量全搬走，尤其是高風險客服、金融、法務或程式碼工作流。只要模型在錯誤率、延遲、工具調用成功率或長任務穩定度上仍明顯落後，DeepSeek 很可能先吃到的是成本敏感但容錯較高的工作，而不是最肥也最關鍵的核心預算。

第二個問題是供應與治理。當越來越多企業真的把長任務切去 DeepSeek，大家很快會開始看 rate limit、併發限制、區域可用性、法遵審查與資料處理條件。官方目前把 V4-Pro 的 concurrency limit 標成 500，V4-Flash 則是 2500。這表示它確實在把 API 服務當成熟產品賣，但同時也提醒市場: 價格再漂亮，最後還是要回到實際交付能力與治理條件，才能變成大規模採購。

真正被打到的，是前沿模型公司的財務敘事

如果前沿模型公司都還在「先衝能力、晚點談利潤」，那 DeepSeek 這種打法的意義就只是市場搶量。但現在情況不一樣了。站內幾天前才寫到 OpenAI 傳低調遞交 IPO 文件，前沿 AI 的競賽開始從模型榜單改看財務耐力。當投資人、董事會和企業客戶都開始追問單位經濟、毛利與可持續定價時，一家能把高階模型壓到四分之一價格的競爭者，打到的就不只是產品，而是整套財務預期。

這不代表 DeepSeek 已經在能力上全面超車。相反地，許多第三方解讀都承認它和 GPT-5.5、Opus 4.7 之間仍有性能差距，真正差多少也得看任務型態。但市場接下來會更常出現一種情境: 最好的模型仍拿去跑最關鍵、最難錯的流程；較便宜但夠強的模型，開始吞掉更大量、可容忍波動的任務。只要這個分層採購邏輯成立，DeepSeek 就已經贏下一塊非常實際的市場。

所以這篇新聞最值得看的，不是「中國模型又降價」這麼簡單，而是前沿模型競賽正在改用更成熟也更殘酷的方式被衡量: 每百萬 token 花多少、長上下文會不會額外加價、切換 API 要重寫多少工程、以及一個代理系統跑完整個月後，財務長看到的帳單到底長什麼樣子。DeepSeek 現在把這些問題一起推到檯面上了。