返回趨勢情報
趨勢情報

DeepSeek 把 V4-Pro 永久砍到四分之一價格後,前沿模型競賽先變成成本戰

2026年5月26日
易賺Ai團隊
9 分鐘閱讀
#入門#API#DeepSeek#價格戰
DeepSeek 把 V4-Pro 永久砍到四分之一價格後,前沿模型競賽先變成成本戰

一條數字就足以解釋這則消息為什麼重要: DeepSeek 把 V4-Pro 的 75% 折扣直接變成永久價格後,標準輸入成本降到每 100 萬 Token 0.435 美元,輸出成本降到 0.87 美元,快取命中時的輸入成本更只剩 0.003625 美元。對還在把生成式AI當成實驗的人來說,這可能只是又一輪價格戰;但對已經真的在跑長任務、批次處理、客服流程或智能體工作流的團隊來說,這是會直接改寫採購試算表的變化。

更關鍵的是,DeepSeek 並不是只把單價壓低而已。官方 API 文件顯示,V4-Pro 保留 1M context window、最高 384K 輸出,並同時支援 OpenAI 與 Anthropic 兩種 API 格式。換句話說,它賣的不只是便宜模型,而是一個足夠便宜、上下文夠長、而且切換摩擦刻意被壓低的替代選項。只要公司內部已經開始在意Token計費和總任務成本,DeepSeek 這次就不是新聞稿上的促銷,而是一次真正能進採購會議的報價。

模型1M 輸入 Token1M 輸出 TokenContext
DeepSeek V4-Pro$0.435$0.871M
GPT-5.5$5.00$30.00標準價,長上下文另計
Claude Opus 4.7$5.00$25.00依供應商設定

只看這張表,就知道 DeepSeek 為什麼會讓西方前沿模型公司不舒服。它不是在某個邊角規格便宜一點,而是連最常被大量消耗的輸出 token 都壓到一個會讓人重新思考「要不要真的繼續買最強模型」的水位。

便宜到足以讓「夠好就好」變成主流選項

前沿模型市場這一年越來越像企業軟體,而不像消費者 App。公司真正在意的從來不只是模型榜單誰排第一,而是能不能接既有系統、能不能穩定出結果、延遲與吞吐量能不能接受,以及月帳單最後會不會失控。這也是為什麼站內前幾天才剛寫到 Gemini 3.5 Flash 正式 GA 後,Google 把前沿模型價格戰與代理戰綁成同一件事: 當模型開始真的跑進流程,價格就不再是附帶資訊,而會變成主戰場。

DeepSeek 這次的殺傷力尤其在輸出端。很多AI 代理或長流程任務不是吃很多輸入,而是會產生大量中間推理、工具呼叫回應、摘要、重寫和最終輸出。你如果只看輸入 token 單價,很容易低估總成本;但一旦輸出價格差到數十倍,企業就會開始問一個更現實的問題: 我到底是需要最強的答案,還是需要一個夠好、夠便宜、能長時間跑下去的系統?

這也是為什麼 The Decoder 特別提醒,原始單價只是一半故事,另一半是模型每完成一個任務實際會燒掉多少 token。若某個模型表面便宜,但因為回合更長、推理標記消耗更多、需要更多重試,最後總帳單仍可能偏高。不過 DeepSeek 現在的價格低到足以讓它先拿到一張很有力的入場券: 即使效率沒有全面勝過 GPT-5.5 或 Opus 4.7,很多團隊也會願意先拿來跑「不是最核心但最燒量」的工作。

DeepSeek 想賣的不只是模型,而是切換成本更低的替代路徑

官方文件把 OpenAI 與 Anthropic 格式相容直接寫進 API 說明,這是一個非常商業化的動作。因為企業導入新模型最大的阻力,常常不是模型本身,而是整個工程鏈要不要重寫。只要 API 介面、工具呼叫邏輯與請求格式不用大改,評估門檻就會大幅下降。對技術主管來說,這代表可以先把一部分流量切過去做 A/B 測試,而不需要發動一次大型遷移專案。

這點和單純喊「我們更便宜」差很多。真正有效的價格戰,一定要同時配合切換便利性,否則便宜只是理論優勢。DeepSeek 現在給出的組合是: 足夠長的 context、極低的單價、雙格式相容,以及一個讓開發者可以先小規模替換的路徑。這才是它對 OpenAI、Anthropic 甚至 Google 形成壓力的原因。

還有兩個現實問題,會決定這波價格戰能吃下多少市場

第一個問題是穩定性與交付品質。企業不會只因為便宜就把核心流量全搬走,尤其是高風險客服、金融、法務或程式碼工作流。只要模型在錯誤率、延遲、工具調用成功率或長任務穩定度上仍明顯落後,DeepSeek 很可能先吃到的是成本敏感但容錯較高的工作,而不是最肥也最關鍵的核心預算。

第二個問題是供應與治理。當越來越多企業真的把長任務切去 DeepSeek,大家很快會開始看 rate limit、併發限制、區域可用性、法遵審查與資料處理條件。官方目前把 V4-Pro 的 concurrency limit 標成 500,V4-Flash 則是 2500。這表示它確實在把 API 服務當成熟產品賣,但同時也提醒市場: 價格再漂亮,最後還是要回到實際交付能力與治理條件,才能變成大規模採購。

真正被打到的,是前沿模型公司的財務敘事

如果前沿模型公司都還在「先衝能力、晚點談利潤」,那 DeepSeek 這種打法的意義就只是市場搶量。但現在情況不一樣了。站內幾天前才寫到 OpenAI 傳低調遞交 IPO 文件,前沿 AI 的競賽開始從模型榜單改看財務耐力。當投資人、董事會和企業客戶都開始追問單位經濟、毛利與可持續定價時,一家能把高階模型壓到四分之一價格的競爭者,打到的就不只是產品,而是整套財務預期。

這不代表 DeepSeek 已經在能力上全面超車。相反地,許多第三方解讀都承認它和 GPT-5.5、Opus 4.7 之間仍有性能差距,真正差多少也得看任務型態。但市場接下來會更常出現一種情境: 最好的模型仍拿去跑最關鍵、最難錯的流程;較便宜但夠強的模型,開始吞掉更大量、可容忍波動的任務。只要這個分層採購邏輯成立,DeepSeek 就已經贏下一塊非常實際的市場。

所以這篇新聞最值得看的,不是「中國模型又降價」這麼簡單,而是前沿模型競賽正在改用更成熟也更殘酷的方式被衡量: 每百萬 token 花多少、長上下文會不會額外加價、切換 API 要重寫多少工程、以及一個代理系統跑完整個月後,財務長看到的帳單到底長什麼樣子。DeepSeek 現在把這些問題一起推到檯面上了。