OpenAI 發表 GPT-5.4，原生電腦操作與 OSWorld 成績一起公開

OpenAI 正式推出 GPT-5.4，並把這一代模型的重點明確放在原生電腦操作、專業工作流程與更長上下文處理能力。根據 OpenAI 公告，GPT-5.4 與 GPT-5.4 Pro 已同步進入 ChatGPT、API 與 Codex，讓同一個模型家族可以同時面向一般聊天、開發者整合與程式工作台。

這次更新最受注意的不是單一 benchmark，而是 OpenAI 直接把 computer use 能力與公開測試結果一起放上台面。官方列出的 OSWorld-Verified 分數為 75.0%，代表 GPT-5.4 不只是會回答問題的 LLM，而是被定位成能在圖形介面中執行任務的模型。這條路線也延續了 OpenAI 最近把 coding agent 往真實工作流推進的方向，讓模型從回覆層更直接走向執行層。

GPT-5.4 這次公開的是一整組可比較的硬指標

項目	GPT-5.4	GPT-5.4 Pro
Input 價格	2.50 美元 / 1M tokens	30 美元 / 1M tokens
Cached input	0.25 美元 / 1M tokens	未特別強調
Output 價格	15 美元 / 1M tokens	180 美元 / 1M tokens
Context window	272K	272K
OSWorld-Verified	75.0%	75.0%

官方公布的能力重點

OpenAI 表示，GPT-5.4 的預設 context window 為 272K tokens，Codex 中另有實驗性 1M context 模式。這代表一般產品與 API 使用者會先看到標準長上下文配置，而需要更長工作記憶的程式與代理場景，則由 Codex 承接。官方也說明，超出標準範圍的使用會有額外 overage 規則，但公告中沒有把所有超額細節完整展開。

除了上下文長度，這次發表也把 computer use 明列成原生能力。OpenAI 以 OSWorld-Verified 75.0% 作為主要公開成績，說明 GPT-5.4 已可在桌面環境中完成更多多步驟操作。這一點也和代理安全被正式拉進測試層的趨勢形成直接呼應: 模型能做更多事之後，外界就會同步要求更清楚的可驗證能力與風險邊界。

API 定價與產品分層

OpenAI 同步公開 GPT-5.4 與 GPT-5.4 Pro 的 API 價格。GPT-5.4 為每百萬 input tokens 2.50 美元、cached input 0.25 美元、output 15 美元；GPT-5.4 Pro 則拉高到每百萬 input tokens 30 美元、output 180 美元。從這組定價來看，OpenAI 很明顯沒有把 Pro 版本設計成大眾化替代品，而是鎖定更高價值、低失敗容忍度的工作。

官方也把模型供應路徑切得很清楚。一般使用者可在 ChatGPT 直接使用，開發者可透過 API 接入，程式工作流則可在 Codex 中拿到更長上下文與實驗性配置。這種分層方式，讓 GPT-5.4 不再只是單一模型發布，而比較像一套跨產品線的能力上架。

這次公告沒有藏起關鍵規格

和很多只用「更強、更快」形容升級的模型更新不同，GPT-5.4 這次至少把幾個最關鍵的指標直接公開，包括 computer use、OSWorld-Verified 75.0%、標準 272K context、Codex 1M 實驗模式，以及 API 價格。OpenAI 沒有在這篇公告裡額外公開更多第三方 benchmark，也沒有把所有安全限制與部署差異一次寫完，但它已經先把最容易被開發者拿來比較的幾個硬指標放了出來。

就目前官方資訊來看，GPT-5.4 的核心訊號很清楚: OpenAI 想把新一代旗艦模型往可操作電腦、可承接長流程、可直接上產品線的方向推進，而不是只停在聊天品質的升級敘事。

OpenAI 發表 GPT-5.4，原生電腦操作與 OSWorld 成績一起公開

GPT-5.4 這次公開的是一整組可比較的硬指標

官方公布的能力重點

API 定價與產品分層

這次公告沒有藏起關鍵規格

相關推薦