返回趨勢情報
趨勢情報

OpenAI 發表 GPT-5.4,原生電腦操作與 OSWorld 成績一起公開

OpenAI Introduces GPT-5.4 With Native Computer Use and Published OSWorld Results

2026年3月5日
易賺Ai團隊
4 分鐘閱讀
#AI新聞#OpenAI#GPT-5.4#Computer Use#API#ChatGPT
OpenAI 發表 GPT-5.4,原生電腦操作與 OSWorld 成績一起公開

OpenAI 發表 GPT-5.4,原生電腦操作與 OSWorld 成績一起公開

OpenAI 正式推出 GPT-5.4,並把這一代模型的重點明確放在原生電腦操作、專業工作流程與更長上下文處理能力。根據 OpenAI 公告,GPT-5.4 與 GPT-5.4 Pro 已同步進入 ChatGPTAPI 與 Codex,讓同一個模型家族可以同時面向一般聊天、開發者整合與程式工作台。

這次更新最受注意的不是單一 benchmark,而是 OpenAI 直接把 computer use 能力與公開測試結果一起放上台面。官方列出的 OSWorld-Verified 分數為 75.0%,代表 GPT-5.4 不只是會回答問題的 LLM,而是被定位成能在圖形介面中執行任務的模型。這條路線也延續了另一篇 OpenAI 把 Codex 推向安全代理工作流,顯示 coding agent 正在進入真實軟體流程 提到的方向,讓模型從回覆層更直接走向執行層。

官方公布的能力重點

OpenAI 表示,GPT-5.4 的預設 context window 為 272K tokens,Codex 中另有實驗性 1M context 模式。這代表一般產品與 API 使用者會先看到標準長上下文配置,而需要更長工作記憶的程式與代理場景,則由 Codex 承接。官方也說明,超出標準範圍的使用會有額外 overage 規則,但公告中沒有把所有超額細節完整展開。

除了上下文長度,這次發表也把 computer use 明列成原生能力。OpenAI 以 OSWorld-Verified 75.0% 作為主要公開成績,說明 GPT-5.4 已可在桌面環境中完成更多多步驟操作。這一點與 Promptfoo 把 agent 安全變成正式測試層,OpenAI 的代理時代開始面對驗收壓力 形成直接呼應: 模型能做更多事之後,外界就會同步要求更清楚的可驗證能力與風險邊界。

API 定價與產品分層

OpenAI 同步公開 GPT-5.4 與 GPT-5.4 Pro 的 API 價格。GPT-5.4 為每百萬 input tokens 2.50 美元、cached input 0.25 美元、output 15 美元;GPT-5.4 Pro 則拉高到每百萬 input tokens 30 美元、output 180 美元。從這組定價來看,OpenAI 很明顯沒有把 Pro 版本設計成大眾化替代品,而是鎖定更高價值、低失敗容忍度的工作。

官方也把模型供應路徑切得很清楚。一般使用者可在 ChatGPT 直接使用,開發者可透過 API 接入,程式工作流則可在 Codex 中拿到更長上下文與實驗性配置。這種分層方式,讓 GPT-5.4 不再只是單一模型發布,而比較像一套跨產品線的能力上架。

這次公告沒有藏起關鍵規格

和很多只用「更強、更快」形容升級的模型更新不同,GPT-5.4 這次至少把幾個最關鍵的指標直接公開,包括 computer use、OSWorld-Verified 75.0%、標準 272K context、Codex 1M 實驗模式,以及 API 價格。OpenAI 沒有在這篇公告裡額外公開更多第三方 benchmark,也沒有把所有安全限制與部署差異一次寫完,但它已經先把最容易被開發者拿來比較的幾個硬指標放了出來。

就目前官方資訊來看,GPT-5.4 的核心訊號很清楚: OpenAI 想把新一代旗艦模型往可操作電腦、可承接長流程、可直接上產品線的方向推進,而不是只停在聊天品質的升級敘事。