返回趨勢情報
趨勢情報

OpenAI 與 Broadcom 端出 Jalapeño 推論晶片後,前沿模型競賽開始從買 GPU 變成自己定義算力形狀

2026年6月24日
EZJAI 編輯部
9 分鐘閱讀
#LLM#OpenAI#Microsoft#Broadcom#Jalapeño#推理晶片#ASIC
OpenAI 與 Broadcom 端出 Jalapeño 推論晶片後,前沿模型競賽開始從買 GPU 變成自己定義算力形狀

Broadcom 執行長 Hock Tan 把一片晶圓交到 Sam Altman 與 Greg Brockman 手上時,現場照片看起來像半導體業的例行發表會;但對 openai 來說,這是第一次把「Intelligence Processor」這個名字寫進自家新聞稿。這顆名叫 Jalapeño 的加速器不是通用 GPU 的改款,而是從零為 llm 推論(inference) 設計的 ASIC——也就是使用者對 chatgpt 或 Codex 下 prompt、模型即時吐出答案那一段,而不是訓練階段那種吃滿整個資料中心數週的運算。

官方公告把分工講得很具體:OpenAI 負責架構與對未來模型路線的理解;Broadcom 負責矽片實作、Tomahawk 網路晶片與量產;加拿大 Celestica 負責板卡、機櫃與系統整合。路透引述 OpenAI 硬體負責人 Richard Ho 說,Jalapeño 的目標是讓大型語言模型在推論時更快、更省電。工程樣本已在實驗室以目標頻率與功耗運行,包含 GPT-5.3-Codex-Spark 這類工作負載——OpenAI 稱從設計到 tape-out 只花了約九個月,並宣稱這是它所知高性能半導體領域最快的 ASIC 開發週期之一;設計過程中還動用了自家舊世代模型協助部分優化。最終性能 benchmark 尚未公布,但早期測試聲稱每瓦性能「大幅優於」現有最先進水準,詳細技術報告將在未來數月發表。

為什麼專攻推論,而不是再去搶訓練晶片

訓練前沿模型仍高度依賴 nvidia 等供應商的通用 GPU 叢集,這點 VentureBeat 與 Ars Technica 在報導中都明確指出:Jalapeño 短期內不會取代訓練堆疊,而是針對已經部署的模型,在服務數億使用者時把成本與延遲壓下來。對 生成式ai 商業模式而言,推論才是日常燒錢的主戰場——每一個 token 都要算錢,每一毫秒延遲都影響留存。

雲端巨頭早就在走這條路:google 的 TPU、Amazon 的 Trainium 都是把自家工作負載綁進客製矽片。本站先前整理過 Amazon 準備把 Trainium 賣到 AWS 之外 的動向,說明雲端巨頭已不把晶片當內部降本工具,而是當產品線。OpenAI 這次等於補上同一塊拼圖:它仍是 Microsoft 等夥伴的大客戶,但開始擁有「模型怎麼跑」的硬體話語權。

The Decoder 與 TechSphere 引述的商業細節值得記下:Broadcom 據傳要求 Microsoft 保證承接首批產量約 40%,以降低 gigawatt 級部署的投資風險;Tan 則談到與 Microsoft 及其他夥伴在 2026 年底前啟動大規模資料中心部署。Reuters 還提到 Tan 坦言,AI 晶片對高頻寬記憶體需求旺盛,在記憶體漲價週期裡,客製 AI 晶片的利潤率不如 Broadcom 傳統網路交換器業務——這提醒讀者,客製矽片不是一上馬就印鈔,而是長期容量與供應鏈賭注。

項目已披露內容
晶片名稱Jalapeño(OpenAI 首款 Intelligence Processor)
主要用途LLM 推論,非通用訓練
設計到流片約 9 個月
實驗室測試模型GPT-5.3-Codex-Spark(目標頻率與功耗)
性能表述每瓦性能優於現況(正式 benchmark 待公布)
首批部署目標2026 年底前,gigawatt 規模
合作夥伴Broadcom(矽片+網路)、Celestica(系統)、Microsoft 等

用自家模型設計晶片:閉環還是敘事

「OpenAI 用自己的模型加速晶片設計」是這則新聞裡最吸睛的一句,但也最容易被過度解讀。OpenAI 發言人對 VentureBeat 表示無法指明是哪一代模型參與,只確認是較舊世代;這比較像 EDA 與架構探索流程的自動化輔助,而不是「GPT 畫出完整晶片佈局」。不過,對產業觀察者仍有象徵意義:當 ai 同時掌握模型、kernel、服務系統與硬體需求,軟硬體共同設計的迴圈會比傳統「買卡、調框架」更短。

Jalapeño 架構強調減少資料搬移、平衡運算、記憶體與網路,讓實際利用率更接近理論峰值——這套語言和 transformer 推論的瓶頸(注意力矩陣、KV cache、跨節點通訊)高度相關。若技術報告日後證實有效,企業客戶未來談 API 合約時,除了看模型 benchmark,還可能問供應商有多少推論流量跑在自研矽片上,因為那直接關聯到單價能否持續下調。

對開發者與企業採購的實際含義

短期內,你的 Codex 或 ChatGPT 體驗不會因為 Jalapeño 明天就變快——晶片要先進資料中心、再逐步替換或混排現有叢集。Ars Technica 與 OpenAI 官方都把它定位為多世代平台的第一步,不是一次性硬體秀。

中期要看三個驗證點:第一,公開的每瓦性能與延遲數據能否對標現用 GPU 叢集;第二,Microsoft 與其他租戶是否真的吃下首批產能,避免「有片無場」;第三,推論成本下降能否反映到 API 定價或企業方案,而不是只改善毛利。對比 SpaceX 收購 Cursor 那種「用分發渠道鎖開發者」的路線,OpenAI 這步是在堆疊底層——兩條線最後都指向同一個問題:誰能更低成本地交付 coding 與代理工作負載。

獨立開發者現在能做的,是繼續用現有 API 做產品,但把「供應商基礎設施是否自研化」列入觀察清單。若 Jalapeño 真能顯著壓低推論成本,長期可能讓高頻代理任務(長對話、多輪工具呼叫)從奢侈品變成預設選項;若進度延宕,OpenAI 仍得和所有人一樣在記憶體短缺週期裡跟 nvidia 排隊。

產業位置:不是取代 NVIDIA,而是多一條腿走路

Reuters 與 Yahoo Tech 的敘事都相當克制:NVIDIA 在訓練與通用 AI 運算仍居中;Broadcom 本來就是 hyperscaler 客製晶片的大包商,這次只是把 OpenAI 從「純買方」拉進共同定義規格的圈子。對 Broadcom 股東,這是 AI 熱潮下客製業務的又一個錨點;對 OpenAI,這是在 IPO 與巨額基建投資週期裡,向資本市場展示「我們不只會燒錢租算力,也會塑造算力」。

一句話:Jalapeño 的真正賭注不是晶片名字多好記,而是 OpenAI 能否像雲端巨頭一樣,把模型經濟學寫進矽片——讓每一次使用者提問,都在為自己設計的硬體付費,而不是永遠替別人的通用 GPU 交租金。

接下來幾個月,請盯 OpenAI 是否發布可重現的推論 benchmark、Broadcom 財報是否披露客製 AI 訂單規模,以及 2026 年底前是否有公開資料中心切換進度。rumor 從 2023 年就存在,這次晶圓交到手上才算開局;距離「推論便宜到改變產品定價」還有一段硬體量產與調度的路程要走。