Apple 把 Siri 重寫成能看畫面又能跨 App 動手的 AI 助理，WWDC 終於補上最難一課

Apple 這次終於把最難的部分搬上台面了。不是再替 Siri 補一層漂亮的對話包裝，而是直接把它重寫成一個能看螢幕、讀個人上下文、跨 App 動手做事的 AI 助理。對外看起來，這是一場 WWDC 的壓軸翻身；但從產品結構來看，更像是蘋果終於承認：如果作業系統層沒有一個真正能理解語境的助手，Apple Intelligence 就只會是零散功能的集合，不會是新的平台能力。

Apple 在 WWDC 2026 同一天連發多份說明，把這次更新拆得很清楚。官方新聞稿把 Siri AI 定位為「全新版本的 Siri」，而不是舊 Siri 加上生成式回覆；另一份針對開發者的說明則直接把 App Intents、Apple Foundation Models、Xcode 27、MCP 與 agentic coding 一起端出來。這個組合傳遞的訊號很明確：蘋果不只是想把 Siri 變得比較會聊天，而是想把整個系統入口、開發者框架與裝置端/雲端模型協同，重新綁成一套操作層。

重點其實不是 Siri 會不會更像聊天機器人，而是 Apple 終於讓 Siri 能對「你現在正在做什麼」有足夠多的系統級理解。

這次 Siri AI 到底多了什麼

就官方已公布的能力來看，Siri AI 至少有四個明顯升級。第一，它能利用個人上下文理解，去找訊息、郵件、照片與其他內容，像是幫你從舊郵件裡找旅館確認碼、從朋友訊息裡挖出餐廳推薦，或從照片裡把某次旅行的特定人物與場景撈出來。第二，它有 onscreen awareness，能直接理解螢幕上的內容並回應，這讓它不再只是等待指令的語音入口，而是能接住當下畫面的系統助手。第三，它可以跨 App 執行更多動作，像是起草郵件、編修照片、分享內容。第四，它加入了 web grounding，能直接出去網路上補最新資訊，再生成回答。

蘋果沒有把這些能力只留在 iPhone 上。Siri AI 會以不同形態進入 iPhone、iPad、Mac、Apple Watch 與 Apple Vision Pro。iPhone 端新增了獨立 Siri app，對話紀錄會透過 iCloud 私密同步，讓使用者能在不同裝置之間接續同一段互動。Mac 與 iPad 端，Siri AI 被拉進 Spotlight 與系統右鍵選單；Vision Pro 則把它做成可被放進空間裡的 3D 視覺化介面。換句話說，Apple 不是在做一個新的 AI App，而是在把系統層各個入口都換成同一個大腦。

影像與畫面理解是這次另一個很關鍵的補洞。Apple 說 Siri AI 現在能處理更完整的 Visual Intelligence，iPhone 上甚至有新的相機模式，讓 Siri 可以直接看見眼前的東西，再完成分帳、營養資訊判讀等動作；而在 Mac 與 iPad 上，畫面理解能力也被做進截圖與快捷操作。這讓多模態不再只是拍照後問一句「這是什麼」，而是往「看見當下介面後直接做下一步」推進。

關鍵不是對話，而是把 Apple Intelligence 寫回系統骨架

這次發布裡最值得注意的，不是某個單一功能，而是 Apple 怎麼描述底層架構。官方說法是 Siri AI 建立在新一代 Apple Intelligence 架構上，會同時使用裝置端模型與 Private Cloud Compute。當請求需要送進雲端時，Apple 強調資料不會被儲存，也不會被 Apple 或其他人讀取，還維持可由外部專家驗證的隱私承諾。這段說法顯然是衝著市場上對大型語言模型與個人資料治理的疑慮來的，因為 Apple 很清楚，對它來說，這一波 AI 競爭若只剩功能表，並沒有優勢；它真正想守的是「系統級整合 + 隱私敘事」這條線。

但更有意思的是，Apple 同時承認它需要更大的模型與更開放的工具鏈。面向開發者的資料提到，新一代框架會支援更強的裝置端模型、server models、custom skills，開發者可以透過單一 Swift API 接上 Apple 的模型，也可以選擇 Claude、Gemini 等其他模型提供者，只要符合新的 language model protocol。這其實非常不蘋果，因為它等於在 AI 層正式接受多模型現實：系統入口可以是 Apple 的，但背後模型未必全是 Apple 的。

Xcode 27 的變化把這件事講得更白。Apple 直接把 agentic coding 拉進官方工作流，稱 Xcode 27 能把 Anthropic、Google、OpenAI 的模型與 agents 帶進開發流程，支援互動式規劃、多輪問答、Markdown canvas、測試、自動驗證、Simulator 互動，還支援透過 MCP 擴充工具、透過 Agent Client Protocol 接外部 agent。對開發者來說，這不是單純「IDE 裡有 AI 助理」而已，而是 Apple 正試圖避免自己在下一代開發入口上被 VS Code、Copilot、Claude Code 這些外部工作流完全邊緣化。

更值得注意的一點，是 Apple 對小型開發者的價格策略。官方開發者新聞稿提到，加入 App Store Small Business Program 且累計首次下載量低於 200 萬的開發者，可以在 Private Cloud Compute 上以「no cloud API cost」使用新一代 Apple Foundation Models。這不是常見的每月免費額度說法，而是直接把雲端模型使用成本暫時藏在平台補貼裡，降低開發者把 AI 能力塞進 iOS app 的門檻。蘋果在這裡的算盤很明顯：先把 Apple 生態內的 AI 體驗密度做起來，再談後面的商業化。

這場更新會怎麼改變使用者與開發者的操作習慣

對一般使用者來說，最直觀的改變會是「找東西」與「做事情」的邊界開始變淡。以前 Siri 很多時候像是一個語音快捷鍵，現在 Apple 要把它推成一個會讀懂上下文、可追問、能回頭續聊的助手。當 Siri 可同時理解你的訊息、照片、郵件、相機畫面與當前螢幕時，使用者跟手機互動的方式就會從開 App 找功能，逐漸改成先說出目標，再讓系統決定要走哪條路徑。

對開發者來說，壓力反而更大。因為只要想讓 app 內容被 Siri AI 找到、理解與操作，就得把 App Intents、動作暴露、內容結構與模型互動方式整理得更好。過去很多 app 的搜尋、捷徑與深層操作做得不夠完整，也不太會立即出事；但一旦 Apple 把個人上下文與跨 App 動作做成系統級入口，那些沒有把能力整理成可調用單位的 app，會更容易在新入口裡失去存在感。

Apple 這次仍然刻意留白的地方

不過，這場發布還不能算把所有問題都回答完。Apple 在 6 月 8 日面向大眾與開發者的公開資料裡，說清楚了能力、隱私架構、可用裝置、語言與測試時程，但沒有公開每 1M Token 成本、server model 的 context window，也沒有在主新聞稿裡給出能和 OpenAI、Anthropic、Google 直接橫向比較的 benchmark 數字。這代表外界目前還很難精確判斷，Apple 在模型成本、延遲與實際效能上到底追到什麼位置。

可用性也不是完全到位。官方明說，Siri AI 今年稍後才會以 beta 形式開給使用者，開發者雖然今天就能測，但 watchOS 仍要等之後的 beta。EU 地區方面，Mac 與 Vision Pro 可用，但 iOS、iPadOS、watchOS 不會第一時間推出；中國也暫時無法使用。這些限制意味著，Apple 雖然終於把 AI 助理推進系統主線，但真正的大規模落地，還得看監管、區域可用性與第三方 app 是否真的跟上。

即便如此，WWDC 2026 仍然是 Apple 這輪 AI 競賽裡最像樣的一次反擊。因為它不再只用幾個獨立功能去證明自己也有生成式 AI，而是開始把作業系統、裝置端模型、私密雲端運算、開發者框架與 IDE 工作流，全部拉到同一個敘事裡。Apple 這次真正補上的，不是一個會說更多話的 Siri，而是一個終於有機會長成系統操作層的 AI 助理。接下來市場要驗證的，就不是它能不能 demo 得漂亮，而是這套新架構能不能真的撐住日常使用、第三方整合與全球部署。