Anthropic 一周兩次洩漏，Claude Code 原始碼與 Mythos 模型細節接連曝光

一家把「負責任 AI」當品牌核心的公司，在同一周內連續出了兩次資訊洩漏事故，而且兩次問題的根源都不是駭客入侵，而是內部流程出了差錯。這就是 Anthropic 過去幾天正在面對的局面。先是內部部落格文章外洩，曝光了尚未正式宣布的新模型 Mythos；緊接著，Claude Code 的 NPM 套件更新又意外把超過 51 萬行原始碼與 1,000 多個內部檔案直接推上公開 registry。兩起事件都被 Anthropic 歸因為「人為錯誤」，但放在一起看，暴露的問題遠不只是有人忘了勾選一個核取框。

Claude Code 原始碼外洩：512,000 行，全攤在 NPM 上

事件的時間線相當明確。Anthropic 在推送 Claude Code 2.1.88 版本到 NPM 時，打包配置出錯，把原本應該排除在外的內部檔案全部一起發布。安全研究員 Chaofan Shou 幾乎在第一時間發現，並在 X 上公開揭露，引發開發者社群連鎖式的分析與討論。

外洩的內容不是 AI 模型本身，而是圍繞模型的軟體架構——包括指示模型如何行為的系統設定、可使用的工具清單、能力邊界定義，以及開發者體驗層的完整設計。從開發者社群後續拆解來看，至少可以確認以下幾個面向：

規模：超過 512,000 行原始碼，涉及 1,000 多個檔案，幾乎是 Claude Code 的完整架構藍圖。
內容性質：不是單純的 API wrapper，而是一套包含工具調度、行為約束、上下文管理的生產級開發體驗框架。有開發者在分析後直接描述它是「production-grade developer experience, not just a wrapper around an API」。
額外資訊：檔案中還包含尚未公開的模型與功能的引用，意味著洩漏的不只是現有產品的內部實作，還觸及了產品路線圖。

Anthropic 對外的官方說法很克制：「This was a release packaging issue caused by human error, not a security breach.」公司也強調沒有客戶資料受到影響。但 TechCrunch 的追蹤報導指出，內部反應遠沒有對外聲明那麼平靜。

這件事的直接影響至少有兩層。第一，競爭對手現在可以用這份原始碼去理解 Claude Code 的架構邏輯、工具整合方式與系統提示詞設計，這不等於可以複製產品，但絕對會讓逆向工程的門檻大幅降低。第二，對正在評估 Claude Code 的企業客戶來說，「產品夠不夠好」和「公司的作業流程夠不夠可靠」是兩個分開的判斷，前者最近表現亮眼，後者現在多了一個大問號。

Mythos 模型外洩：未公開的下一代模型被提前曝光

Claude Code 事件之所以格外引人注目，還因為它不是孤立事故。就在幾天前，Fortune 報導 Anthropic 意外讓近 3,000 份內部檔案變成公開可取得狀態，其中包括一篇描述新模型 Claude Mythos 的內部部落格草稿。

The Decoder 在追蹤跟進中進一步確認，洩漏的資訊顯示 Mythos 在多項測試中的分數顯著高於 Anthropic 先前發布的所有模型。這對競爭對手來說是可以直接拿來校正自己產品路線的情報——你不需要看到模型本身，光是知道下一代的能力區間和主打方向，就已經有商業價值。

兩次洩漏之間的時間間隔不到一周。如果第一次是意外，第二次就很難只用「運氣不好」來解釋。

對 Anthropic 品牌的結構性衝擊

Anthropic 過去幾年建立的公眾形象，和多數 AI 公司走的路線相當不同。它不是靠「最強模型」或「最多用戶」打品牌，而是靠「最謹慎的 AI 公司」這個定位。它持續發表 AI 風險研究、投資 AI 安全評估方法、並在軍事 AI 合約上和五角大廈正面槓上。這些動作的前提，是大眾與企業客戶相信這家公司在作業層面確實比別人嚴謹。

但這次洩漏事件，打的恰好就是這個前提。問題不在於 Claude Code 的產品品質有沒有因此下降，也不在於 Mythos 的能力細節還值不值得期待，而在於：當一家公司靠「我們比別人小心」拿到市場信任，而它自已的發布流程卻在一周內出了兩個本可避免的低級錯誤，這對品牌敘事的傷害遠大於任何單一技術問題。

把這條線和較早前的 Anthropic 為兩條 AI 紅線和五角大廈翻臉放在一起看，你會得到一幅很矛盾的畫面：Anthropic 在外部正在為 AI 護欄打最高調的仗，但在內部，連 NPM 發布流程和內部文件權限這種基礎網路安全衛生都沒守住。這不代表外部的立場是假的，但它會讓觀察者開始質疑：組織是否正在用速度換安全，而管理層還沒有感覺到。

快速擴張期的系統性風險訊號

如果你去追蹤 Anthropic 過去幾個月的節奏，會發現洩漏事件並不是完全出人意料。Claude Code 正在成為公司最重要的開發者產品之一——它已經打到讓 OpenAI 不得不把 Codex 做成插件直接送進 Claude Code 生態。Claude Sonnet 4.6 和 Computer Use 的需求在企業端持續上升。再加上 Anthropic 同時在打國防合約訴訟、推 Claude 消費端增長、維護 Mythos 等下一代模型的研發節奏，整個組織在多條戰線上同步加速。

在這種狀態下，發布流程類的失誤反而是最容易被忽略的。因為每一條產品線都有自己的緊迫度，品管和 release engineering 往往會成為第一個被壓縮的環節——不是因為沒有人重視，而是因為優先級排序會自動把它往後推。

這次洩漏真正揭露的，不是 Anthropic 技術實力的問題，而是快速成長期最常見的組織病：產品加速到作業層跟不上。

這也是為什麼市場對這件事的反應不會只停在「看笑話」的層次。企業採購負責人在評估 AI 供應商時，越來越把作業可靠度和模型能力擺在同一個權重上。尤其在最近 California 把 AI 風險直接寫進州採購門檻的脈絡下，任何涉及內部控制失誤的事件，都會被放大檢視。

洩漏之後的下一步觀察

Anthropic 目前對外的承諾是「正在制定防止類似事件再次發生的措施」。這句話聽起來是標準公關回應，但從技術角度來看，它至少需要回答三件事：

NPM 發布流程是否會全面加入自動化檢查？ 目前的洩漏顯然是打包配置不正確導致的，這代表 CI/CD pipeline 裡的 pre-publish validation 不夠嚴。以 Anthropic 的工程能力來說，這不是做不到，而是有沒有被排進優先級。
內部文件權限體系是否會重新審計？ Mythos 的洩漏是另一個向量。近 3,000 份內部檔案被公開，代表不是單一文件的問題，而是權限配置在某個層級出了系統性的錯。
組織是否開始把 release engineering 和 AI 安全研究放在同一個治理框架裡？ Anthropic 在模型行為安全上投入極大，但作業安全顯然是另一個團隊、另一個預算、另一套優先級。這次事件可能會推動兩條線的整合。

對開發者來說，Claude Code 的原始碼外洩倒是提供了一個罕見的機會：可以直接看到一個頂級 AI 編碼工具的真實架構。有人從中發現了 AI 代理人工作流的完整設計模式，有人拆出了系統提示詞的工程邏輯。但這些洞察的價值是短暫的，因為 Anthropic 幾乎可以確定會在下一版更新中調整架構。真正長期的影響，是市場對「謹慎 AI 公司」這個敘事的信任折讓——不會一夜歸零，但會開始計入一個先前不存在的風險溢價。