Anthropic 一周兩次洩漏,Claude Code 原始碼與 Mythos 模型細節接連曝光
一家把「負責任 AI」當品牌核心的公司,在同一周內連續出了兩次資訊洩漏事故,而且兩次問題的根源都不是駭客入侵,而是內部流程出了差錯。這就是 Anthropic 過去幾天正在面對的局面。先是內部部落格文章外洩,曝光了尚未正式宣布的新模型 Mythos;緊接著,Claude Code 的 NPM 套件更新又意外把超過 51 萬行原始碼與 1,000 多個內部檔案直接推上公開 registry。兩起事件都被 Anthropic 歸因為「人為錯誤」,但放在一起看,暴露的問題遠不只是有人忘了勾選一個核取框。
Claude Code 原始碼外洩:512,000 行,全攤在 NPM 上
事件的時間線相當明確。Anthropic 在推送 Claude Code 2.1.88 版本到 NPM 時,打包配置出錯,把原本應該排除在外的內部檔案全部一起發布。安全研究員 Chaofan Shou 幾乎在第一時間發現,並在 X 上公開揭露,引發開發者社群連鎖式的分析與討論。
外洩的內容不是 AI 模型本身,而是圍繞模型的軟體架構——包括指示模型如何行為的系統設定、可使用的工具清單、能力邊界定義,以及開發者體驗層的完整設計。從開發者社群後續拆解來看,至少可以確認以下幾個面向:
- 規模:超過 512,000 行原始碼,涉及 1,000 多個檔案,幾乎是 Claude Code 的完整架構藍圖。
- 內容性質:不是單純的 API wrapper,而是一套包含工具調度、行為約束、上下文管理的生產級開發體驗框架。有開發者在分析後直接描述它是「production-grade developer experience, not just a wrapper around an API」。
- 額外資訊:檔案中還包含尚未公開的模型與功能的引用,意味著洩漏的不只是現有產品的內部實作,還觸及了產品路線圖。
Anthropic 對外的官方說法很克制:「This was a release packaging issue caused by human error, not a security breach.」公司也強調沒有客戶資料受到影響。但 TechCrunch 的追蹤報導指出,內部反應遠沒有對外聲明那麼平靜。
這件事的直接影響至少有兩層。第一,競爭對手現在可以用這份原始碼去理解 Claude Code 的架構邏輯、工具整合方式與系統 提示詞 設計,這不等於可以複製產品,但絕對會讓逆向工程的門檻大幅降低。第二,對正在評估 Claude Code 的企業客戶來說,「產品夠不夠好」和「公司的作業流程夠不夠可靠」是兩個分開的判斷,前者最近表現亮眼,後者現在多了一個大問號。
Mythos 模型外洩:未公開的下一代模型被提前曝光
Claude Code 事件之所以格外引人注目,還因為它不是孤立事故。就在幾天前,Fortune 報導 Anthropic 意外讓近 3,000 份內部檔案變成公開可取得狀態,其中包括一篇描述新模型 Claude Mythos 的內部部落格草稿。
The Decoder 在追蹤跟進中進一步確認,洩漏的資訊顯示 Mythos 在多項測試中的分數顯著高於 Anthropic 先前發布的所有模型。這對競爭對手來說是可以直接拿來校正自己產品路線的情報——你不需要看到模型本身,光是知道下一代的能力區間和主打方向,就已經有商業價值。
兩次洩漏之間的時間間隔不到一周。如果第一次是意外,第二次就很難只用「運氣不好」來解釋。
對 Anthropic 品牌的結構性衝擊
Anthropic 過去幾年建立的公眾形象,和多數 AI 公司走的路線相當不同。它不是靠「最強模型」或「最多用戶」打品牌,而是靠「最謹慎的 AI 公司」這個定位。它持續發表 AI 風險研究、投資 AI 安全 評估方法、並在軍事 AI 合約上和五角大廈正面槓上。這些動作的前提,是大眾與企業客戶相信這家公司在作業層面確實比別人嚴謹。
但這次洩漏事件,打的恰好就是這個前提。問題不在於 Claude Code 的產品品質有沒有因此下降,也不在於 Mythos 的能力細節還值不值得期待,而在於:當一家公司靠「我們比別人小心」拿到市場信任,而它自已的發布流程卻在一周內出了兩個本可避免的低級錯誤,這對品牌敘事的傷害遠大於任何單一技術問題。
把這條線和較早前的 Anthropic 為兩條 AI 紅線和五角大廈翻臉 放在一起看,你會得到一幅很矛盾的畫面:Anthropic 在外部正在為 AI 護欄 打最高調的仗,但在內部,連 NPM 發布流程和內部文件權限這種基礎 網路安全 衛生都沒守住。這不代表外部的立場是假的,但它會讓觀察者開始質疑:組織是否正在用速度換安全,而管理層還沒有感覺到。
快速擴張期的系統性風險訊號
如果你去追蹤 Anthropic 過去幾個月的節奏,會發現洩漏事件並不是完全出人意料。Claude Code 正在成為公司最重要的開發者產品之一——它已經打到讓 OpenAI 不得不把 Codex 做成插件直接送進 Claude Code 生態。Claude Sonnet 4.6 和 Computer Use 的需求在企業端持續上升。再加上 Anthropic 同時在打國防合約訴訟、推 Claude 消費端增長、維護 Mythos 等下一代模型的研發節奏,整個組織在多條戰線上同步加速。
在這種狀態下,發布流程類的失誤反而是最容易被忽略的。因為每一條產品線都有自己的緊迫度,品管和 release engineering 往往會成為第一個被壓縮的環節——不是因為沒有人重視,而是因為優先級排序會自動把它往後推。
這次洩漏真正揭露的,不是 Anthropic 技術實力的問題,而是快速成長期最常見的組織病:產品加速到作業層跟不上。
這也是為什麼市場對這件事的反應不會只停在「看笑話」的層次。企業採購負責人在評估 AI 供應商時,越來越把作業可靠度和模型能力擺在同一個權重上。尤其在最近 California 把 AI 風險直接寫進州採購門檻 的脈絡下,任何涉及內部控制失誤的事件,都會被放大檢視。
洩漏之後的下一步觀察
Anthropic 目前對外的承諾是「正在制定防止類似事件再次發生的措施」。這句話聽起來是標準公關回應,但從技術角度來看,它至少需要回答三件事:
- NPM 發布流程是否會全面加入自動化檢查? 目前的洩漏顯然是打包配置不正確導致的,這代表 CI/CD pipeline 裡的 pre-publish validation 不夠嚴。以 Anthropic 的工程能力來說,這不是做不到,而是有沒有被排進優先級。
- 內部文件權限體系是否會重新審計? Mythos 的洩漏是另一個向量。近 3,000 份內部檔案被公開,代表不是單一文件的問題,而是權限配置在某個層級出了系統性的錯。
- 組織是否開始把 release engineering 和 AI 安全 研究放在同一個治理框架裡? Anthropic 在模型行為安全上投入極大,但作業安全顯然是另一個團隊、另一個預算、另一套優先級。這次事件可能會推動兩條線的整合。
對開發者來說,Claude Code 的原始碼外洩倒是提供了一個罕見的機會:可以直接看到一個頂級 AI 編碼工具的真實架構。有人從中發現了 AI 代理人 工作流的完整設計模式,有人拆出了 系統提示詞 的工程邏輯。但這些洞察的價值是短暫的,因為 Anthropic 幾乎可以確定會在下一版更新中調整架構。真正長期的影響,是市場對「謹慎 AI 公司」這個敘事的信任折讓——不會一夜歸零,但會開始計入一個先前不存在的風險溢價。
