Claude Code 源码泄露事件始末:51万行代码是如何"被开源"的?

2026年3月31日凌晨,Anthropic 旗下 AI 编程工具 Claude Code 的完整源码通过 npm 包意外泄露。51.2 万行 TypeScript 代码在数小时内被全球开发者镜像、分析、甚至用 Rust 重写。这是 Anthropic 一周内的第二次泄露事故,也可能是 AI 行业迄今最大规模的非故意代码曝光事件。

一、为什么会泄露?

1.1 直接原因:一个被遗忘的 source map 文件

2026年3月31日,Anthropic 将 @anthropic-ai/claude-code 的 2.1.88 版本发布到 npm 公共仓库。问题在于——这个包里附带了一个 59.8MB 的 .map 文件

Source map 是开发调试工具,它能将压缩混淆后的代码映射回原始源码。正常情况下,.map 文件绝不应该出现在生产发布包中。

Claude Code 使用 Bun 作为打包工具,而 Bun 默认生成 source map。要排除它,需要在构建配置中显式关闭,或者在 .npmignore / package.jsonfiles 字段中排除 *.map两者都没有做到。

更糟的是,这个 .map 文件不仅包含映射信息,还直接指向了一个托管在 Anthropic Cloudflare R2 存储桶上的 zip 压缩包——任何人都可以下载并解压获得完整源码。

正如工程师 Gabriel Anhaia 所评论的:

"一个配错的 .npmignore 或 package.json files 字段,就能暴露一切。"

1.2 深层原因:这不是第一次

事实上,这已经是 Anthropic 第三次在 npm 包中意外发布 source map。此前社区项目 CCLeaks 就曾通过类似方式逆向分析出未公开功能。

更值得注意的是,就在5天前(3月26日),Anthropic 刚刚经历了另一次泄露——约 3000 个内部文件被意外公开,其中包含一篇关于未发布模型 "Mythos"(内部代号 Capybara) 的草稿博客,揭露了这款"比 Opus 更大更强但也更贵"的新一代模型。

一周两次泄露,对于一家年化营收 190 亿美元、估值 3800 亿美元的 AI 公司来说,暴露出的是工程流程管控的系统性短板。

二、泄露了什么?

2.1 规模概览

指标 数据
文件数 ~1,900 个 TypeScript 文件
代码行数 512,000+ 行
内置工具 ~40 个
斜杠命令 ~50 个
Feature Flag 44 个(已构建但未上线)
Source map 大小 59.8 MB

alt

alt

2.4 代码质量争议

泄露代码也引发了对代码质量的讨论:

  • print.ts 单个文件 5,594 行,其中一个函数长达 3,167 行,包含 12 层嵌套和 486 个分支点
  • 一个 bug 曾导致每天浪费约 25 万次 API 调用,仅用三行代码就修复了
  • 情绪检测(用户是否在骂人)使用正则表达式匹配脏话词表,而非调用自家 LLM

三、项目推荐

项目 星标 说明
instructkr/claw-code 50K+(2小时达成,史上最快) Clean-room Python 重写,正在 Rust 重写
Kuberwastaken/claude-code 数千 源码备份 + 完整架构分析 + Rust 实现
Ahmad-progr/claude-leaked-files 教育用途泄露快照
其他大量 fork/mirror 总计 41,500+ fork 数小时内遍布全球

四、影响有多大?

4.1 竞争情报泄露

Claude Code 不是普通的前端代码。它是一个拥有文件系统访问、终端执行、代码仓库读写权限的 Agent 工具。泄露的实现细节大幅降低了竞对的研究成本,尤其是:

  • 信任边界如何在用户意图和执行之间划定
  • 权限执行机制如何控制高风险操作
  • 启动阶段的安全检查流程
  • 子进程中的凭据处理方式

4.2 安全攻击面扩大

Claude Code 此前已有多个 CVE 记录:

CVE 漏洞类型
CVE-2025-59828 信任前执行缺陷
CVE-2025-58764 命令审批绕过
CVE-2025-64755 只读验证失败
CVE-2026-21852 信任确认前的 API 请求

源码公开后,这些已知漏洞模式变得更容易被定向利用。

4.3 知识产权流失

对于一家年化营收 190 亿美元的公司来说,这不仅是安全事件,更是战略性知识产权外泄。架构模式、工具系统、多 Agent 编排——这些都已成为公共领域的讨论素材。claw-code 项目在 2 小时内就完成了 clean-room 重写并获得 5 万星标,证明社区有能力快速消化和复制这些模式。

4.4 对行业的影响

积极面:泄露客观上为整个 AI Agent 开发者社区提供了一份"工业级参考实现",加速了 Agentic AI 工具链的成熟。

消极面:反蒸馏机制和 Undercover Mode 的曝光引发了关于 AI 公司透明度和开源贡献伦理的广泛讨论。

五、最后结果

5.1 Anthropic 的应急响应

  • 第一时间将受影响的 2.1.88 版本标记为 deprecated,随后从 npm 注册表中撤下
  • 发布无 source map 的新版本
  • 官方声明:"今天早些时候,一个 Claude Code 版本包含了一些内部源代码。没有涉及或暴露任何敏感客户数据或凭据。这是一个由人为错误造成的发布打包问题,而非安全漏洞。"
  • 承诺推出防止复发的措施

5.2 但覆水难收

Anthropic 的响应速度不慢,但为时已晚:

  • 源码在数小时内被镜像到多个 GitHub 仓库,总计被 fork 超过 41,500 次
  • claw-code 等项目已经在此基础上构建新工具
  • 所有关键技术细节已被多篇深度分析文章详细记录
  • 互联网没有删除键——正如 Decrypt 的标题所说:"互联网永远保留了它"

5.3 给开发者的教训

这个事件给所有使用 npm 发布包的团队敲响了警钟:

  1. 检查构建流水线:确保 .map 文件被排除在发布配置之外
  2. 在 CI 中实施发布前检查:自动扫描最终分发包中是否包含 .map 文件或 sourceMappingURL 指令
  3. source map 走私有通道:通过私有上传服务而非公共 CDN 分发调试文件
  4. 不要假设"默认安全":Bun 默认生成 source map,不显式关闭就会泄露
#Claude Code泄露源码#
全部评论
我感觉就是故意的
点赞 回复 分享
发布于 04-02 22:40 北京

相关推荐

Claude Code 51 万行源码泄露,是一场低级失误引发的行业地震,更是一次免费的技术普惠。它证明:顶级 AI 编程助手≠大模型堆参数,而是架构设计 + 工具编排 + 上下文管理 + 安全机制的综合工程。从六层架构到 Multi-Agent、智能压缩,这套设计已经成为 AI Coding Agent 的事实标准。1.用户交互层:终端 UI,自研引擎不卡技术:React + 自研 Ink 渲染引擎(重写 Reconciler,80 + 文件)。核心:解决 AI 流式输出(每秒几十次更新)的卡顿问题,用双缓冲渲染实现 16ms 级流畅刷新。形态:CLI 命令行、支持彩色 / 滚动 / 实时编辑、多面板布局。2. 命令与技能层:100 + 斜杠命令,降低门槛作用:把复杂 Agent 能力包装成/commit、/diff、/tasks、/agents等Slash 命令,开发者不用记复杂语法。能力:覆盖 Git 工作流、多 Agent 管理、任务调度、外部工具接入(MCP 协议)。3. 核心引擎层(大脑):QueryEngine + 工具 + 权限三驾马车这是 Claude Code 的灵魂,4.6 万行代码的 QueryEngine 是绝对核心。QueryEngine:对话编排中枢,负责任务拆解、思维链、工具选择、循环重试、结果汇总,把自然语言转成可执行步骤。工具系统:定义 40 + 标准工具(文件、Bash、Git、搜索、子 Agent),支持动态扩展、并行调用。权限框架:细粒度工具审批(自动 / 手动确认)、危险命令黑名单(rm -rf)、沙箱降权、审计日志。4. 服务层:对接大模型与外部能力核心服务:claude.ts封装所有 Anthropic API 通信,管理请求 / 响应 / 长连接、流式输出。外部集成:MCP 协议(Model Context Protocol)接入第三方工具、Git/GitHub API、文件系统、终端命令。5. 上下文与记忆层:解决 AI “失忆”,长对话不崩Claude Code 最惊艳的设计之一 ——四层记忆 + 智能压缩,支持超长会话、项目级理解。系统提示(claude.md):项目级规则(技术栈、规范、风格)。目录状态:代码树结构、关键文件、依赖关系。对话摘要:历史压缩,保留关键信息、剔除冗余。实时上下文:工具调用最新结果、当前编辑内容。压缩机制:上下文用到 75%~92% 时自动触发,按信息密度(代码占比)优先压缩低价值内容,避免 Token 爆炸。6. 基础设施层:运行底座运行时:Bun(非 Node.js)—— 更快启动、更低内存、原生 TS 支持。状态管理:React Hooks 全局状态、文件持久化、跨会话记忆。安全沙箱:本地权限隔离、命令白名单、操作审计。三、藏在代码里的 5 大黑科技:为什么 Claude Code 比普通 AI 助手强?1. Multi-Agent 蜂群协作:一个需求,一群 AI 干活泄露代码曝光了未发布的多 Agent 系统—— 彻底告别 “单个 AI 串行干活”。主 Agent(协调器):拆解任务、分发、汇总结果。子 Agent(分工):前端、后端、测试、文档各守一职,独立上下文、并行执行。通信:共享消息总线,直接对话、无需人工中转。效果:200k Token 任务拆成 3 个 70k 并行,速度 ×3、质量更高、不丢上下文。2. 双模式推理引擎:快任务秒回,复杂任务深度啃快速路径:轻量子模型,延迟 < 50ms,处理简单查询(解释代码、查函数)。深度路径:全模型 + 多阶段推理 + 工具循环,支持7 小时 + 无中断代码重构。3. Hook 自动化:开发流程 “自动驾驶”事件驱动触发器,7 类核心 Hook(文件编辑、消息、工具 / 任务前后),改 JSON 就能配置自动化:改测试→自动跑 Lint;提交前→自动跑测试;写入文件→自动规范校验。4. 代理式搜索(Agentic Search):不上传代码库,更安全传统助手(Copilot)要把整个代码库上传云端索引,隐私风险大。Claude Code:按需调用工具,只读需要的文件、本地处理,不把全库发云端。5. 反竞争防御:偷偷塞 “假工具”源码曝光:每次 API 调用会混入几个假工具—— 专门污染偷数据训练竞品的人,属于 Anthropic 的 “商业防御黑科技”。
Claude Code泄...
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务