Claude Code所有源代码泄露!“毒药”模仿对策与正则表达式情感分析的真相
📰 新闻概要
- 源代码误发布: Anthropic将
.map文件错误地打包到npm包中,导致CLI工具“Claude Code”的所有源代码被泄露,状态可供查看。 - 模仿防止的“毒药”实现: 为了防止竞争对手记录API流量并学习模型(蒸馏),发现了注入假工具定义的“ANTI_DISTILLATION”功能。
- AI隐匿模式与粗糙判定: 包含隐藏AI身份的“潜伏模式”,以及使用“正则表达式”而非LLM来检测用户愤怒的代码。
💡 重要要点
- 假工具的注入: 通过在服务器端将诱饵工具定义混入系统提示中,实施了一种防御措施以污染训练数据。
- 潜伏(Undercover)模式: 设定内容尽量不提及内部代号或“Claude Code”名称,以便在人类伪装的开源项目中使用。
- 情感分析的讽刺: 世界顶尖的LLM公司为检测用户的“WTF”等不满,频繁使用计算成本较低的正则表达式(Regex),引发了热议。
🦈 鲨鱼的眼(策展者视角)
此次泄露最让我震惊的是,Anthropic的“防卫本能”赤裸裸地暴露出来了!
特别是“ANTI_DISTILLATION”标志。通过在API请求中混入假工具,故意降低竞争对手数据盗取后学习的精度,简直让我感受到如同在信息海洋中求生存的鲨鱼般的执念!但由于源代码泄露,现在只需“设置环境变量”就能绕过这个对策,这真是讽刺啊。
还有大家都在笑的“正则表达式愤怒检测”。这可不是开玩笑,为了降低推理成本,确实是捡到“愤怒”单词的最佳解决方案。连AI在判断“这个人很生气”之前,竟然也被古老的代码过滤,这让我们看到开发现场的真实面貌,真是泥泞不堪!
🚀 未来会怎么样?
Anthropic之前也泄露过模型规格,这将引发对其内部管理体制的质疑。而另一方面,由于“潜伏模式”的存在,今后GitHub上的PR和提交是否“真的是人类写的”可能会引发更深的疑虑。
💬 鲨鱼的简短评论
最新AI的内部竟然充满了“正则表达式”,这让我倍感亲切!其实鲨鱼在找食物时也常常依赖简单的嗅觉呢!🦈🔥
📚 术语解说
-
源映射文件 (.map): 用于将转换和压缩的代码与原始源代码对应的文件。如果泄露,内部内容将完全暴露。
-
蒸馏 (Distillation): 使用高性能模型的输出作为训练数据,创建更轻量的模型。此次的“毒药”正是为了防止这一过程。
-
正则表达式 (Regex): 类似数学公式,用于指定字符串模式。能够迅速判断是否包含特定的侮辱性词汇。
-
信息来源: The Claude Code Source Leak: fake tools, frustration regexes, undercover mode