Claude Codeの全ソースが流出!「毒入り」模倣対策や正規表現による感情分析の実態
📰 ニュース概要
- ソースコードの誤公開: Anthropicがnpmパッケージに
.mapファイルを同梱してしまい、CLIツール「Claude Code」の全ソースコードが閲覧可能な状態で流出した。 - 模倣防止の「毒入れ」実装: 競合他社がAPIトラフィックを記録してモデルを学習(蒸留)するのを防ぐため、偽のツール定義を注入する「ANTI_DISTILLATION」機能の存在が判明した。
- AI秘匿モードと泥臭い判定: AIであることを隠す「潜入モード」や、ユーザーの怒りをLLMではなく「正規表現」で検知するコードが含まれていた。
💡 重要なポイント
- 偽ツールの注入: サーバー側でデコイ(おとり)のツール定義をシステムプロンプトに混ぜることで、トレーニングデータを汚染させる防御策が実装されていた。
- 潜入(Undercover)モード: 内部コードネームや「Claude Code」という名称を一切出さないようにし、オープンソースプロジェクトなどで人間を装うための設定が存在する。
- 感情分析の皮肉: 世界最高峰のLLM企業が、ユーザーの「WTF」などの不満を検知するために、計算コストの低い正規表現(Regex)を多用していたことが話題を呼んでいる。
🦈 サメの眼(キュレーターの視点)
今回の流出で一番シビれたのは、Anthropicの「防衛本能」が剥き出しになっている点だサメ!
特に「ANTI_DISTILLATION」フラグ。APIリクエストに偽のツールを混ぜて、他社がデータを盗んで学習した際にその精度を落とす「毒入りプロンプト」を仕込むなんて、まさに情報の海を生き抜くサメのような執念を感じるサメ!ただ、ソースがバレたことで「環境変数をセットするだけ」でこの対策を回避できることも判明しちゃったのは皮肉だサメね。
あと、みんなが笑っている「正規表現による怒り検知」。これは笑い事じゃなくて、推論コストを抑えつつ、確実に「キレてる」単語を拾うには最適解なんだサメ。AIですら「こいつキレてるな」と判断する前に、古典的なコードでフィルタリングされているという現実は、開発の現場がいかに泥臭いかを物語っているサメ!
🚀 これからどうなる?
Anthropicは以前にもモデルスペックを漏洩させており、内部の管理体制が問われることになる。一方で、この「潜入モード」の存在により、今後GitHub上のPRやコミットが「本当に人間が書いたものか」を巡る疑念がさらに深まる可能性があるサメ。
💬 はるサメ視点の一言
最新AIの中身が「正規表現」だらけだったなんて、親近感がわくサメ!サメもエサを探すときは意外と単純な嗅覚に頼ってるんだサメ!🦈🔥
📚 用語解説
-
ソースマップファイル (.map): 変換・圧縮されたコードを元のソースコードに対応させるためのファイル。これが漏れると、中身が丸見えになる。
-
蒸留 (Distillation): 高性能なモデルの出力を学習データとして使い、より軽量なモデルを作る手法。これを防ぐのが今回の「毒入れ」だサメ。
-
正規表現 (Regex): 文字列のパターンを指定する数式のようなもの。特定の罵倒語が含まれているかを瞬時に判別できる。
-
情報元: The Claude Code Source Leak: fake tools, frustration regexes, undercover mode