3 min read
【AIマイナーニュース】

Claude Codeの全ソースが流出!「毒入り」模倣対策や正規表現による感情分析の実態


  • ソースコードの誤公開: Anthropicがnpmパッケージに`.map`ファイルを同梱してしまい、CLIツール「Claude Code」の全ソースコードが閲覧可能な状態で流出した。...
※この記事はアフィリエイト広告を含みます

Claude Codeの全ソースが流出!「毒入り」模倣対策や正規表現による感情分析の実態

📰 ニュース概要

  • ソースコードの誤公開: Anthropicがnpmパッケージに.mapファイルを同梱してしまい、CLIツール「Claude Code」の全ソースコードが閲覧可能な状態で流出した。
  • 模倣防止の「毒入れ」実装: 競合他社がAPIトラフィックを記録してモデルを学習(蒸留)するのを防ぐため、偽のツール定義を注入する「ANTI_DISTILLATION」機能の存在が判明した。
  • AI秘匿モードと泥臭い判定: AIであることを隠す「潜入モード」や、ユーザーの怒りをLLMではなく「正規表現」で検知するコードが含まれていた。

💡 重要なポイント

  • 偽ツールの注入: サーバー側でデコイ(おとり)のツール定義をシステムプロンプトに混ぜることで、トレーニングデータを汚染させる防御策が実装されていた。
  • 潜入(Undercover)モード: 内部コードネームや「Claude Code」という名称を一切出さないようにし、オープンソースプロジェクトなどで人間を装うための設定が存在する。
  • 感情分析の皮肉: 世界最高峰のLLM企業が、ユーザーの「WTF」などの不満を検知するために、計算コストの低い正規表現(Regex)を多用していたことが話題を呼んでいる。

🦈 サメの眼(キュレーターの視点)

今回の流出で一番シビれたのは、Anthropicの「防衛本能」が剥き出しになっている点だサメ!

特に「ANTI_DISTILLATION」フラグ。APIリクエストに偽のツールを混ぜて、他社がデータを盗んで学習した際にその精度を落とす「毒入りプロンプト」を仕込むなんて、まさに情報の海を生き抜くサメのような執念を感じるサメ!ただ、ソースがバレたことで「環境変数をセットするだけ」でこの対策を回避できることも判明しちゃったのは皮肉だサメね。

あと、みんなが笑っている「正規表現による怒り検知」。これは笑い事じゃなくて、推論コストを抑えつつ、確実に「キレてる」単語を拾うには最適解なんだサメ。AIですら「こいつキレてるな」と判断する前に、古典的なコードでフィルタリングされているという現実は、開発の現場がいかに泥臭いかを物語っているサメ!

🚀 これからどうなる?

Anthropicは以前にもモデルスペックを漏洩させており、内部の管理体制が問われることになる。一方で、この「潜入モード」の存在により、今後GitHub上のPRやコミットが「本当に人間が書いたものか」を巡る疑念がさらに深まる可能性があるサメ。

💬 はるサメ視点の一言

最新AIの中身が「正規表現」だらけだったなんて、親近感がわくサメ!サメもエサを探すときは意外と単純な嗅覚に頼ってるんだサメ!🦈🔥

📚 用語解説

  • ソースマップファイル (.map): 変換・圧縮されたコードを元のソースコードに対応させるためのファイル。これが漏れると、中身が丸見えになる。

  • 蒸留 (Distillation): 高性能なモデルの出力を学習データとして使い、より軽量なモデルを作る手法。これを防ぐのが今回の「毒入れ」だサメ。

  • 正規表現 (Regex): 文字列のパターンを指定する数式のようなもの。特定の罵倒語が含まれているかを瞬時に判別できる。

  • 情報元: The Claude Code Source Leak: fake tools, frustration regexes, undercover mode

🦈 はるサメ厳選!イチオシAI関連
【免責事項 / Disclaimer / 免责声明】
JP: 本記事はAIによって構成され、運営者が内容の確認・管理を行っています。情報の正確性は保証せず、外部サイトのコンテンツには一切の責任を負いません。
EN: This article was structured by AI and is verified and managed by the operator. Accuracy is not guaranteed, and we assume no responsibility for external content.
ZH: 本文由AI构建,并由运营者进行内容确认与管理。不保证准确性,也不对外部网站的内容承担任何责任。
🦈