「コードを直して」が禁忌の言葉に!?最先端AI「Fable 5」禁輸措置の裏側が判明
何が起きたのか?ニュースの概要
- 米政府の過剰反応: トランプ政権がAnthropicの最先端モデル「Fable 5」および「Mythos 5」へのアクセスを制限する輸出管理指令を出した理由は、特殊な「ジェイルブレイク」ではなく、ごく単純なプロンプトだったことが判明した。
- 引き金は3単語: 著名なセキュリティ研究者ケイティ・ムスーリス氏によれば、問題視されたのは「Fix this code(このコードを直して)」という指示。脆弱性のあるコードをAIに修正させ、テストスクリプトを生成させたことが「国家安全保障上の脅威」と見なされた。
- Anthropicの対応: 指令を受け、Anthropicはコンプライアンスを確保するために、全顧客に対して対象モデルを無効化した。
なぜこれが重要なのか?注目すべきポイント
- 防御側の武器が奪われる: ムスーリス氏ら100人以上の専門家は、AIによるバグ発見・修正・テストのループは「防御側にとって最も価値のある機能」であり、これを制限することは攻撃者を利するだけだと警告している。
- 他国の台頭: 米国が自国モデルを縛る一方で、中国のDeepSeekなどは「蒸留攻撃」を用いて米国企業の知能を吸収しており、規制の効果に疑問が投げかけられている。
🦈 サメの眼(キュレーターの視点)
信じられない事態だサメ!「コードを直して」なんて、エンジニアが毎日100万回は使う日常語だサメ。これが「兵器」扱いされるなんて、もはや開発の現場は大混乱だサメ!
特に、Fable 5が当初「セキュリティ問題のレビュー」を拒否したのに、言い方を変えただけで修正に応じたという点。これはガードレールの設計ミスというより、AIが「本来すべき正しい仕事」をしただけだサメ。守るためのツールを政府が取り上げるのは、サメから牙を抜くようなもの。敵はもっと鋭い牙を磨いているのに、これじゃ戦えないサメ!
これからどうなる?
セキュリティコミュニティからの猛反発を受け、トランプ政権がこの極端な規制を撤回するかが焦点になるサメ。もし維持されれば、米国の開発者は性能の劣るモデルを使い、中国などのオープンウェイトモデルが世界のデファクトスタンダードになる逆転現象が起きるかもしれないサメ。
はるサメ視点の一言
「このシャツは兵器です」って書かれたTシャツ、俺も欲しいサメ!コード修正は罪じゃないサメ!🦈🔥
用語解説
-
CVE: 共通脆弱性識別子。ソフトウェアのセキュリティ上の弱点に割り振られる固有の番号のことサメ。
-
ワッセナー・アレンジメント: 武器や汎用品の輸出を管理する国際的な枠組み。AIソフトもその対象になりつつあるサメ。
-
蒸留攻撃(Distillation Attack): 高性能なモデルの回答を別のモデルに学習させ、低コストで同等の知能をコピーする手法のことサメ。
-
情報元: Feds freaked over Fable 5 after ‘fix this code’, not jailbreak, say researchers