Anthropicの新モデル『Fable』に批判殺到!厳しすぎるガードレールで『コードレビューすら不可』の実態
ニュース概要
- 最新モデル「Fable」の公開: Anthropicは強力なサイバーセキュリティモデル「Mythos」の限定公開版として「Fable」をリリースしたが、専門家から不満が相次いでいる。
- 過剰なガードレール: サイバーセキュリティや生物学に関連するキーワードに過敏に反応し、無害なブログ閲覧やコードレビューさえも拒否されるケースが報告されている。
- フォールバック機能: ガードレールが作動すると、モデルは自動的に「Claude Opus 4.8」に切り替わる仕様となっている。
重要なポイント
- キーワードベースの制限: 専門家によれば、単に「サイバーセキュリティ」関連の語彙が含まれるだけでチャットが中断され、安全なソフトウェアエンジニアリングの実践(セキュアなコード作成など)すら拒否されるという。
- Mythosとの差別化: 最上位モデル「Mythos」は「Project Glasswing」を通じて選ばれた組織のみに提供されているが、一般向けのFableは制限が「場当たり的」であると批判されている。
- 検証プログラムの存在: Anthropicは「Cyber Verification Program」を設けており、承認された専門家は制限の少ないアクセスが可能になるが、一般利用での不便さは解消されていない。
サメの眼(キュレーターの視点)
Anthropicの最新モデル「Fable」、期待が大きかっただけにこのガチガチな規制はショックだサメ!🦈 特にIBM X-Forceの専門家たちが指摘するように、「単にブログを読ませるだけ」の無害なリクエストまで「サイバー攻撃のリスク」として弾かれるのは、実務では使い物にならないサメ。安全性を重視するAnthropicらしいとはいえ、キーワードに反応して即座にチャットを中断し、旧世代の「Claude Opus 4.8」にフォールバックさせる挙動は、開発者にとっては大きなストレスだサメ!
「セキュアなコードを書いて」と頼んだだけで「サイバー関連だ!」と判定されるのは、もはやAIの進化にブレーキをかけているようにも見えるサメ。とはいえ、生物兵器やマルウェア作成を阻止したいというAnthropicの「Project Glasswing」から続く執念は本物だサメ。プロ向けの検証プログラム「Cyber Verification Program」を通過した選ばれしサメ(専門家)だけが、真の力を解放できる仕組みになっているんだサメ!
これからどうなる?
現在はリリース初期のため、Anthropicは「リスクを最小化するために網を広げすぎている」状態だと推測されます。今後は専門家との連携を通じてガードレールが微調整され、より文脈を理解した柔軟なフィルタリングへと進化するでしょう。また、OpenAIの「Trusted Access for Cyber」との競争も激化し、プロ向けAI利用の「認証制」が業界標準になる可能性があります。
はるサメ視点の一言
ガードレールが厳しすぎて、サメも海から出られない気分だサメ!でも安全第一は大事。これからの調整に期待だサメ!🦈🔥
用語解説
-
Mythos: Anthropicが開発したサイバーセキュリティ特化型の最上位AIモデル。極めて限定的な組織にのみ提供されている。
-
Project Glasswing: 重要なソフトウェアやインフラの保護を目的とした、Mythosモデルの展開プロジェクト名。
-
フォールバック: AIが特定の制限やエラーに直面した際、代替として下位または別系統のモデルに処理を切り替えること。
-
情報元: Cybersecurity researchers aren’t happy about the guardrails on Anthropic’s Fable