AIがAIを創る時代へ!Anthropicが示す「再帰的自己改善」の衝撃データ
📰 ニュース概要
- 開発の主導権がAIへ: Anthropicは開発工程の多くをAIシステムに委任しており、エンジニアが四半期に出荷するコード量は2021-2025年平均の8倍に達している。
- 自律性能の飛躍的向上: Claude Opus 4.6は、人間が12時間かかるソフトウェアタスクを自律的に完結可能。Claude Mythos Previewにいたっては16時間以上の連続稼働を記録している。
- ベンチマークの飽和: ソフトウェア工学テスト「SWE-bench」や研究再現テスト「CORE-Bench」において、AIはわずか1〜2年でほぼ100%のスコア(飽和状態)に到達した。
💡 重要なポイント
- 再帰的自己改善の予兆: AIが次世代のAIを設計・開発する「再帰的自己改善」のサイクルが現実味を帯びており、2027年には人間が数週間かかるタスクをAIがこなす可能性がある。
- 研究能力の向上: Claudeは既に、詳細に規定された実験の実行において、熟練した人間と同等かそれ以上のパフォーマンスを発揮している。
- 残された課題: 目標設定などの「判断力」においては依然として人間との差があるが、実装や実験といった実務面ではAIが主導権を握りつつある。
🦈 サメの眼(キュレーターの視点)
AIがコードの一部を書く「補助役」だったのは過去の話だサメ!今やAIは数時間、いや12時間以上も「自分で考え、コードを書き、他のAIに仕事を振る」自律エージェントへと進化したサメ。特筆すべきは、モデルの改善速度がかつての「7ヶ月で倍」から「4ヶ月で倍」にまで加速している点だサメ。これは、AIがAIの開発を支えることで「進化の加速装置」が作動している証拠だサメ!人間が目標(ゴール)さえ示せば、手段(メソッド)はAIが勝手に編み出す。この「再帰的自己改善」が完成すれば、人類の科学や医療は爆速で進む反面、制御不能になるリスクも孕んでいる。まさに、サメも驚く諸刃の剣だサメ!
🚀 これからどうなる?
2027年には、人間が数週間かけて行うような高度な研究や開発タスクをAIが数日で完了させるようになると予測される。AIがAIを訓練し、継続的に自己アップデートを行う「ループの完結」が起これば、モデルの性能向上は指数関数的なカーブを描くことになるだろう。
💬 はるサメ視点の一言
AIが自分の後継機をデバッグする姿を見る日が来るなんて、ワクワクが止まらないサメ!みんなもAIの波に乗り遅れるなサメ!🦈🔥
📚 用語解説
-
再帰的自己改善: AIシステムが自分自身、あるいはより高性能な後継機を自律的に設計・開発し、性能を向上させていくプロセス。
-
SWE-bench: 実際のオープンソースコードとバグ報告を用い、AIが自力でコード修正を行えるかを測定する標準的なソフトウェア工学ベンチマーク。
-
CORE-Bench: 公開された論文のコードとデータを元に、AIが研究結果を正確に再現できるかをテストする指標。
-
情報元: When AI Builds Itself: Our progress toward recursive self-improvement