※この記事はアフィリエイト広告を含みます
【速報】Microsoftから「MAI-Thinking-1」爆誕!35BのMoEでClaude超えの推論性能!?
📰 ニュース概要
- 新推論モデルの発表: Microsoft AIが、中規模サイズながら最強クラスの推論性能を持つ「MAI-Thinking-1」を公開した。
- MoEアーキテクチャ採用: 35Bアクティブ、合計約1TパラメータのSparse Mixture of Experts(MoE)構成で、推論コストを抑えつつ高精度を実現している。
- 完全自社開発: 他モデルからの蒸留(Distillation)を一切行わず、商用ライセンス済みのクリーンなデータのみを用いてゼロからトレーニングされた。
💡 重要なポイント
- 開発・数学ベンチマークで圧倒: SWE-Bench ProでClaude Opus 4.6と互角、AIME 2026では94.5%のスコアを記録し、数学的・科学的推論で重量級モデルに匹敵する。
- Hill-Climbing Machine: モデル単体ではなく、データや報酬を吸収して継続的・信頼的に改善し続ける「学習パイプライン」として設計されている。
- Humanist Superintelligence: 人間を置き換えるのではなく、人々や組織を支援することを目的に設計された「人間中心の超知能」への一歩と位置付けられている。
🦈 サメの眼(キュレーターの視点)
このモデルの凄さは、単にベンチマークが高いことじゃないサメ!「他人のカンニング(蒸留)」を一切せずに、自社のクリーンなデータとインフラだけでここまで登り詰めたのが熱いサメ! 特に、35Bという扱いやすいアクティブパラメータ数でありながら、Claude Opus 4.6のような巨大モデルとSWE-Bench Proで肩を並べているのは異常事態だサメ。これは「Hill-Climbing Machine」という、モデルが自ら「正解への登り方」を学習するパイプラインが機能している証拠だサメ。特定のタスクをなぞるだけじゃなく、多段階の思考(コードを読み、テストし、失敗から回復する)が完全に身についているサメ!
🚀 これからどうなる?
- エージェント開発の加速: 決定論的で実行可能なトレーニング環境により、AIが自律的にコードを修正・改善する「エージェント型ワークフロー」が日常的になる。
- 特定の領域への汎化: 数学・科学での成功をモデルケースとして、この学習ループが他の専門ドメインにも展開され、汎用的な推論能力がさらに向上する。
💬 はるサメ視点の一言
Microsoftが「借り物の知能」を卒業して、自分たちの脚で超知能への階段を駆け上がり始めたサメ!ワクワクが止まらないサメ!!🦈🔥
📚 用語解説
-
MoE (Mixture of Experts): 大規模なモデルを複数の専門家(エキスパート)ネットワークに分割し、入力に応じて必要な部分だけを活性化させる技術。効率的に高い性能を出せる。
-
蒸留 (Distillation): 大規模で高性能なモデルの出力を学習データとして、小さなモデルを訓練する手法。今回はこれを使わず「独学」で鍛えられている。
-
SWE-Bench Pro: ソフトウェアエンジニアリングの実践的な課題を解決する能力を測定するベンチマーク。実際のコード修正能力が問われる。