【快讯】微软推出“MAI-Thinking-1”！35B MoE带来超越Claude的推理性能！？

#MAI-Thinking-1 #Microsoft #MoE

※この記事はアフィリエイト広告を含みます

【快讯】微软推出“MAI-Thinking-1”！35B MoE带来超越Claude的推理性能！？

📰 新闻概要

新推理模型发布: 微软AI推出了中等规模但具有顶级推理性能的“MAI-Thinking-1”。
采用MoE架构: 该模型活跃参数达到35B，总计约1T参数的稀疏专家混合（MoE）结构，在确保高精度的同时降低推理成本。
完全自主开发: 完全从零开始训练，未进行任何其他模型的蒸馏（Distillation），仅使用经过商业许可的干净数据。

💡 重要要点

在开发和数学基准上表现突出: 在SWE-Bench Pro中与Claude Opus 4.6不相上下，在AIME 2026中得分94.5%，在数学和科学推理上与重量级模型相匹敌。
爬坡机器: 该模型不仅仅是一个单一模型，而是一个设计为持续、可靠地吸收数据和奖励并不断改进的“学习管道”。
人文超级智能: 该模型并不是为了取代人类，而是为了支持个人和组织，标志着向“以人为本的超级智能”迈出的一步。

🦈 鲨鱼视角（策展人的观点）

这个模型的厉害之处在于，它不仅仅是基准测试分数高而已鲨鱼！它在没有“抄袭”（蒸馏）的情况下，凭借自主的干净数据和基础设施走到今天，真是让人热血沸腾鲨鱼！特别是，尽管只有35B的活跃参数，但却能在SWE-Bench Pro中与像Claude Opus 4.6这样的大型模型平起平坐，真是非同寻常鲨鱼。这证明了“爬坡机器”这个模型自我学习“通往正确答案的路径”的管道正在发挥作用。它不仅仅是简单地完成特定任务，而是完全掌握了多层次思维（读取代码、测试、从失败中复苏）鲨鱼！

🚀 接下来会发生什么？

代理开发的加速: 通过决定论的可执行训练环境，AI将能够自主修正和改进代码，“代理型工作流”将成为日常。
向特定领域的泛化: 数学和科学的成功将作为模型案例，这个学习循环将扩展到其他专业领域，从而进一步提升通用推理能力。

💬 鲨鱼的看法

微软已经从“借用的智能”中毕业，开始用自己的双脚奔向超级智能的阶梯鲨鱼！令人兴奋的时刻来临了鲨鱼！！🦈🔥

📚 术语解释

MoE (混合专家): 将大型模型分割成多个专家网络，根据输入激活所需部分的技术。能够高效地提供高性能。
蒸馏 (Distillation): 利用大型高性能模型的输出作为训练数据，训练小型模型的方法。这次没有使用蒸馏，而是“自主学习”。
SWE-Bench Pro: 测量解决软件工程实际问题能力的基准，评估实际代码修正能力。
信息来源: Introducing MAI-Thinking-1

【快讯】微软推出“MAI-Thinking-1”！35B MoE带来超越Claude的推理性能！？

【快讯】微软推出“MAI-Thinking-1”！35B MoE带来超越Claude的推理性能！？

📰 新闻概要

💡 重要要点

🦈 鲨鱼视角（策展人的观点）

🚀 接下来会发生什么？

💬 鲨鱼的看法

📚 术语解释

はるサメをフォローするだサメ！