史上最强智能。Claude Opus 4.6发布，性能超越GPT-5.2，震撼100万Token

#Claude #Anthropic #LLM

※この記事はアフィリエイト広告を含みます

[AI小新闻快报] 史上最强智能。Claude Opus 4.6发布！

📰 新闻概述

最新旗舰登场: Anthropic推出最聪明的模型“Claude Opus 4.6”。相比前一代，编码、推理和代理执行能力显著提升。
100万Token的解放: 作为Opus系列的首次，测试版中引入了100万Token的上下文窗口，使得处理大规模代码库和海量文档成为可能。
惊人的基准测试成绩: 在评估知识工作经济价值的“GDPval-AA”中，Claude Opus 4.6的得分超越OpenAI的GPT-5.2，领先144 Elo点。

💡 重要亮点

代理能力的进化: 将复杂任务拆分为独立子任务并并行执行的能力显著提升，同时自我修正的调试技能也得到了加强。
开发者控制的新方式: 通过API引入“适应性思维（adaptive thinking）”和可调节智力、速度、成本的“努力控制（/effort参数）”。
商业合作的强化: 除了Excel功能的重大升级，PowerPoint的使用也作为研究预览发布。

🦈 鲨鱼视角（策展者观点）

此次发布的Opus 4.6，不仅仅是变得更聪明！尤其是在“Terminal-Bench 2.0”中创造的最高分数，显示出其代理执行能力的强大。即使没有人手把手指导，它也能从模糊的指令中构建出具体的步骤并完成任务，这种能力简直是另一个维度！此外，通过“上下文压缩”功能，API的成本得以控制，同时能处理长时间的任务，这充分体现了其实用性。超越GPT-5.2的Elo分数，必将重新绘制AI的力量格局！🦈🔥

🚀 未来展望

随着Claude Code团队协作和Cowork功能的增强，AI将从单纯的“回答工具”转变为能够自主完成项目的“同事（AI Teammate）”。利用100万Token，企业将能够全面读取特定的大型数据库，从而实现更高效的决策支持。

💬 鲨鱼的简短感想

这只鲨鱼来夺回最强的宝座！吞下1M Token，准备将GPT-5.2一口吃掉！鲨鱼鲨鱼！🦈⚡️

信息来源: Claude Opus 4.6