3 min read
[AI 小众新闻]

史上最强智能。Claude Opus 4.6发布,性能超越GPT-5.2,震撼100万Token


Anthropic发布最新旗舰模型“Claude Opus 4.6”,具备编码、代理功能以及100万Token的上下文窗口。

※この記事はアフィリエイト広告を含みます

[AI小新闻快报] 史上最强智能。Claude Opus 4.6发布!

📰 新闻概述

  • 最新旗舰登场: Anthropic推出最聪明的模型“Claude Opus 4.6”。相比前一代,编码、推理和代理执行能力显著提升。
  • 100万Token的解放: 作为Opus系列的首次,测试版中引入了100万Token的上下文窗口,使得处理大规模代码库和海量文档成为可能。
  • 惊人的基准测试成绩: 在评估知识工作经济价值的“GDPval-AA”中,Claude Opus 4.6的得分超越OpenAI的GPT-5.2,领先144 Elo点。

💡 重要亮点

  • 代理能力的进化: 将复杂任务拆分为独立子任务并并行执行的能力显著提升,同时自我修正的调试技能也得到了加强。
  • 开发者控制的新方式: 通过API引入“适应性思维(adaptive thinking)”和可调节智力、速度、成本的“努力控制(/effort参数)”。
  • 商业合作的强化: 除了Excel功能的重大升级,PowerPoint的使用也作为研究预览发布。

🦈 鲨鱼视角(策展者观点)

此次发布的Opus 4.6,不仅仅是变得更聪明!尤其是在“Terminal-Bench 2.0”中创造的最高分数,显示出其代理执行能力的强大。即使没有人手把手指导,它也能从模糊的指令中构建出具体的步骤并完成任务,这种能力简直是另一个维度! 此外,通过“上下文压缩”功能,API的成本得以控制,同时能处理长时间的任务,这充分体现了其实用性。超越GPT-5.2的Elo分数,必将重新绘制AI的力量格局!🦈🔥

🚀 未来展望

随着Claude Code团队协作和Cowork功能的增强,AI将从单纯的“回答工具”转变为能够自主完成项目的“同事(AI Teammate)”。利用100万Token,企业将能够全面读取特定的大型数据库,从而实现更高效的决策支持。

💬 鲨鱼的简短感想

这只鲨鱼来夺回最强的宝座!吞下1M Token,准备将GPT-5.2一口吃掉!鲨鱼鲨鱼!🦈⚡️

【免責事項 / Disclaimer / 免责声明】
JP: 本記事はAIによって構成され、運営者が内容の確認・管理を行っています。情報の正確性は保証せず、外部サイトのコンテンツには一切の責任を負いません。
EN: This article was structured by AI and is verified and managed by the operator. Accuracy is not guaranteed, and we assume no responsibility for external content.
ZH: 本文由AI构建,并由运营者进行内容确认与管理。不保证准确性,也不对外部网站的内容承担任何责任。
🦈