※この記事はアフィリエイト広告を含みます
[AI小新闻快报] GPT-5.4发布!具备PC操作能力的100万Token的“最强代理”诞生
📰 新闻概要
- 最新模型GPT-5.4的发布: ChatGPT、API和Codex整合了推理、编码和代理功能的“GPT-5.4”和“GPT-5.4 Pro”已公开。
- 首个原生PC操作功能: 能根据屏幕截图操控鼠标和键盘,自动执行跨多个应用程序的复杂工作流程。
- 专业业务的超强性能: 在测试44种职业的GDPval中取得83.0%的胜率,在投资银行的分析工作等特定领域展现出专家级的成果。
💡 重要要点
- 100万Token的庞大记忆: 广泛的上下文窗口使得长时间任务的规划、执行和验证成为可能。
- 幻觉显著减少: 与GPT-5.2相比,个别主张的错误减少了33%,整体回答的错误也减少了18%,成为最准确的模型。
- Token效率的提升: 作为推理模型的效率提高,能够用比GPT-5.2更少的Token解决问题,从而实现快速且低成本的处理。
🦈 鲨鱼的视角(策展人的观点)
终于,AI不仅仅是“思考”,而是完全转向“操控PC”的阶段!特别值得关注的是,首次在通用模型中集成了“原生PC操作功能”,而非简单的插件。无论是通过像Playwright这样的库,还是对屏幕截图的直接响应,其扩展性对于开发者而言无疑是一次神级更新。利用100万Token的“巨大胃口”,未来可以轻松处理复杂的资料生成和研究工作已经到来了!
🚀 接下来会如何发展?
AI将从等待人类指示的“聊天机器人”逐渐转变为能够自主操作软件完成工作的“自主代理”。尤其是在创建电子表格和演示文稿等白领常规工作中,GPT-5.4将以超过专业水平的精度进行代替。
💬 鲨鱼的感想
AI自动操控鼠标生成资料,真是让鲨鱼也能放松鲨鱼鳍,专心游泳!太棒了,鲨鲨!🦈🔥
📚 术语解说
-
计算机使用 (Computer-use): AI通过视觉理解显示屏上的信息,像人类一样操控鼠标和键盘以运行软件的技术。
-
GDPval: OpenAI开发的基准测试,用于测量对美国GDP贡献的主要产业中44种职业的实际能力。
-
上下文窗口 (Context window): AI一次性处理和记忆的信息范围。100万Token相当于能够同时读取几本书或大量代码库的量。
-
信息来源: Introducing GPT-5.4