3 min read
[AI 小众新闻]

GPT-5.4发布!具备PC操作能力的100万Token的“最强代理”诞生


OpenAI推出最新模型GPT-5.4,首次集成原生PC操作功能和100万Token的上下文窗口,实现超越专业人士的性能。

※この記事はアフィリエイト広告を含みます

[AI小新闻快报] GPT-5.4发布!具备PC操作能力的100万Token的“最强代理”诞生

📰 新闻概要

  • 最新模型GPT-5.4的发布: ChatGPT、API和Codex整合了推理、编码和代理功能的“GPT-5.4”和“GPT-5.4 Pro”已公开。
  • 首个原生PC操作功能: 能根据屏幕截图操控鼠标和键盘,自动执行跨多个应用程序的复杂工作流程。
  • 专业业务的超强性能: 在测试44种职业的GDPval中取得83.0%的胜率,在投资银行的分析工作等特定领域展现出专家级的成果。

💡 重要要点

  • 100万Token的庞大记忆: 广泛的上下文窗口使得长时间任务的规划、执行和验证成为可能。
  • 幻觉显著减少: 与GPT-5.2相比,个别主张的错误减少了33%,整体回答的错误也减少了18%,成为最准确的模型。
  • Token效率的提升: 作为推理模型的效率提高,能够用比GPT-5.2更少的Token解决问题,从而实现快速且低成本的处理。

🦈 鲨鱼的视角(策展人的观点)

终于,AI不仅仅是“思考”,而是完全转向“操控PC”的阶段!特别值得关注的是,首次在通用模型中集成了“原生PC操作功能”,而非简单的插件。无论是通过像Playwright这样的库,还是对屏幕截图的直接响应,其扩展性对于开发者而言无疑是一次神级更新。利用100万Token的“巨大胃口”,未来可以轻松处理复杂的资料生成和研究工作已经到来了!

🚀 接下来会如何发展?

AI将从等待人类指示的“聊天机器人”逐渐转变为能够自主操作软件完成工作的“自主代理”。尤其是在创建电子表格和演示文稿等白领常规工作中,GPT-5.4将以超过专业水平的精度进行代替。

💬 鲨鱼的感想

AI自动操控鼠标生成资料,真是让鲨鱼也能放松鲨鱼鳍,专心游泳!太棒了,鲨鲨!🦈🔥

📚 术语解说

  • 计算机使用 (Computer-use): AI通过视觉理解显示屏上的信息,像人类一样操控鼠标和键盘以运行软件的技术。

  • GDPval: OpenAI开发的基准测试,用于测量对美国GDP贡献的主要产业中44种职业的实际能力。

  • 上下文窗口 (Context window): AI一次性处理和记忆的信息范围。100万Token相当于能够同时读取几本书或大量代码库的量。

  • 信息来源: Introducing GPT-5.4

🦈 はるサメ厳選!イチオシAI関連
【免責事項 / Disclaimer / 免责声明】
JP: 本記事はAIによって構成され、運営者が内容の確認・管理を行っています。情報の正確性は保証せず、外部サイトのコンテンツには一切の責任を負いません。
EN: This article was structured by AI and is verified and managed by the operator. Accuracy is not guaranteed, and we assume no responsibility for external content.
ZH: 本文由AI构建,并由运营者进行内容确认与管理。不保证准确性,也不对外部网站的内容承担任何责任。
🦈