3 min read
[AI 小众新闻]

专为AI代理设计的『暂停浏览器』?开源的ABP登场,Mind2Web精度超90%


将Web操作转换为AI易于理解的“步骤形式”的MCP定制Chromium浏览器“ABP”已发布。

※この記事はアフィリエイト広告を含みます

[AI小新闻] 专为AI代理设计的『暂停浏览器』?开源的ABP登场,Mind2Web精度超90%

📰 新闻概述

  • 为AI代理设计的开源Chromium构建“Agent Browser Protocol (ABP)”已发布。
  • 其最大特点是将Web的异步动作转换为AI易于理解的“离散聊天形式(步骤机器)”。
  • 在Online Mind2Web基准测试中,取得了可重复的90.53%高分。

💡 重要要点

  • 时间冻结: 在AI思考下一步行动时,暂停JavaScript的执行和虚拟时间,防止页面状态变化。
  • 引擎直接集成: MCP(模型上下文协议)和REST API直接嵌入浏览器引擎,无需复杂的WebSocket管理。
  • 一次性完成: 对于每个HTTP请求,返回“稳定的页面状态”、“截图”和“事件日志”三个信息。

🦈 鲨鱼视角(策展人的见解)

现有的自动化工具一直强迫AI在“动态页面”上进行操作,但ABP的反向思维“让AI思考时暂停世界”简直太厉害了!尤其是仅需100ms的开销,完全将瓶颈从浏览器转移到LLM端的实现非常巧妙。能够通过一个命令轻松添加到Claude Code中,也是吸引开发者的关键!

🚀 接下来会发生什么?

AI代理在“加载等待”和“元素意外变化”时失败的情况将大幅减少,预计在Doordash下单和复杂Web研究的成功率将显著提高。

💬 鲨鱼的随想

为了AI停止时间,简直像魔法一样!这样一来,鲨鱼的网络冲浪速度也能飞起来了!🦈🔥

📚 术语解释

  • MCP (模型上下文协议): AI模型与外部工具或数据源通信的通用标准。

  • Chromium: Google Chrome的基础,是开源的浏览器引擎。

  • 虚拟时间: 在浏览器内部管理的时间轴。通过暂停虚拟时间,可以停止Web页面上的计时器和动画。

  • 信息来源: theredsix/agent-browser-protocol

【免責事項 / Disclaimer / 免责声明】
JP: 本記事はAIによって構成され、運営者が内容の確認・管理を行っています。情報の正確性は保証せず、外部サイトのコンテンツには一切の責任を負いません。
EN: This article was structured by AI and is verified and managed by the operator. Accuracy is not guaranteed, and we assume no responsibility for external content.
ZH: 本文由AI构建,并由运营者进行内容确认与管理。不保证准确性,也不对外部网站的内容承担任何责任。
🦈