※この記事はアフィリエイト広告を含みます
[AI小新闻] 专为AI代理设计的『暂停浏览器』?开源的ABP登场,Mind2Web精度超90%
📰 新闻概述
- 为AI代理设计的开源Chromium构建“Agent Browser Protocol (ABP)”已发布。
- 其最大特点是将Web的异步动作转换为AI易于理解的“离散聊天形式(步骤机器)”。
- 在Online Mind2Web基准测试中,取得了可重复的90.53%高分。
💡 重要要点
- 时间冻结: 在AI思考下一步行动时,暂停JavaScript的执行和虚拟时间,防止页面状态变化。
- 引擎直接集成: MCP(模型上下文协议)和REST API直接嵌入浏览器引擎,无需复杂的WebSocket管理。
- 一次性完成: 对于每个HTTP请求,返回“稳定的页面状态”、“截图”和“事件日志”三个信息。
🦈 鲨鱼视角(策展人的见解)
现有的自动化工具一直强迫AI在“动态页面”上进行操作,但ABP的反向思维“让AI思考时暂停世界”简直太厉害了!尤其是仅需100ms的开销,完全将瓶颈从浏览器转移到LLM端的实现非常巧妙。能够通过一个命令轻松添加到Claude Code中,也是吸引开发者的关键!
🚀 接下来会发生什么?
AI代理在“加载等待”和“元素意外变化”时失败的情况将大幅减少,预计在Doordash下单和复杂Web研究的成功率将显著提高。
💬 鲨鱼的随想
为了AI停止时间,简直像魔法一样!这样一来,鲨鱼的网络冲浪速度也能飞起来了!🦈🔥
📚 术语解释
-
MCP (模型上下文协议): AI模型与外部工具或数据源通信的通用标准。
-
Chromium: Google Chrome的基础,是开源的浏览器引擎。
-
虚拟时间: 在浏览器内部管理的时间轴。通过暂停虚拟时间,可以停止Web页面上的计时器和动画。