※この記事はアフィリエイト広告を含みます
AI自己纠正错误!?Skyvern推出的“自律型QA代理”将引发革命
📰 新闻概述
- Skyvern发布了MCP服务器,使得Claude Code等AI代理能够“自我QA(质量保证)”自己编写的代码。
- 包含33种浏览器操作工具(导航、表单输入、数据提取等),AI能够实际打开浏览器并确认行为。
- 通过引入这一机制,拉取请求(PR)的通过率从约30%提升至70%,QA循环时间缩短了一半。
💡 重要要点
- “外观”和“行为”的验证: 即使代码正确,如果UI出现崩溃或按钮不响应,传统的自动测试往往会遗漏这些问题,而AI能够通过“像素(屏幕)”来判断。
- 基于Git Diff的策略: 解析
git diff以将更改部分分类为“前端”、“后端”等,并自动生成针对影响范围的高效测试用例。 - 与CI/CD的集成: 除了本地的
/qa命令外,还提供在CI环境下执行的/smoke-test功能。自动在PR中评论测试结果的证据(截图和失败原因)。
🦈 鲨鱼的视角(策展人的观点)
直到现在,即使AI能够编写代码,最终“验证其运行”的工作仍然由人类承担,这一直是个瓶颈。但是,Skyvern的这一实现太厉害了!通过将33种浏览器操作工具通过MCP传递给Claude,AI获得了“手”和“眼”,这是成功的关键。特别有趣的是,它并没有盲目扩大测试范围,而是从diff(差异)中建立“假设”,只针对必要的部分进行测试。这有效地避免了E2E测试中常见的“测试过重导致无人相信”的问题,具体且实用!
🚀 未来展望
未来,不再是开发者编写代码并进行测试,而是AI编写代码,自行测试,只有合格的代码才会传递给人类。人类的角色将进一步转向“最终规格的批准”。
💬 鲨鱼的简评
AI竟然能为自己擦屁股,这可让鲨鱼的出场机会减少了!不过这将使开发速度飞快!🦈🔥
📚 术语解释
-
MCP (Model Context Protocol): AI模型与外部工具或数据源安全通信的通用标准。
-
QA (质量保证): 确认软件是否按照规格运行的质量保证流程。
-
Smoke Test (烟雾测试): 为了确认系统的主要功能至少能够基本运行而进行的初步测试。