※この記事はアフィリエイト広告を含みます
用Opus 4.6比Sonnet 4.0更低成本运作?80%依赖Haiku的“分拣者”架构最强大!
📰 新闻概要
- 以最新模型“Opus 4.6”为主,同时实现了比前一代“Sonnet 4.0”更低的运作成本的案例已被公开。
- 采用了便宜的“Haiku”代理来提前检测占CI失败80%的已知重复问题,从而阻止Opus的启动。
- 不再是将海量日志数据直接输入,而是给AI一个SQL接口(ClickHouse),使其只“拉取”所需的信息。
💡 重要要点
- 分拣模式的确立: Haiku处理所有失败的四分之五,将未知问题上报给Opus。使用Haiku进行判定的成本约为全面调查的25分之一。
- 从“推送”到“拉取”: 不将超过20万行的日志作为上下文。通过SQL让AI仅识别并获取必要的行,实现了节省token和消除偏见的双重效果。
- 层次型代理设计: Opus 4.6制定“计划(假设)”,实际操作(日志收集或Git操作)由Haiku子代理执行。子代理限制在一层,以防止成本失控。
🦈 鲨鱼的眼(策展人的视角)
这个“分拣者”的实现非常合理!不仅仅是使用便宜的模型,而是结合pgvector进行语义搜索和完全匹配搜索,Haiku也能高精度判定“这是已知的bug!”更令人惊叹的是,让AI直接使用ClickHouse。人类如果将日志中的“可疑部分”剪切并传递给AI,会给其先入为主的印象,但通过直接使用SQL,可以让AI进行无偏见的调查。这是2026年代理开发的教科书式方法!
🚀 接下来会怎样?
“只需将一切投入最强模型”的时代已经结束,针对用途的多层代理结构将成为标准。特别是能熟练使用SQL和搜索工具的“小型多功能模型”的重要性将进一步提升!
💬 鲨鱼的视角一句话
阻止无用任务的Haiku,简直是深海中的守护者!效率就像鲨鱼锋利的牙齿一样,至关重要!
📚 术语解释
-
分拣模式: 首先判断任务的难度和紧急性,将其分配给适当的资源(模型)的设计方法。
-
ClickHouse: 能够高速分析海量数据的列式数据库。在这里用作CI日志的存储和搜索基础。
-
pgvector: 用于在PostgreSQL中进行向量搜索的扩展功能。用于寻找错误信息的“含义”相似的内容。