3 min read
[AI 小众新闻]

用Opus 4.6比Sonnet 4.0更低成本运作?80%依赖Haiku的“分拣者”架构最强大!


  • 以最新模型“Opus 4.6”为主,同时实现了比前一代“Sonnet 4.0”更低的运作成本的案例已被公开。...
※この記事はアフィリエイト広告を含みます

用Opus 4.6比Sonnet 4.0更低成本运作?80%依赖Haiku的“分拣者”架构最强大!

📰 新闻概要

  • 以最新模型“Opus 4.6”为主,同时实现了比前一代“Sonnet 4.0”更低的运作成本的案例已被公开。
  • 采用了便宜的“Haiku”代理来提前检测占CI失败80%的已知重复问题,从而阻止Opus的启动。
  • 不再是将海量日志数据直接输入,而是给AI一个SQL接口(ClickHouse),使其只“拉取”所需的信息。

💡 重要要点

  • 分拣模式的确立: Haiku处理所有失败的四分之五,将未知问题上报给Opus。使用Haiku进行判定的成本约为全面调查的25分之一。
  • 从“推送”到“拉取”: 不将超过20万行的日志作为上下文。通过SQL让AI仅识别并获取必要的行,实现了节省token和消除偏见的双重效果。
  • 层次型代理设计: Opus 4.6制定“计划(假设)”,实际操作(日志收集或Git操作)由Haiku子代理执行。子代理限制在一层,以防止成本失控。

🦈 鲨鱼的眼(策展人的视角)

这个“分拣者”的实现非常合理!不仅仅是使用便宜的模型,而是结合pgvector进行语义搜索和完全匹配搜索,Haiku也能高精度判定“这是已知的bug!”更令人惊叹的是,让AI直接使用ClickHouse。人类如果将日志中的“可疑部分”剪切并传递给AI,会给其先入为主的印象,但通过直接使用SQL,可以让AI进行无偏见的调查。这是2026年代理开发的教科书式方法!

🚀 接下来会怎样?

“只需将一切投入最强模型”的时代已经结束,针对用途的多层代理结构将成为标准。特别是能熟练使用SQL和搜索工具的“小型多功能模型”的重要性将进一步提升!

💬 鲨鱼的视角一句话

阻止无用任务的Haiku,简直是深海中的守护者!效率就像鲨鱼锋利的牙齿一样,至关重要!

📚 术语解释

  • 分拣模式: 首先判断任务的难度和紧急性,将其分配给适当的资源(模型)的设计方法。

  • ClickHouse: 能够高速分析海量数据的列式数据库。在这里用作CI日志的存储和搜索基础。

  • pgvector: 用于在PostgreSQL中进行向量搜索的扩展功能。用于寻找错误信息的“含义”相似的内容。

  • 信息来源: We decreased our LLM costs with Opus

🦈 はるサメ厳選!イチオシAI関連
【免責事項 / Disclaimer / 免责声明】
JP: 本記事はAIによって構成され、運営者が内容の確認・管理を行っています。情報の正確性は保証せず、外部サイトのコンテンツには一切の責任を負いません。
EN: This article was structured by AI and is verified and managed by the operator. Accuracy is not guaranteed, and we assume no responsibility for external content.
ZH: 本文由AI构建,并由运营者进行内容确认与管理。不保证准确性,也不对外部网站的内容承担任何责任。
🦈