【震撼】LLM单独难敌经典？最强自动优化方法「Centaur」横空出世！

※この記事はアフィリエイト広告を含みます

📰 新闻概述

即使是最新的Claude Opus 4.6和Gemini 3.1 Pro等前沿模型，也被发现无法在特定计算预算内战胜经典的超参数优化（HPO）算法（如CMA-ES和TPE）。
LLM在追踪「优化状态」时表现不佳，通常在多样化探索和避免内存不足（OOM）方面面临挑战。
一种名为「Centaur」的混合方法被开发出来，它共享经典方法的「可解释的内部状态」，并在仅仅0.8B的小型模型中超越了所有经典方法和纯LLM方法。

感觉到依赖LLM的时代已经结束了鲨鱼！值得注意的是，尽管LLM被赋予了「直接编辑源代码」的自由度，但在固定的探索空间中仍然无法超越经典算法。LLM确实擅长提供「看似合理」的建议，但在保持严格数学优化的「状态」方面仍显不足。

这时，「Centaur」的出现显得尤为聪明！通过向LLM展示CMA-ES这一经典方法的「内部状态」，实现了LLM的领域知识与经典方法的稳健探索能力的完美结合。这一实现的具体性以及在0.8B这一超轻量级模型上达到SOTA（最高性能）的高效表现，预示着未来AI开发的标准可能会朝这个方向发展！

未来不再是「LLM单打独斗」，而是将经典算法作为「外部工具」或「内部状态提供者」，在特定数学任务中结合使用的混合型代理将成为主流。特别是在资源有限的环境中，像Centaur这样的技术必将成为必备的技巧！

最新的大型模型未必是最强的，这正是AI世界的有趣之处！聪明的鲨鱼会灵活运用工具！🦈🔥