3 min read
[AI 小众新闻]

[AI小新闻快报] 模型没问题!? 仅通过‘工具变更’让15种LLM瞬间变聪明的新方法


- **工具(哈希)比模型(大脑)更重要**: AI编程的失败很多并非因为模型本身的能力,而是AI编辑文件所需的接口(工具)的设计问题。...

※この記事はアフィリエイト広告を含みます

[AI小新闻快报] 模型没问题!? 仅通过‘工具变更’让15种LLM瞬间变聪明的新方法

📰 新闻概述

  • 工具(哈希)比模型(大脑)更重要: AI编程的失败很多并非因为模型本身的能力,而是AI编辑文件所需的接口(工具)的设计问题。
  • 现有方法的局限性: 传统的“差分(diff)”或“字符串替换”编辑方法要求空格和缩进完全匹配,导致模型稍有错误就会编辑失败,用户常常误解为“模型有问题”。
  • 新方法‘Hashline’的引入: 通过给每行添加2到3个字符的哈希标签,让AI指定这些标签,从而实现了准确且节省令牌的代码编辑。

💡 重要要点

  • 不同编辑工具的失败率: 在Grok 4中,编辑失败率高达50.7%,在GLM-4.7中为46.2%,这都是因为模型无法正确理解编辑格式(语言)。
  • ‘Hashline’的机制: 文件读取时为每行添加如11:a3|的哈希,AI则会被指示“替换第2:f1的行”。这样,模型就不需要准确重生成原始代码。
  • 不依赖模型的改进: 在15种LLM中,未对模型本身进行任何更改,仅通过更换工具(编辑工具)就大幅提升了编程性能。

🦈 鲨鱼的视角(策展人观点)

AI的“脑”常常被关注,但实际上“手”即工具的实现才是实际应用中的瓶颈,这个观点非常尖锐!尤其是‘Hashline’的实现具体且有趣。要求AI重生成整个代码,或者完美保持空格,对于现在的LLM来说无疑是苛刻的要求。而通过“短小的哈希标签”来解决这个问题,既节省计算资源,又可靠性高,真是个好主意!Cursor竟然还特意训练了专门用于编辑的70B模型,而这个‘Hashline’只需结构上的巧思,就有可能超越这种做法,真是太酷了!🦈🔥

🚀 未来的趋势

不仅仅是模型的庞大和推理能力的提高,关于“如何高效地将AI连接到软件”的工具设计竞争也必将加速。如果像Hashline这样的方案被标准化,或许即使是廉价的小型模型,也能实现与高端模型相媲美的准确编程能力!🦈

💬 鲨鱼的看法

工具不易用,再聪明的鲨鱼也捕不到鱼!将“正确的持手”交给AI是人类的任务!鲨鲨!🦈✨

📚 术语解释

  • 工具(Harness): 用于连接AI模型与外部环境(如文件系统)的执行框架或接口。

  • str_replace: 查找特定字符串并进行替换的方法。即使是一个字符的空格或换行不同,也会导致失败,因此对LLM来说难度较高。

  • Hashline: 为每行添加唯一标识符(哈希),使模型能够通过该标识符指定操作对象的编辑协议。

  • 信息来源: Improving 15 LLMs at Coding in One Afternoon. Only the Harness Changed

【免責事項 / Disclaimer / 免责声明】
JP: 本記事はAIによって構成され、運営者が内容の確認・管理を行っています。情報の正確性は保証せず、外部サイトのコンテンツには一切の責任を負いません。
EN: This article was structured by AI and is verified and managed by the operator. Accuracy is not guaranteed, and we assume no responsibility for external content.
ZH: 本文由AI构建,并由运营者进行内容确认与管理。不保证准确性,也不对外部网站的内容承担任何责任。
🦈