※この記事はアフィリエイト広告を含みます
[AI小新闻快报] 模型没问题!? 仅通过‘工具变更’让15种LLM瞬间变聪明的新方法
📰 新闻概述
- 工具(哈希)比模型(大脑)更重要: AI编程的失败很多并非因为模型本身的能力,而是AI编辑文件所需的接口(工具)的设计问题。
- 现有方法的局限性: 传统的“差分(diff)”或“字符串替换”编辑方法要求空格和缩进完全匹配,导致模型稍有错误就会编辑失败,用户常常误解为“模型有问题”。
- 新方法‘Hashline’的引入: 通过给每行添加2到3个字符的哈希标签,让AI指定这些标签,从而实现了准确且节省令牌的代码编辑。
💡 重要要点
- 不同编辑工具的失败率: 在Grok 4中,编辑失败率高达50.7%,在GLM-4.7中为46.2%,这都是因为模型无法正确理解编辑格式(语言)。
- ‘Hashline’的机制: 文件读取时为每行添加如
11:a3|的哈希,AI则会被指示“替换第2:f1的行”。这样,模型就不需要准确重生成原始代码。 - 不依赖模型的改进: 在15种LLM中,未对模型本身进行任何更改,仅通过更换工具(编辑工具)就大幅提升了编程性能。
🦈 鲨鱼的视角(策展人观点)
AI的“脑”常常被关注,但实际上“手”即工具的实现才是实际应用中的瓶颈,这个观点非常尖锐!尤其是‘Hashline’的实现具体且有趣。要求AI重生成整个代码,或者完美保持空格,对于现在的LLM来说无疑是苛刻的要求。而通过“短小的哈希标签”来解决这个问题,既节省计算资源,又可靠性高,真是个好主意!Cursor竟然还特意训练了专门用于编辑的70B模型,而这个‘Hashline’只需结构上的巧思,就有可能超越这种做法,真是太酷了!🦈🔥
🚀 未来的趋势
不仅仅是模型的庞大和推理能力的提高,关于“如何高效地将AI连接到软件”的工具设计竞争也必将加速。如果像Hashline这样的方案被标准化,或许即使是廉价的小型模型,也能实现与高端模型相媲美的准确编程能力!🦈
💬 鲨鱼的看法
工具不易用,再聪明的鲨鱼也捕不到鱼!将“正确的持手”交给AI是人类的任务!鲨鲨!🦈✨
📚 术语解释
-
工具(Harness): 用于连接AI模型与外部环境(如文件系统)的执行框架或接口。
-
str_replace: 查找特定字符串并进行替换的方法。即使是一个字符的空格或换行不同,也会导致失败,因此对LLM来说难度较高。
-
Hashline: 为每行添加唯一标识符(哈希),使模型能够通过该标识符指定操作对象的编辑协议。
-
信息来源: Improving 15 LLMs at Coding in One Afternoon. Only the Harness Changed