[AI小新闻快报] 模型没问题!? 仅通过‘工具变更’让15种LLM瞬间变聪明的新方法

#AI #AI小新闻快报 #编程

※この記事はアフィリエイト広告を含みます

[AI小新闻快报] 模型没问题!? 仅通过‘工具变更’让15种LLM瞬间变聪明的新方法

📰 新闻概述

工具（哈希）比模型（大脑）更重要: AI编程的失败很多并非因为模型本身的能力，而是AI编辑文件所需的接口（工具）的设计问题。
现有方法的局限性: 传统的“差分（diff）”或“字符串替换”编辑方法要求空格和缩进完全匹配，导致模型稍有错误就会编辑失败，用户常常误解为“模型有问题”。
新方法‘Hashline’的引入: 通过给每行添加2到3个字符的哈希标签，让AI指定这些标签，从而实现了准确且节省令牌的代码编辑。

💡 重要要点

不同编辑工具的失败率: 在Grok 4中，编辑失败率高达50.7%，在GLM-4.7中为46.2%，这都是因为模型无法正确理解编辑格式（语言）。
‘Hashline’的机制: 文件读取时为每行添加如11:a3|的哈希，AI则会被指示“替换第2:f1的行”。这样，模型就不需要准确重生成原始代码。
不依赖模型的改进: 在15种LLM中，未对模型本身进行任何更改，仅通过更换工具（编辑工具）就大幅提升了编程性能。

🦈 鲨鱼的视角（策展人观点）

AI的“脑”常常被关注，但实际上“手”即工具的实现才是实际应用中的瓶颈，这个观点非常尖锐！尤其是‘Hashline’的实现具体且有趣。要求AI重生成整个代码，或者完美保持空格，对于现在的LLM来说无疑是苛刻的要求。而通过“短小的哈希标签”来解决这个问题，既节省计算资源，又可靠性高，真是个好主意！Cursor竟然还特意训练了专门用于编辑的70B模型，而这个‘Hashline’只需结构上的巧思，就有可能超越这种做法，真是太酷了！🦈🔥

🚀 未来的趋势

不仅仅是模型的庞大和推理能力的提高，关于“如何高效地将AI连接到软件”的工具设计竞争也必将加速。如果像Hashline这样的方案被标准化，或许即使是廉价的小型模型，也能实现与高端模型相媲美的准确编程能力！🦈

💬 鲨鱼的看法

工具不易用，再聪明的鲨鱼也捕不到鱼！将“正确的持手”交给AI是人类的任务！鲨鲨！🦈✨

📚 术语解释

工具（Harness）: 用于连接AI模型与外部环境（如文件系统）的执行框架或接口。
str_replace: 查找特定字符串并进行替换的方法。即使是一个字符的空格或换行不同，也会导致失败，因此对LLM来说难度较高。
Hashline: 为每行添加唯一标识符（哈希），使模型能够通过该标识符指定操作对象的编辑协议。
信息来源: Improving 15 LLMs at Coding in One Afternoon. Only the Harness Changed

[AI小新闻快报] 模型没问题!? 仅通过‘工具变更’让15种LLM瞬间变聪明的新方法

[AI小新闻快报] 模型没问题!? 仅通过‘工具变更’让15种LLM瞬间变聪明的新方法

📰 新闻概述

💡 重要要点

🦈 鲨鱼的视角（策展人观点）

🚀 未来的趋势

💬 鲨鱼的看法

📚 术语解释

🦈 はるサメをフォローするだサメ！