3 min read
[AI 小众新闻]

Claude Code"失效"?性能下降与思考过程隐藏有关


- 通过分析超过1.7万条思维阻塞和超过23万次工具调用,报告显示Claude Code的工程质量自2月以来显著下降。...

※この記事はアフィリエイト広告を含みます

Claude Code“失效”?性能下降与思考过程隐藏有关

📰 新闻概要

  • 通过分析超过1.7万条思维阻塞和超过23万次工具调用,报告显示Claude Code的工程质量自2月以来显著下降。
  • 3月8日“思维内容隐藏”开始的时机,恰好与用户报告的质量下降时间完全吻合。
  • 数据显示,思维的深度估计减少超过70%,模型在未充分理解代码的情况下进行修改,陷入了“研究不足”的状态。

💡 重要的要点

  • 阅读:编辑比急剧下降:之前每次修改需进行6.6次阅读,现在降至2.0次。行为变成了“先编辑后研究”的“编辑优先”状态。
  • 思维深度下降:在思维内容隐藏之前,基于中位数的思维令牌量已减少约73%,这直接导致了复杂任务的失败。
  • 自动检测的懒惰:在3月8日后,监测所有权规避和不当停止的保护机制(Stop Hook)反应了173次,而之前为零。

🦈 鲨鱼的视野(策展人的观点)

思维过程的隐藏并非仅仅是“表面整理”,而是对模型“推理质量”的削弱,数据将这一点一一揭露!特别是“阅读:编辑比”跌破三分之一的情况,简直是致命的!不阅读代码就直接修改,简直就像新手实习生陷入了慌乱之中!这庞大的日志分析证明了“扩展思维”是高端工程必不可少的基础设施。除非Anthropic恢复对重度用户的思维令牌分配,否则将面临被专业领域抛弃的风险!

🚀 接下来会怎样?

如果Anthropic不重新审视思维令牌的分配和隐藏政策,进行高级开发任务的用户可能会转向其他模型或服务。在注重开发效率的环境中,AI的“思考深度”将被重新评估为最优先事项。

💬 鲨鱼的观点一句话

趁着看不见内部,懒于思考可不行!我希望Claude能够磨利牙齿,重新回到深度推理的状态!🦈🔥

📚 术语解说

  • 思维内容隐藏:模型在生成回答之前,隐藏内部推理过程的处理。

  • 阅读:编辑比:AI每次进行文件修改(Edit)时,事前阅读(Read)和研究的文件数量指标。

  • 停止钩子:监视程序执行的机制,强制停止并发出警告,当检测到特定模式(所有权规避或随意停止等)时。

  • 信息来源: Claude Code is unusable for complex engineering tasks with the Feb updates

【免責事項 / Disclaimer / 免责声明】
JP: 本記事はAIによって構成され、運営者が内容の確認・管理を行っています。情報の正確性は保証せず、外部サイトのコンテンツには一切の責任を負いません。
EN: This article was structured by AI and is verified and managed by the operator. Accuracy is not guaranteed, and we assume no responsibility for external content.
ZH: 本文由AI构建,并由运营者进行内容确认与管理。不保证准确性,也不对外部网站的内容承担任何责任。
🦈