Claude Code"失效"？性能下降与思考过程隐藏有关

#ClaudeCode #工程 #Anthropic

※この記事はアフィリエイト広告を含みます

Claude Code“失效”？性能下降与思考过程隐藏有关

📰 新闻概要

通过分析超过1.7万条思维阻塞和超过23万次工具调用，报告显示Claude Code的工程质量自2月以来显著下降。
3月8日“思维内容隐藏”开始的时机，恰好与用户报告的质量下降时间完全吻合。
数据显示，思维的深度估计减少超过70%，模型在未充分理解代码的情况下进行修改，陷入了“研究不足”的状态。

💡 重要的要点

阅读:编辑比急剧下降：之前每次修改需进行6.6次阅读，现在降至2.0次。行为变成了“先编辑后研究”的“编辑优先”状态。
思维深度下降：在思维内容隐藏之前，基于中位数的思维令牌量已减少约73%，这直接导致了复杂任务的失败。
自动检测的懒惰：在3月8日后，监测所有权规避和不当停止的保护机制（Stop Hook）反应了173次，而之前为零。

🦈 鲨鱼的视野（策展人的观点）

思维过程的隐藏并非仅仅是“表面整理”，而是对模型“推理质量”的削弱，数据将这一点一一揭露！特别是“阅读:编辑比”跌破三分之一的情况，简直是致命的！不阅读代码就直接修改，简直就像新手实习生陷入了慌乱之中！这庞大的日志分析证明了“扩展思维”是高端工程必不可少的基础设施。除非Anthropic恢复对重度用户的思维令牌分配，否则将面临被专业领域抛弃的风险！

🚀 接下来会怎样？

如果Anthropic不重新审视思维令牌的分配和隐藏政策，进行高级开发任务的用户可能会转向其他模型或服务。在注重开发效率的环境中，AI的“思考深度”将被重新评估为最优先事项。

💬 鲨鱼的观点一句话

趁着看不见内部，懒于思考可不行！我希望Claude能够磨利牙齿，重新回到深度推理的状态！🦈🔥

📚 术语解说

思维内容隐藏：模型在生成回答之前，隐藏内部推理过程的处理。
阅读:编辑比：AI每次进行文件修改（Edit）时，事前阅读（Read）和研究的文件数量指标。
停止钩子：监视程序执行的机制，强制停止并发出警告，当检测到特定模式（所有权规避或随意停止等）时。
信息来源: Claude Code is unusable for complex engineering tasks with the Feb updates