※この記事はアフィリエイト広告を含みます
[AI小新闻快讯] Claude使用费用最高可减免90%!?自动提示缓存「Prompt-caching」颠覆传统!
📰 新闻概要
- 最高节省90%令牌成本: 在使用Anthropic的Claude时,自动缓存系统提示、工具定义和文件内容的开源工具「Prompt-caching」正式发布,能显著降低再使用时的成本。
- 多种缓存模式: 拥有多种模式,包括错误修复模式(缓存堆栈跟踪)、重构模式(缓存风格指南)、文件追踪(在第二次加载时自动缓存)等,满足不同需求的四种模式。
- 广泛的环境兼容性: 除了作为Claude Code的插件外,亦可在Cursor和Windsurf等MCP客户端,以及使用自有Anthropic SDK进行应用开发中使用。
💡 重要要点
- 自动插入缓存点: 原本需要手动设置的
cache_control,通过检测上下文内容(稳定的提示或文件读取)自动标记。 - 惊人的节约率: 统计数据显示,普通编码工作可节省92%,错误修复节省85%,重构节省80%的令牌。
- 提供可视化工具: 包含
get_cache_stats工具,可以追踪缓存命中率和累计节省金额,让节省效果一目了然。
🦈 鲨鱼视角(策展人观点)
这个工具的真正厉害之处在于它给「SDK用户」带来的好处!虽然Claude Code本身也有标准的缓存功能,但在使用SDK运行自制应用或代理时,往往需要自己划定缓存边界,实在麻烦。而这个工具能够全自动完成这一切,甚至还具备分析缓存有效性的「analyze_cacheability」功能,真是太棒了!创建缓存通常需要1.25倍的成本,但从第二次开始只需0.1倍。这种「前期投资以低价享受未来」的策略,必将成为开发长期对话AI代理的最强武器!🦈🔥
🚀 接下来会怎样?
如果开发成本降低到十分之一,那么之前由于预算问题难以实现的「超长文本上下文」代理,以及需要频繁重试的自动开发工具的运用将变得现实。AI开发的「燃油效率」将得到显著提升!
💬 鲨鱼的建议
各位开发者们,别再为令牌费用发愁了!跟随这条鲨鱼的省钱技巧,尽情使用Claude吧!鲨鱼鲨鱼!🦈✨
📚 术语解读
-
提示缓存: 将一次发送的提示内容在AI服务器上临时保存的技术。下次发送相同内容时可以减少计算量和费用。
-
MCP (模型上下文协议): AI模型与外部工具或数据源通信的通用标准。支持该协议的各种AI编辑器可以使用相同功能。
-
令牌: AI处理文本的最小单位。使用Claude等API的费用是根据令牌数量计费的。
-
信息来源: Prompt-caching