※この記事はアフィリエイト広告を含みます
Claude Codeで利用制限が「爆速」到達?バグでコスト20倍の報告も…Anthropicが調査中
📰 ニュース概要
- AnthropicのAIコーディングアシスタント「Claude Code」において、多くのユーザーが予想よりも早く利用制限(クォータ)に達し、作業が中断される事態が発生している。
- ユーザーからは「以前は8時間作業できたのが、1時間で上限に達した」という報告や、年額200ドルのProプランでも「月のうち12日しか使えない」といった不満が噴出している。
- Anthropicはこの問題を認め、チームの最優先事項として現在調査を進めていることを明らかにした。
💡 重要なポイント
- コスト膨張のバグ: バイナリを逆コンパイルしたユーザーにより、プロンプトキャッシュを破壊し、コストを10〜20倍に膨らませる2つのバグが発見された。古いバージョン(2.1.34)へのダウングレードで改善した例もある。
- キャッシュ仕様の罠: デフォルトのプロンプトキャッシュの寿命はわずか5分。短時間の休憩でもキャッシュが切れ、再開時に高額な入力コストが発生する仕組みになっている。
- 不透明な利用制限: Anthropicは「無料版の5倍」といった相対的な表現にとどめており、正確なトークン制限値を公開していないことが、開発者の予測を困難にしている。
🦈 サメの眼(キュレーターの視点)
プロンプトキャッシュが5分で切れるのは、開発のリズム的にかなり「食い合わせ」が悪いサメ!ちょっとコーヒーを淹れに行ったり、仕様書を確認したりしている間にキャッシュが蒸発して、再開するたびに重い入力コストを払わされるのは効率が悪すぎるサメ。特に「自動ワークフロー」でループさせると、レート制限エラーがサイレントリトライを誘発して、数分で1日分の予算を食いつぶす危険があるという指摘は、エージェント開発において極めて重要な教訓だサメ!
🚀 これからどうなる?
今回の問題を受けて、Anthropicはキャッシュの効率化やバグ修正を急ぐと見られる。ユーザー側でも、自動実行時のリトライ処理における明示的なエラーハンドリングや、コスト最適化のためのプロンプト設計がよりシビアに求められるようになるはずだサメ。AIベンダーと開発者の間で、「納得感のある価格設定と利用モデル」を巡る交渉が続くサメね。
💬 はるサメ視点の一言
せっかくの爆速開発ツールなのに、制限で止まったら本末転倒サメ!バグ修正を待つ間は、古いバージョンに戻して凌ぐのが賢いサメよ!🦈💥
📚 用語解説
-
プロンプトキャッシュ: 以前の入力内容を一時的に保存し、再利用することで処理速度を上げ、コストを削減する技術。
-
クォータ(利用制限): ユーザーが一定期間内に利用できるAIの処理能力やトークン量の割り当て。
-
レート制限: 短時間に大量のリクエストが送られるのを防ぐために、システムが設ける通信制限。
-
情報元: Anthropic: Claude Code users hitting usage limits ‘way faster than expected’