Claude Opus 4.7の衝撃!新トークナイザーで消費トークンが最大47%増加
📰 ニュース概要
- トークン消費量の増大: Claude Opus 4.7の新トークナイザーは、前モデル(4.6)と比較して1.0〜1.35倍、技術文書では最大1.47倍のトークンを消費することが判明した。
- 言語・形式による格差: 英語の技術文書(1.47倍)やコード(1.21〜1.39倍)で消費が激増する一方、日本語や中国語などのCJK言語は1.01倍と、ほぼ影響がない。
- 精度の向上: Anthropic側は、トークンを細分化することで「指示への忠実な追従(Instruction Following)」やツールの呼び出し精度の向上を狙っているとされる。
💡 重要なポイント
- 実質的なコスト増: 同じ価格、同じクォータ(利用制限)でも、1回のリクエストで消費されるトークンが増えるため、コンテキストウィンドウの枯渇やレートリミット到達が早まる。
- 技術文書・コードに直撃: コード内のキーワードやインポート文といった高頻度の文字列が、以前より細かく分割されるようになったことが要因と推測される。
- ベンチマーク結果: IFEvalを用いたテストでは、4.6が85%の成功率だったのに対し、4.7は90%に向上。コスト増と引き換えに精度を得た形となっている。
🦈 サメの眼(キュレーターの視点)
Anthropicは、あえて「効率」を捨てて「精度」を獲りに来たんだサメ! 注目すべきは、英語やコードのトークン消費が激増している一方で、日本語(CJK)がほぼ無風(1.01倍)という点だサメ。これは、既存のボキャブラリーのうち非ラテン文字部分の構造を維持しつつ、英語やコードのパターンをより「細切れ」に認識するように変更したことを示唆しているサメ。トークンを細かくすることで、モデルが単語の一つ一つ、あるいは記号の細部にまで注意を払えるようになる。実際、IFEvalのテストで「特定の単語を2回含める」「すべて大文字で答える」といった制約の遵守率が上がっているのは、この戦略が功を奏している証拠だサメ!開発者にとっては、APIコストが実質2〜3割増しになる計算だから、キャッシュの活用やプロンプトの最適化がより一層重要になるサメね!
🚀 これからどうなる?
開発者は、同じタスクでもClaude Opus 4.7に移行するだけで予算を圧迫される可能性があるため、コストパフォーマンスの再評価が必要になるだろう。一方で、高い精度が求められるエージェント開発やコード生成タスクでは、この「高コスト・高精度」な新トークナイザーが業界の新たな標準となるかもしれない。
💬 はるサメ視点の一言
精度のためならトークンを食いまくる、まさに「暴食」な進化だサメ!でも日本語ユーザーには優しい設計で安心したサメ!
📚 用語解説
-
トークナイザー: テキストをAIが処理できる最小単位(トークン)に分割する仕組み。分割が細かいほど処理の解像度が上がるが、トークン数は増える。
-
IFEval: Googleが提唱した、AIがどれだけ指示(制約)を厳密に守れるかを検証するためのベンチマークテスト。
-
Byte-Pair Encoding (BPE): 頻出する文字の組み合わせを一つのトークンとして登録していくアルゴリズム。今回はこの「マージ(統合)」の仕方が変わったと推測される。