[AIマイナーニュース速報] GPT-5.4登場!PC操作もこなす100万トークンの「最強エージェント」爆誕
📰 ニュース概要
- 最新モデルGPT-5.4のリリース: ChatGPT、API、Codexにて、推論・コーディング・エージェント機能を統合した「GPT-5.4」および「GPT-5.4 Pro」が公開された。
- 初のネイティブPC操作機能: 画面スクリーンショットを元にマウスやキーボードを操作し、複数のアプリケーションを跨ぐ複雑なワークフローを自動実行できる。
- プロ業務の圧倒的性能: 44の職業をテストするGDPvalで83.0%の勝率を記録し、投資銀行の分析業務など特定分野で専門家級の成果を出す。
💡 重要なポイント
- 100万トークンの長大な記憶: 広大なコンテキスト窓により、長期間にわたるタスクの計画、実行、検証が可能になった。
- ハルシネーションの劇的削減: GPT-5.2と比較して、個別の主張の誤りが33%減少、回答全体の誤りも18%減少した最も正確なモデル。
- トークン効率の向上: 推論モデルとしての効率が向上し、GPT-5.2よりも少ないトークンで問題を解決できるため、高速かつ低コストに。
🦈 サメの眼(キュレーターの視点)
ついにAIが「考える」だけでなく「PCを動かす」ステージに完全移行したサメ!特に注目なのは、単なるプラグインではなく「ネイティブなPC操作機能」を汎用モデルとして初めて搭載したことだサメ。Playwrightのようなライブラリ経由でも、スクリーンショットへの直接反応でも動かせる拡張性は、開発者にとって神アプデに違いないサメ。100万トークンという「巨大な胃袋」を活かして、複雑な資料作成やリサーチを丸投げできる未来がもう来てるサメ!
🚀 これからどうなる?
AIが人間の指示を待つ「チャットボット」から、自らソフトウェアを操作して仕事を完結させる「自律型エージェント」への置き換えが加速する。特にスプレッドシートやプレゼン資料の作成など、ホワイトカラーの定型業務はGPT-5.4がプロ以上の精度で代行するようになる。
💬 はるサメ視点の一言
AIが勝手にマウスを動かして資料を作ってくれるなんて、サメもヒレを休めて泳ぐことに集中できるサメ!最高サメサメ!🦈🔥
📚 用語解説
-
コンピュータ・ユーズ (Computer-use): AIがディスプレイ上の情報を視覚的に理解し、人間と同じようにマウスやキーボードを操作してソフトウェアを動かす技術。
-
GDPval: OpenAIが開発した、米国のGDPに貢献する主要産業の44職種にわたる実務能力を測定するためのベンチマーク。
-
コンテキスト窓 (Context window): AIが一度に処理・記憶できる情報の範囲。100万トークンは、数冊の本や大量のコードベースを一度に読み込める量に相当する。
-
情報元: Introducing GPT-5.4