平素より天秤AIをご利用いただき、誠にありがとうございます。
2026年3月6日にOpenAIよりGPT 5.4 / GPT 5.4 Proのリリースがあり、天秤AIにおいても、GPT 5.4 / GPT 5.4 Proのご提供に向けた対応を進めております。
恐縮ながらご提供開始まで少々お待ちいただくことになりますが、リリース次第お知らせいたしますので、どうぞご期待ください。
GPT 5.4 / GPT 5.4 Proについて
GPT 5.4は、OpenAIがリリースしたプロフェッショナルワーク向けの最新フロンティアモデルです。推論・コーディング・エージェントワークフローにおける最近の進歩を統合し、ツール操作、ソフトウェア環境、スプレッドシート・プレゼンテーション・ドキュメントなどの業務タスクを含む幅広い領域で性能が向上しています。GPT 5.4 Proは、最も複雑なタスクで最大限のパフォーマンスを求めるユーザー向けの上位モデルです。
主な特徴:
【GPT 5.4】
画像認識とドキュメント理解の強化
視覚理解と推論のテストであるMMMU-Proにおいて81.2%の成功率を達成。また、最大10.24Mピクセルまでのフル解像度画像入力に対応し、ドキュメント解析精度も向上しています。
コーディング性能の向上
GPT-5.3-Codexのコーディング能力と業界トップクラスの知識ワーク・コンピュータ操作能力を統合。SWE-Bench Proにおいて前モデルを上回り、より低いレイテンシで動作します。
ツールサーチ機能の導入
APIにおいて、多数のツール定義を事前にすべて読み込む必要がなくなるツールサーチ機能を導入。モデルは必要な時にツール定義を検索・取得するため、トークン使用量を最大47%削減し、高速化とコスト削減を実現しています。
最大100万トークンのコンテキストウィンドウ
Codexにおいて実験的に100万トークンのコンテキストウィンドウをサポートし、大規模なコードベースや長文ドキュメントの一括分析が可能です。
【GPT 5.4 Pro】
最も複雑なタスク向けの最高性能モデル
GPT 5.4 Proは、最も難易度の高い問題に対して最大限のパフォーマンスを発揮するよう設計された上位モデルです。
高度な数学・科学分野での優れた性能
FrontierMath Tier 4(最難関)において38.0%を達成し、GPT 5.4の27.1%を大きく上回ります。Frontier Science Researchでも36.7%(GPT 5.4: 33.0%)と高い性能を示しています。
抽象推論能力の向上
ARC-AGI-2(Verified)において83.3%を達成し、GPT 5.4の73.3%を上回る抽象推論能力を備えています。
エージェント型ウェブ検索の強化
BrowseCompにおいて89.3%を達成し、GPT 5.4の82.7%を上回ります。複雑な情報検索タスクにおいて最先端の性能を発揮します。
詳細情報
GPT 5.4 / GPT 5.4 Proの技術的詳細や性能評価については、公式サイトをご覧ください。
https://openai.com/index/introducing-gpt-5-4/
ご質問やフィードバックがございましたら、お気軽にお聞かせくださいませ。
※本記事公開日:2026年3月6日