BREAKING

OpenAI、GPT-5.4を正式公開 OSWorldで75%・人間超えのエージェント性能

OpenAIは2026年3月5日、フラッグシップモデル「GPT-5.4」を公開した。TechCrunchの報道によれば、Pro版とThinking版を同時投入し、推論・コーディング・エージェンティックワークフローを1モデルに統合した。

OpenAI公式の技術ブログは、コンピュータ操作ベンチマークOSWorld-Verifiedで75.0%を達成したと明記。前世代GPT-5.2の47.3%を大幅に上回り、人間の72.4%をも超えた。SWE-bench Pro(コーディング)は57.7%、知識労働評価GDPvalは83%に達した。

Fortuneが4月7日に報じたところでは、同社内ではIPOをめぐる経営陣の緊張が続いており、次期モデル「Spud」(GPT-5.5またはGPT-6として公開見込み)の開発は事前学習を3月24日頃に完了した段階にある。

参照ソース

  • OpenAI公式「Introducing GPT-5.4」
  • TechCrunch(2026-03-05)
  • Fortune(2026-04-07)
  • llm-stats.com「AI Updates Today」