分析
自律的なAIエージェントにとって記念碑的な飛躍であり、OpenAIが高度な推論モデルの実現に向けてたゆまぬ努力を続けていることを示しています。OSWorld-Vベンチマークで75%を達成し、人間のベースライン(72.4%)を公式に超えたことは、AIが現実世界の複雑なデスクトップタスクを処理する準備が整ったことを示すワクワクするようなマイルストーンです。さらに、きめ細かい推論制御と最大1Mトークンのコンテキストウィンドウの導入により、長時間動作する次世代の自律的なデジタルワーカーを構築する開発者に信じられないほどの可能性が開かれます。