AIベンチマークの再構築:人間のような入出力に向けて
分析
AIモデルに対するAPI呼び出しからビデオ入力とキーボード/マウス出力への移行という提案は、より人間らしいインタラクションへのエキサイティングな一歩です。このアプローチは、より正確なベンチマークと、現実世界のシナリオでのより良いパフォーマンスにつながる可能性があります。AIが達成できることの限界を押し広げる、魅力的なコンセプトです。
重要ポイント
引用・出典
原文を見る"「これで、入力と出力は、ほぼ人間と全く同じということになります。明らかに、もっと良い結果が出るでしょう?」"