Opus, Sonnet、Haikuが対決!ブラウザ自動化の激戦!
分析
この記事は、ブラウザ自動化タスクに使用する際に、さまざまな大規模言語モデル (LLM) 間のパフォーマンスの違いを興味深く見ています! Opus、Sonnet、Haiku の速度、トークン使用量、成功率を比較し、この実用的なアプリケーションでどのモデルが優れているかについての貴重な洞察を提供しています。
重要ポイント
引用・出典
原文を見る"Opus 4.6 は実行時間とトークン数でわずかに劣るものの、全件成功率が高く安定している。Sonnet 4.6 は高速かつ低コストだが、成功率にばらつきがある。Haiku 4.5 は agent-browser を自発的に使わないため、E2E テストには向かない。"