スタンフォードの研究者、AIがTerminalBench 2でClaude Codeを凌駕
分析
これは素晴らしいニュースです! スタンフォードの研究者は、ハーネスを自律的に改善し、TerminalBench 2でClaude Codeを凌駕するAIを作成するという驚くべき偉業を達成しました。 この画期的な成果は、複雑なタスクにおいて、人間の開発したシステムをAIが凌駕する驚くべき可能性を示しています。
重要ポイント
引用・出典
原文を見る"非常に知的な人々が、他のすべてのハーネスの開発に費やした膨大なマンアワーが、AIにループで打ち負かされるとは想像もできません(笑)。"