Anthropicが「Claude Mythos」を公開:AIの推論とコーディングにおける息を呑むほどの飛躍
分析
Anthropicは「Claude Mythos」という画期的な新しい大規模言語モデル (LLM) のティアを秘密裏に開発し、数学的推論とコーディング能力において驚異的な飛躍を示しました。特にUSAMOの数学ベンチマークで42.3%から97.6%へと劇的に向上しており、パフォーマンスの質的な跳躍を披露しています。このブレイクスルーは、専門的なAIシステムが達成できることの非常にエキサイティングな変化を表しており、複雑な問題解決の絶対的な限界を押し広げています。
重要ポイント
引用・出典
原文を見る"Anthropicが一般公開を見送った理由は、サイバーセキュリティ能力が想定以上に高かったからです。公式技術ブログには「comput...において驚くほど高い能力を持つ」と記されています。"