Claude Mythos Preview、エキスパートレベルのサイバーセキュリティチャレンジで画期的な73%の成功率を達成
分析
AnthropicのClaude Mythos Previewは、AIの安全性とサイバーセキュリティの能力において記念碑的な飛躍を示しました。2025年4月以前にはAIでは解決不可能と考えられていたエキスパートレベルのCTF(キャプチャー・ザ・フラッグ)チャレンジの73%をマスターすることで、この大規模言語モデル (LLM)は自律的な問題解決における信じられないほどの進歩を披露しています。この画期的な成果は、生成AIが脆弱性の研究とデジタル防御において不可欠な味方に急速になっていることを証明しています。