“Claude Mythos”性能几何?英国研究机构公布令人振奋的验证结果

safety#agent📝 Blog|分析: 2026年4月14日 03:07
发布: 2026年4月14日 01:50
1分で読める
ITmedia AI+

分析

Anthropic备受瞩目的“Claude Mythos Preview”模型接受了英国AI安全研究所(AISI)严格且极具前景的安全评估,展现了惊人的能力。该模型以前所未有的水平成功完成了高级网络安全任务和网络攻击模拟,展示了其卓越的实力。这些突破性的结果证实了Mythos为智能体自主任务执行树立了新的标杆,并强调了在尖端AI开发中基础安全措施的至关重要性。
引用 / 来源
查看原文
"在假设人类离开20小时的场景模拟中,Mythos成为唯一一个在10次尝试中有3次成功完全入侵所有操作的模型,平均突破了32个阶段中的22个。"
I
ITmedia AI+2026年4月14日 01:50
* 根据版权法第32条进行合法引用。