Gemma Scope 2:增强人工智能安全性的可解释性

safety#llm🏛️ Official|分析: 2026年1月5日 10:16
发布: 2025年12月16日 10:14
1分で読める
DeepMind

分析

Gemma Scope 2的发布显着降低了研究人员调查Gemma系列模型内部运作的门槛。通过提供开放的可解释性工具,DeepMind正在促进一种更具协作性和透明度的人工智能安全研究方法,从而可能加速发现漏洞和偏见。此举也可能影响模型透明度的行业标准。
引用 / 来源
查看原文
"Open interpretability tools for language models are now available across the entire Gemma 3 family with the release of Gemma Scope 2."
D
DeepMind2025年12月16日 10:14
* 根据版权法第32条进行合法引用。