Research#llm📝 Blog分析: 2026年1月3日 07:50

Gemma Scope 2 リリース発表

公開:2025年12月22日 21:56
2分で読める
Alignment Forum

分析

Google DeepMindのmech interpチームが、Gemma 3モデルファミリーで訓練されたスパースオートエンコーダー(SAE)とトランスコーダーのスイートであるGemma Scope 2をリリースします。このリリースは、より複雑なモデルのサポート、すべてのレイヤーと最大27Bのモデルサイズをカバーするより包括的なリリース、およびチャットモデルへのフォーカスなど、以前のバージョンよりも進歩しています。リリースには、さまざまなサイト(残差ストリーム、MLP出力、およびアテンション出力)でトレーニングされたSAEとMLPトランスコーダーが含まれています。チームは、SAEに関する基礎研究を優先順位から外したにもかかわらず、これがコミュニティにとって有用なツールとなることを願っています。

参照

このリリースには、3つの異なるサイト(残差ストリーム、MLP出力、およびアテンション出力)でトレーニングされたSAEと、Gemma 3ファミリーの10個のモデル(つまり、270m、1b、4b、12b、27bのサイズ、それぞれPTとITバージョン)のすべてのレイヤーに対するMLPトランスコーダー(アフィン・スキップ接続の有無両方)が含まれています。