Gemma Scope 2 リリース発表
分析
Google DeepMindのmech interpチームが、Gemma 3モデルファミリーで訓練されたスパースオートエンコーダー(SAE)とトランスコーダーのスイートであるGemma Scope 2をリリースします。このリリースは、より複雑なモデルのサポート、すべてのレイヤーと最大27Bのモデルサイズをカバーするより包括的なリリース、およびチャットモデルへのフォーカスなど、以前のバージョンよりも進歩しています。リリースには、さまざまなサイト(残差ストリーム、MLP出力、およびアテンション出力)でトレーニングされたSAEとMLPトランスコーダーが含まれています。チームは、SAEに関する基礎研究を優先順位から外したにもかかわらず、これがコミュニティにとって有用なツールとなることを願っています。
重要ポイント
参照
“このリリースには、3つの異なるサイト(残差ストリーム、MLP出力、およびアテンション出力)でトレーニングされたSAEと、Gemma 3ファミリーの10個のモデル(つまり、270m、1b、4b、12b、27bのサイズ、それぞれPTとITバージョン)のすべてのレイヤーに対するMLPトランスコーダー(アフィン・スキップ接続の有無両方)が含まれています。”