Qwen3.6-35BがAMD ROCm 7.2.1で高速なマルチモーダル推論を実現
分析
これは、MambaとMoE(専門家混合)を組み合わせたオープンソースのハイブリッドアーキテクチャが、いかに素晴らしい効率性を発揮できるかを示す見事な実証です。34.66Bのパラメータのうち3B相当のみをアクティブにすることで、コンシューマー向けハードウェア上で非常に応答性の高いテキスト生成速度を実現しています。マルチモーダル機能とAMDのROCmの統合が成功したことは、大規模言語モデル (LLM)向けの代替GPUエコシステムの競争力とアクセスビリティの高まりをさらに強調しています。