Strix Halo 上の Qwen3.5 LLM のパフォーマンスが向上:エキサイティングな Unsloth 量子化の洞察!
分析
この研究は、Strix Halo システム上で新しい「動的」量子化手法を用いて、Qwen3.5-35B および 122B モデルのパフォーマンスを探求しています。テストでは、Unsloth UDXL 量子化と Bartowski の実装を比較し、複雑な 3D アニメーション太陽系を含む HTML ファイルの作成中にパフォーマンスの向上と興味深い動作を明らかにしています。
重要ポイント
引用・出典
原文を見る"パフォーマンスの数字に加えて、私は「動的」量子化をテスト中に奇妙なことに気付きました。既に strix halo 上で 122B-A10B-UD-Q5_K_XL と 35B-A3B-UD-Q6_K_XL の 2 つをテストしましたが、それらは奇妙な挙動を示しました。"