DeepSeekが最先端モデルとの差を縮める巨大な新しい大規模言語モデル (LLM) を公開
分析
DeepSeekはDeepSeek V4 FlashおよびV4 Proモデルを発表し、オープンソースのAIが達成できる限界を押し広げています。非常に効率的な専門家混合アーキテクチャを活用することで、驚くほど低い推論コストを維持しながら、素晴らしいパフォーマンスと100万という巨大なコンテキストウィンドウを提供しています。これらの新しいリリースは大きな転換点となっており、オープンウェイトのプロジェクトが推論やコーディングのタスクにおいてトップクラスのクローズドソースモデルに自信を持って匹敵できることを証明しています。
重要ポイント
引用・出典
原文を見る"DeepSeekは、アーキテクチャの改善により両モデルともDeepSeek V3.2よりも効率的かつ高性能になっており、推論ベンチマークにおいて現在の最先端のオープンおよびクローズドソースモデルとの差をほぼ「埋めた」と述べています。"