分析
Perplexityは、Nvidia Grace Blackwellチップを搭載した専用クラスターを利用するためにCoreWeaveと提携し、大きな前進を遂げます。この戦略的な動きは、より高速で効率的な結果をもたらし、AI推論能力に革命を起こすことを約束します。この複数年契約は、最先端技術とパフォーマンスの向上へのコミットメントを示しています。
ai inferenceに関するニュース、研究、アップデートをAIが自動収集しています。
"アナログインメモリコンピューティング (IMC) は、AIモデルの重みをプロセッサ内に直接保存し、物理現象 (電流の流れ、電荷の蓄積) を使用して、ニューラルネットワークの推論を支配する乗算累算演算を実行します。"
"それで、主要なプラットフォームの1つで約800ドルのGPU使用クレジットを持っています。これらは、GPUとクラスターに特化して使用できます。"
"ブログ投稿で、Koyebはプラットフォームの運用を継続すると述べました。しかし、そのチームとテクノロジーは、Mistralがクライアント自身のハードウェア(オンプレミス)に直接モデルを展開し、GPUの使用を最適化し、AI推論をスケーリングするのにも役立ちます。"
"vLLMチームの商業的手段であるInferactは、a16zとLightspeedが主導する1億5000万ドルの大規模なシードラウンドでローンチし、プロジェクトの評価額は8億ドル。"
"Inflection AI Accelerates AI Inference with Intel Gaudi: A Performance Deep Dive"