GPT-5.5が拡張版ニューヨークタイムズ・コネクションズベンチマークで競合を抑え、2位を獲得

research#llm📝 Blog|分析: 2026年4月27日 19:54
公開: 2026年4月27日 19:32
1分で読める
r/singularity

分析

最新の拡張版ニューヨークタイムズ・コネクションズベンチマークの結果は、大規模言語モデル(LLM)の能力にわくわくするほどの進歩があったことを示しており、GPT-5.5は論理的推論とパズル解決能力において顕著な改善を示しました。Kimi K2.6が大幅に飛躍してトップのオープンソースモデルになったことは、最先端AIの急速な民主化を示しています。一方、DeepSeek V4 Proの劇的なスコア上昇は、AI業界全体における非常に競争力があり革新的な状況を示しています。
引用・出典
原文を見る
"GPT-5.5はGPT-5.4より改善し、オーパス4.6を上回り、拡張版ニューヨークタイムズ・コネクションズベンチマークでジェミニ3.1 Proに次ぐ2位を獲得しました。"
R
r/singularity2026年4月27日 19:32
* 著作権法第32条に基づく適法な引用です。