LLMは複数のコード脆弱性への対応に苦戦Paper#llm🔬 Research|分析: 2026年1月3日 23:57•公開: 2025年12月26日 05:43•1分で読める•ArXiv分析この論文は、単一の脆弱性検出を超えたLLMセキュリティ研究における重要なギャップに対処しています。 複数の脆弱性が同時に発生することが多い現実世界のコードの複雑さを処理する際の、現在のLLMの限界を浮き彫りにしています。 マルチ脆弱性ベンチマークの導入と、最先端のLLMの評価は、そのパフォーマンスと失敗モード、特に脆弱性の密度と言語固有の課題の影響について貴重な洞察を提供します。重要ポイント•LLMの脆弱性検出性能は、脆弱性の密度が増加するにつれて大幅に低下します。•異なるプログラミング言語は、LLMに対して異なる失敗モードを示します。•現在のLLMは、複雑なコード内の複数の脆弱性を正確に特定することに苦労しています。•この論文は、マルチ脆弱性検出のための新しいベンチマークを紹介しています。引用・出典原文を見る"Performance drops by up to 40% in high-density settings, and Python and JavaScript show distinct failure modes, with models exhibiting severe "under-counting"."AArXiv2025年12月26日 05:43* 著作権法第32条に基づく適法な引用です。古い記事CricBench: A Multilingual Benchmark for Evaluating LLMs in Cricket Analytics新しい記事PDx -- Adaptive Credit Risk Forecasting Model in Digital Lending using Machine Learning Operations関連分析Paper選択ポリシーを用いた協調型人型ロボット操作2026年1月3日 06:10Paper未ポーズ画像からの即時3Dシーン編集2026年1月3日 06:10Paper将来予測のためのLLMフォアキャスティング2026年1月3日 06:10原文: ArXiv