大規模プログラムのLLMを用いた自動検証

Research Paper#Formal Verification, LLMs, Software Engineering🔬 Research|分析: 2026年1月3日 08:53
公開: 2025年12月31日 03:31
1分で読める
ArXiv

分析

本論文は、静的解析、演繹的検証、およびLLMを組み合わせることにより、大規模ソフトウェアの検証という課題に取り組んでいます。潜在的なランタイムエラーに基づいて、LLMを使用して形式仕様を生成および洗練するフレームワークであるPregussを紹介します。主な貢献は、1000行以上のコードを持つプログラムの検証を可能にし、既存のLLMベースの方法と比較して人間の労力を大幅に削減する、モジュール化されたきめ細かいアプローチです。
引用・出典
原文を見る
"Preguss enables highly automated RTE-freeness verification for real-world programs with over a thousand LoC, with a reduction of 80.6%~88.9% human verification effort."
A
ArXiv2025年12月31日 03:31
* 著作権法第32条に基づく適法な引用です。