大規模プログラムのLLMを用いた自動検証
分析
本論文は、静的解析、演繹的検証、およびLLMを組み合わせることにより、大規模ソフトウェアの検証という課題に取り組んでいます。潜在的なランタイムエラーに基づいて、LLMを使用して形式仕様を生成および洗練するフレームワークであるPregussを紹介します。主な貢献は、1000行以上のコードを持つプログラムの検証を可能にし、既存のLLMベースの方法と比較して人間の労力を大幅に削減する、モジュール化されたきめ細かいアプローチです。
重要ポイント
参照
“Pregussは、1000行以上の実際のプログラムに対して高度に自動化されたRTEフリーネス検証を可能にし、人間の検証作業を80.6%〜88.9%削減します。”