ビジョン言語モデルを用いた海事自律航行におけるセマンティックハザード検出

公開:2025年12月30日 21:20
1分で読める
ArXiv

分析

本論文は、セマンティックな理解を必要とする外れ値状況への対応という、海事自律航行における重要な課題に取り組んでいます。ビジョン言語モデル(VLM)を使用して危険を検出し、安全なフォールバック操作をトリガーする新しいアプローチを提案し、IMO MASSコードの要件に適合させています。高速・低速異常パイプラインと人間がオーバーライド可能なフォールバック操作に焦点を当てていることは、アラートからテイクオーバーまでのギャップにおける安全性の確保にとって特に重要です。遅延測定、人間の合意との整合性、実際のフィールドランを含む論文の評価は、提案されたアプローチの実用性と有効性を示す強力な証拠を提供しています。

参照

本論文は、「Semantic Lookout」を紹介しています。これは、カメラのみを使用し、候補が制限されたビジョン言語モデル(VLM)のフォールバック操作セレクターであり、継続的な人間の権限の下で、水上で有効で世界に固定された軌道から1つの慎重なアクション(または定点保持)を選択します。