建設現場のAI探偵:VLMが作業員の行動と感情を読み解く!
公開:2026年1月19日 05:00
•1分で読める
•ArXiv Vision
分析
建設現場でのAIの飛躍的進歩ですね!GPT-4oのようなVision-Language Models(VLM)が、ダイナミックな環境下での人間の行動を理解し、解釈する驚くべき能力を示しています。世界中の建設現場で、安全と生産性の向上が期待できます!
重要ポイント
参照
“GPT-4oは、両方のタスクで一貫して最高のスコアを達成し、行動認識で平均F1スコア0.756、精度0.799、感情認識でF1スコア0.712、精度0.773を記録しました。”