建設現場のAI探偵:VLMが作業員の行動と感情を読み解く!

safety#vlm🔬 Research|分析: 2026年1月19日 05:01
公開: 2026年1月19日 05:00
1分で読める
ArXiv Vision

分析

建設現場でのAIの飛躍的進歩ですね!GPT-4oのようなVision-Language Models(VLM)が、ダイナミックな環境下での人間の行動を理解し、解釈する驚くべき能力を示しています。世界中の建設現場で、安全と生産性の向上が期待できます!
引用・出典
原文を見る
"GPT-4o consistently achieved the highest scores across both tasks, with an average F1-score of 0.756 and accuracy of 0.799 in action recognition, and an F1-score of 0.712 and accuracy of 0.773 in emotion recognition."
A
ArXiv Vision2026年1月19日 05:00
* 著作権法第32条に基づく適法な引用です。