safety#vlm🔬 Research分析: 2026年1月19日 05:01

建設現場のAI探偵:VLMが作業員の行動と感情を読み解く!

公開:2026年1月19日 05:00
1分で読める
ArXiv Vision

分析

建設現場でのAIの飛躍的進歩ですね!GPT-4oのようなVision-Language Models(VLM)が、ダイナミックな環境下での人間の行動を理解し、解釈する驚くべき能力を示しています。世界中の建設現場で、安全と生産性の向上が期待できます!

参照

GPT-4oは、両方のタスクで一貫して最高のスコアを達成し、行動認識で平均F1スコア0.756、精度0.799、感情認識でF1スコア0.712、精度0.773を記録しました。