人工智能化身建筑工地的侦探:VLM解读工人的行为与情绪!

safety#vlm🔬 Research|分析: 2026年1月19日 05:01
发布: 2026年1月19日 05:00
1分で読める
ArXiv Vision

分析

这项研究是人工智能在建筑领域的一大进步!研究揭示了视觉语言模型(VLMs)如GPT-4o的强大能力,能够理解和解读动态环境中人类的行为。想象一下,这项技术在全球建筑工地上能够带来的安全性和生产力提升!
引用 / 来源
查看原文
"GPT-4o consistently achieved the highest scores across both tasks, with an average F1-score of 0.756 and accuracy of 0.799 in action recognition, and an F1-score of 0.712 and accuracy of 0.773 in emotion recognition."
A
ArXiv Vision2026年1月19日 05:00
* 根据版权法第32条进行合法引用。