人工智能化身建筑工地的侦探:VLM解读工人的行为与情绪!
发布:2026年1月19日 05:00
•1分で読める
•ArXiv Vision
分析
这项研究是人工智能在建筑领域的一大进步!研究揭示了视觉语言模型(VLMs)如GPT-4o的强大能力,能够理解和解读动态环境中人类的行为。想象一下,这项技术在全球建筑工地上能够带来的安全性和生产力提升!
引用
“GPT-4o在两项任务中均取得了最高的得分,在动作识别中平均F1值为0.756,准确率为0.799,在情绪识别中F1值为0.712,准确率为0.773。”