人工智能化身建筑工地的侦探:VLM解读工人的行为与情绪!
分析
这项研究是人工智能在建筑领域的一大进步!研究揭示了视觉语言模型(VLMs)如GPT-4o的强大能力,能够理解和解读动态环境中人类的行为。想象一下,这项技术在全球建筑工地上能够带来的安全性和生产力提升!
引用 / 来源
查看原文"GPT-4o consistently achieved the highest scores across both tasks, with an average F1-score of 0.756 and accuracy of 0.799 in action recognition, and an F1-score of 0.712 and accuracy of 0.773 in emotion recognition."