CANVAS: 用于基于工具的用户界面设计的视觉-语言模型基准

Research #VLM 🔬 Research|分析: 2026年1月10日 14:19•

发布: 2025年11月25日 16:13

•

1分で読める

分析

本文介绍了一个新的基准测试 CANVAS，专门用于评估视觉-语言模型在利用工具进行用户界面设计方面的能力。这项工作意义重大，因为它提供了一个标准化的评估框架，而这个领域目前缺乏这种框架。

引用 / 来源

"The paper focuses on evaluating vision-language models."

ArXiv2025年11月25日 16:13

* 根据版权法第32条进行合法引用。

Adversarial Confusion Attack: Threatening Multimodal LLMs

New Framework Evaluates Text Normalization in NLP