GIE-Bench:面向文本引导图像编辑的基于地面的评估

Research#llm🏛️ Official|分析: 2025年12月28日 21:57
发布: 2025年12月16日 00:00
1分で読める
Apple ML

分析

本文介绍了GIE-Bench,这是一个由Apple ML开发的新基准,旨在改进文本引导图像编辑模型的评估。目前的评估方法,依赖于CLIP等图像-文本相似性指标,被认为是不精确的。GIE-Bench旨在通过关注功能正确性来提供更基于地面的评估。这通过自动生成的选择题来实现,这些问题评估了预期的更改是否已成功实施。这种方法代表了在图像编辑中对AI模型进行更准确和可靠评估的重要一步。
引用 / 来源
查看原文
"Editing images using natural language instructions has become a natural and expressive way to modify visual content; yet, evaluating the performance of such models remains challenging."
A
Apple ML2025年12月16日 00:00
* 根据版权法第32条进行合法引用。