通过原型引导实现多标签植物物种识别的零样本分割
分析
本文介绍了一种使用零样本分割进行多标签植物物种识别的新方法。该方法利用从训练数据集中获得的类原型来指导测试图像上的分割 Vision Transformer (ViT)。通过采用 K-Means 聚类创建原型,以及在单个物种分类上预训练的定制 ViT 架构,该模型有效地从多类适应到多标签分类。该方法展示了有希望的结果,在 PlantCLEF 2025 挑战赛中获得第五名。与最佳提交相比,性能差距很小,这表明有进一步改进的潜力,并突出了原型引导分割在解决复杂图像分析任务中的有效性。使用 DinoV2 进行预训练也是该方法的一个值得注意的方面。
要点
- •用于植物物种识别的原型引导零样本分割。
- •利用 K-Means 聚类和定制的 ViT 架构。
- •在 PlantCLEF 2025 挑战赛中取得了可喜的成绩。
引用
“我们的解决方案侧重于使用从训练数据集中获得的类原型作为代理指导,用于在测试集图像上训练分割 Vision Transformer (ViT)。”