プロトタイプガイダンスによるマルチラベル植物種識別におけるゼロショットセグメンテーション
分析
この論文では、ゼロショットセグメンテーションを用いたマルチラベル植物種識別のための新しいアプローチを紹介しています。この手法は、トレーニングデータセットから得られたクラスプロトタイプを利用して、テスト画像上でセグメンテーションVision Transformer(ViT)を誘導します。K-Meansクラスタリングを用いてプロトタイプを作成し、個々の種分類で事前トレーニングされたカスタマイズされたViTアーキテクチャを採用することで、モデルはマルチクラスからマルチラベル分類に効果的に適応します。このアプローチは有望な結果を示し、PlantCLEF 2025チャレンジで5位を獲得しました。トップの提出物と比較してパフォーマンスのギャップが小さいことは、さらなる改善の可能性を示唆しており、複雑な画像分析タスクに対処する上でのプロトタイプガイド付きセグメンテーションの有効性を強調しています。DinoV2を事前トレーニングに使用することも、方法論の注目すべき側面です。
重要ポイント
参照
“私たちのソリューションは、トレーニングデータセットから取得したクラスプロトタイプを、テストセット画像上でセグメンテーションVision Transformer(ViT)をトレーニングするためのプロキシガイダンスとして使用することに焦点を当てました。”