AIマエストロ:楽譜を驚異的な精度で変換する新モデル
分析
新しい光学楽譜認識(OMR)モデル、Clarity-OMRが発表され、楽譜PDFをMusicXMLファイルに変換します。このモデルは、DaViT-BaseエンコーダーとカスタムTransformerデコーダーを利用しており、特にクリーンでリズミカルな楽譜で印象的なパフォーマンスを示しています。開発者は積極的にフィードバックを求めており、さらなる改善を目指しており、AIコミュニティの協力的な精神を示しています。
重要ポイント
引用・出典
原文を見る"mir_evalを使用して10個のクラシックピアノ曲でAudiverisとのベンチマークを行いました。全体的にほぼ互角(平均品質スコア42.8対44.0)で、よりクリーンでリズミカルな楽譜では明らかに優位性を示しました(バルトークで69.5対25.9、エンターテイナーで66.2対33.9)。"