分析
一款名为Clarity-OMR的新型光学乐谱识别 (OMR) 模型已经问世,可将乐谱 PDF 转换为 MusicXML 文件。该模型使用 DaViT-Base 编码器和定制 Transformer 解码器,展现出令人印象深刻的性能,尤其是在更干净、更具节奏感的乐谱上。开发者正在积极寻求反馈并致力于进一步改进,展示了 AI 社区的协作精神。
关键要点
引用 / 来源
查看原文"我使用 mir_eval 在 10 首古典钢琴曲上与 Audiveris 进行了基准测试。 总体而言,它具有相当的竞争力(平均质量得分 42.8 vs 44.0),在更干净/更具节奏感的乐谱上明显胜出(巴托克 69.5 vs 25.9,艺人 66.2 vs 33.9)。"