BertsWin:通过拓扑保持加速3D医学图像分析

Paper#Medical Imaging, Deep Learning, Transformers🔬 Research|分析: 2026年1月4日 00:08
发布: 2025年12月25日 19:32
1分で読める
ArXiv

分析

本文解决了将自监督学习(SSL)和视觉Transformer(ViTs)应用于3D医学影像的挑战,特别是针对掩码自编码器(MAEs)在捕捉3D空间关系方面的局限性。作者提出了BertsWin,这是一种结合了BERT风格的token掩码和Swin Transformer窗口的混合架构,以改善空间上下文学习。关键创新在于维护一个完整的3D token网格,保留空间拓扑,并使用结构优先级损失函数。本文展示了与标准ViT-MAE基线相比,收敛速度和训练效率的显著提高,且没有产生计算开销。这是对3D医学影像分析领域的重要贡献。
引用 / 来源
查看原文
"BertsWin achieves a 5.8x acceleration in semantic convergence and a 15-fold reduction in training epochs compared to standard ViT-MAE baselines."
A
ArXiv2025年12月25日 19:32
* 根据版权法第32条进行合法引用。