BertsWin:通过拓扑保持加速3D医学图像分析
Paper#Medical Imaging, Deep Learning, Transformers🔬 Research|分析: 2026年1月4日 00:08•
发布: 2025年12月25日 19:32
•1分で読める
•ArXiv分析
本文解决了将自监督学习(SSL)和视觉Transformer(ViTs)应用于3D医学影像的挑战,特别是针对掩码自编码器(MAEs)在捕捉3D空间关系方面的局限性。作者提出了BertsWin,这是一种结合了BERT风格的token掩码和Swin Transformer窗口的混合架构,以改善空间上下文学习。关键创新在于维护一个完整的3D token网格,保留空间拓扑,并使用结构优先级损失函数。本文展示了与标准ViT-MAE基线相比,收敛速度和训练效率的显著提高,且没有产生计算开销。这是对3D医学影像分析领域的重要贡献。