SwinTF3D:基于文本引导的3D医学图像分割

发布:2025年12月28日 11:00
1分で読める
ArXiv

分析

本文介绍了SwinTF3D,这是一种利用视觉和文本信息的3D医学图像分割的新方法。关键创新是将基于Transformer的视觉编码器与文本编码器融合,使模型能够理解自然语言提示并执行文本引导的分割。这解决了现有模型仅依赖视觉数据且缺乏语义理解的局限性,使其能够适应新的领域和临床任务。轻量级设计和效率提升也值得关注。

引用

SwinTF3D 在多个器官上实现了具有竞争力的 Dice 和 IoU 分数,尽管其架构紧凑。