学部新闻
学部新闻
当前位置:首页  学部新闻
Medical Image Analysis | 计算学部骆功宁教授团队在医学图像处理方面取得最新进展
发布人:王语涵  发布时间:2025-05-13   浏览次数:10

随着医学影像AI技术的快速发展,如何既能保证MRI中组织分布的高保真度,又能高精度的校正图像强度不均匀伪影,已成为医学图像处理的关键挑战。当前主流GAN模型虽在MRI偏置场校正中取得进展,却面临训练稳定性差、依赖多类型标注数据等根本性缺陷。扩散模型在多任务中都表现出更强的性能并具备理论优势,但其在3D医学影像应用中存在显存需求激增、采样效率低下、校正过程不可解释等三重技术鸿沟,严重制约临床转化应用。

近日,计算学部骆功宁教授团队提出了一种创新性的扩散模型——MeMGB-Diff(内存高效的多元高斯偏置扩散模型),旨在解决3D MRI 偏置场校正任务中传统扩散模型的显存爆炸、采样效率低下与校正过程黑箱化三大关键难题。通过该方法,不仅可以实现10倍以上的采样效率跃升,还能确保在保持高校正精度的同时将显存需求压缩60倍以上,进而推动临床落地,为智能诊疗系统构建高效可靠的三维MRI校正新范式。

研究动机

核磁共振图像(MRI)中的偏置场会引发强度不均匀性,严重影响医学影像的可视化。偏置场是由患者解剖结构或磁场不均匀性导致的平滑乘性场干扰,不仅降低图像质量,还会影响 MRI 分析的关键步骤,例如可视化和分割,进而严重影响后续诊断和预后。本研究基于偏置场的两大特征(平滑性、强度趋势是导致强度不均匀的主要原因)提出了解决方案。

当前校正方法存在诸多局限性。传统算法(如N4)受限于固定计算流程导致精度不足,而基于生成对抗网络(GAN)的深度学习方法面临训练不稳定、依赖多类型临床标注数据等瓶颈。例如现有最优模型ABCNet采用对抗训练,其需要同时依赖偏置场标签与各类组织分割图,且存在校正精度与平滑度难以平衡的理论冲突,严重制约临床适用性。

扩散模型在图像去噪领域展现优势,偏置场可以视为MRI中的平滑噪声,但直接应用于三维偏置场校正时面临三重挑战:传统框架强制使用无关的高斯噪声导致校正效率低下,三维数据显存需求急剧增长,以及隐式去噪过程缺乏可解释性。这些局限性使得现有扩散模型难以直接适配3D偏置场校正任务,亟需理论突破与方法创新。若能用3D偏置场取代经典扩散模型中的高斯噪声可以避免这些局限。然而,在实施过程中也存在挑战:如何减少内存的同时保持显式的过程?如何使扩散模型直接扩散3D偏置场?对此,我们提出了MeMGB-Diff解决了上述问题。

方法概述

针对上述问题,骆功宁团队提出MeMGB-Diff。具体而言,(1)MeMGB-Diff提出了基于多元高斯的扩散框架,并将3D偏置场建模为多元高斯分布,因此直接扩散和去除3D偏置场,具有更高的采样效率和并保证了显式的校正过程;(2)基于偏置场光滑特性,MeMGB-Diff提出了预-后处理步骤将MRI变换到尺寸更小的图像域上进行偏置场校正以降低计算内存占用,同时保持校正过程显式;(3)提出了偏置趋势损失函数让神经网络直接学习影响MRI强度非均匀性的主要因素——强度趋势,从而提高校正精度。

总结,主要贡献和创新点如下:

1、 内存高效的多元高斯偏置场扩散模型(MeMGB-Diff)是首个在理论层面通过多元高斯变量建模,直接扩散和消除3D偏置场的扩散模型,显著提升了采样效率与校正精度。

2、 我们的MeMGB-Diff基于偏置场的平滑特性,以可忽略的精度损失为代价,降低计算内存60倍以上。具体通过将校正模型置于更小图像域以节省内存,同时仍保持当前最优性能。

3、 MeMGB-Diff将3D偏置场建模为多元高斯变量,并在训练过程中随机生成偏置场标签,构建了无需临床标签的自监督学习范式,且达到当前最优性能水平。

4、 首次提出偏置趋势损失函数,针对偏置场强度趋势进行建模,这是导致MRI强度非均匀性主要原因,从而有效提升校正性能。

5、 提出了新型的偏置场合成方法,通过生成更具随机性与剧烈变化的偏置场构建更富多样性的合成数据集,实现对校正方法更全面深入的测试验证。

实验与评估:

为全面验证MeMGB-Diff的校正效能,研究团队在跨模态(T1/T2加权)、跨器官(脑部/腹部)多个医疗MRI数据集上进行了广泛的实验,涵盖BrainWeb、HCP、CHAOS等合成与临床MRI数据集。实验结果表明,该模型在SSIM,PSNR,COCO以及不同组织的CV关键指标上均达业界最优,最优的SSIM,PSNR和COCO证明了该方法具有高保真度,各人体组织的CV值最低证明了该方法的校正性能最优。值得关注的是,通过在小尺寸图像域进行校正,MeMGB-Diff降低了64倍的显存占用,同时保持高精度;更在与典型基于扩散的图像恢复方法Refusion的对比中展现出显著优势——仅需5步采样即可超越后者50步迭代效果,实现10倍以上的效率提升。

总结与展望

通过构建多元高斯扩散框架,MeMGB-Diff在无需临床标注的条件下,实现了三维医学影像偏置场校正的高保真度,强度均匀,与低资源门槛的三重目标。该研究为MRI处理与分析提供了更加高效,安全和可信的路径。未来,研究团队计划将模型应用至高精度的疾病自动诊断中,通过提高数据的规范性,进一步提升自动诊断的性能,为精准医疗的全球化落地提供底层技术支撑。

哈工大计算学部为论文第一作者和第一通讯作者单位。计算学部骆功宁教授为论文通讯作者。骆功宁教授团队近年来致力于多模态医学图像分析与人工智能技术,相关工作发表于Nature Communications、Medical Image Analysis、IEEE Transactions on Medical Imaging、IEEE Transactions on Biomedical Engineering、IEEE Journal of Biomedical and Health Informatics、MICCAI、CVPR、AAAI等国际顶级期刊和会议。

该研究工作得到了国家自然科学基金的支持。

论文链接:https://www.sciencedirect.com/science/article/pii/S1361841525001070

代码链接:https://github.com/PerceptionComputingLab/MeMGB-Diff