基础模型已经成为解决临床环境中各种任务的强大工具。然而,他们的乳房超声分析的潜在发展仍未开发。
2026年4月7日,北京大学王立威、贺笛、WangDong、HuoLing、中国医学科学院WangYong、北京协和医院朱庆莉、斯坦福大学James Zou、南昌市人民医院TangBinghui共同通讯在Nature Biomedical Engineering在线发表题为A foundation generative model for breast ultrasound image analysis的研究论文。
该研究报道了BUSGen(乳腺超声生成模型),这是第一个为乳腺超声图像分析设计的基础生成模型,它显著改善了与乳腺癌筛查、诊断和预后相关的一系列基本任务。
乳腺癌是最常见的癌症之一,仍然是全球女性的主要健康威胁。超声是降低乳腺癌相关死亡率的一种重要成像方式,由于其非侵入性、方便性和比乳房X线照相术更高的灵敏度而被广泛采用,特别是在乳房致密或年龄更小的患者中。
然而,由于生物结构的复杂性、病理语义的微妙性以及临床场景之间的可变性,乳腺超声图像的准确解读具有挑战性且耗时。即使是经验丰富的临床医生也可能在解读图像时出错,这可能会延迟早期诊断,阻碍对肿瘤进展的及时干预,并影响治疗计划。
最近深度学习的突破在医学领域取得了成功,例如基于大规模高质量数据集的胸部X光图像、病理图像和视网膜图像的分析。然而,乳房超声分析仍然探索不足。因此,用于乳腺超声分析的深度学习模型面临着诸如过度拟合、缺乏泛化能力、罕见条件的学习效率低下25以及缺乏数据透明度等挑战。
与此同时,深度学习正在经历从特定任务模式到基础模式的范式转变,这种模式利用来自广泛而多样的预训练数据的知识转移来支持广泛的下游任务。因此,基础生成模型对于实现精确的乳房超声分析是必不可少的。
BUSGen预训练和适应框架的示意图(图源自Nature Biomedical Engineering)
在这里,研究人员介绍了BUSGen,这是第一个为乳腺超声图像分析设计的基础生成模型。通过对超过350万幅乳腺超声图像的预训练,BUSGen获得了关于乳腺结构、病理特征和临床变异的广泛知识。通过少量调整,BUSGen可以生成现实且信息丰富的特定于任务的数据的存储库,有助于为广泛的下游任务开发模型。
大量的实验凸显了BUSGen非凡的适应性,在乳腺癌筛查、诊断和预后方面明显超过了真实数据训练的基础模型。在乳腺癌早期诊断中,该方法优于所有委员会认证的放射科医生(n = 9),实现了16.5%的平均灵敏度改善(P < 0.0001)。此外BUSGen实现了去身份数据共享,在安全医疗数据利用方面取得了进步。
参考消息:https://www.nature.com/articles/s41551-026-01639-1