Nature Methods:西湖大学申怀宗/原发杰开发冷冻电镜AI基础模型,“一键式”洞见生命分子结构


Nature Methods:西湖大学申怀宗/原发杰开发冷冻电镜AI基础模型,“一键式”洞见生命分子结构

来源:生物世界 2025-11-30 14:07

该研究开发了用于冷冻电镜图像处理的 AI 基础模型——Cryo-IEF,并基于此构建了完全自动化的端到端“一键式”数据处理流程——CryoWizard。

在生命的微观世界中,清晰 看见 驱动生命运转的分子机器 蛋白质、核酸及其他生物大分子,是理解其功能、揭示疾病机制和开发创新药物的关键。近年来,冷冻电子显微镜技术(cryo-EM)掀起了一场 分辨率革命 ,使得科学家可以在原子尺度上捕捉生命机器的瞬时三维图像,极大程度加速了生物学各领域的分子机理研究。然而,这一强大技术长期面临一个严重瓶颈:数据处理流程复杂、耗时且高度依赖专家经验。

2025 年 11 月 27 日,西湖大学申怀宗、原发杰团队合作(颜阳、范诗奇为论文共同第一作者),在 Nature Methods 期刊发表了题为:A comprehensive foundation model for cryo-EM image processing 的研究论文。

该研究开发了用于冷冻电镜图像处理的 AI 基础模型 Cryo-IEF(Cryo-EM Image Evaluation Foundation model),并基于此构建了完全自动化的端到端 一键式 数据处理流程 CryoWizard。该成果有望将冷冻电镜数据处理从依赖丰富经验的 技术活 ,转变为简单、易用、低门槛和更加普及的生命学科通用方法,从而把这一尖端工具带给更广泛的科研群体。

冷冻电镜的机遇与挑战:数据处理之困

单颗粒冷冻电镜技术通过将生物大分子速冻于极薄冰层中,再利用透射电子显微镜得到从不同角度拍摄的数百万张分子二维投影图像,最终通过复杂计算重构其三维密度图和原子结构模型。相较于传统 X 射线晶体学,该技术无需结晶步骤且所需样品少,极大拓展了可供进行结构生物学研究的生物大分子范围,现已成为结构生物学领域最主要的研究方法。

然而,冷冻电镜原始数据是海量且信噪比极低的显微图像,将其转化为清晰三维结构需经历多步骤、迭代式处理流程。传统流程不仅费时费力,且高度依赖专家经验。此外,样品异质性和颗粒优势取向等难题进一步增加了结构解析的复杂度。

Cryo-IEF:让 AI 理解 冷冻电镜图像

面对上述挑战,以往 AI 方案多聚焦于开发针对冷冻电镜数据处理特定步骤的 工具 ,如自动挑选蛋白质颗粒或进行图像二维分类筛选,但完整的数据处理流程仍需大量人工干预,未能实现完全自动化。西湖大学团队则致力于构建一个单一而强大的 AI 基础模型,使其能够准确理解冷冻电镜颗粒图像的 通用语言 。基于这一理念,Cryo-IEF 应运而生。

Cryo-IEF 采用 无监督对比学习 方法进行预训练,使模型能从极低信噪比的冷冻电镜图像中提取本质特征。研究团队从合作者及 EMPIAR 等公共数据库收集并整理了来自一百多种生物大分子的约 6500 万张颗粒图像,构建了超大规模数据集用于模型训练。通过大规模无监督学习,Cryo-IEF 在未经针对性微调的情况下,自发展现出对颗粒图像结构差异、朝向角区别和图像质量高低等的初步判别能力,显示出对图像内在规律的通用理解力。

图片

图1. 基于对比学习的Cryo-IEF训练框架

CryoWizard:完全自动化的端到端冷冻电镜数据处理流程

研究团队进一步对大量冷冻电镜颗粒图像质量进行数据标注,并利用该标注对 Cryo-IEF 进行微调,开发出可自动评估单个颗粒图像质量的 CryoRanker 微调模型,并将其用于替代传统数据流程中繁琐耗时的多步骤、迭代式聚类与人工筛选环节。在 CryoRanker 基础上,团队整合多个现有数据预处理与三维重构工具,构建出从原始图像至高分辨率三维结构的全自动冷冻电镜结构解析流程 CryoWizard。

利用该流程,普通用户只需输入少量电镜数据收集参数,即可实现端到端的冷冻电镜结构自动化解析,而无需任何手动干预。这一工具的发明将帮助科学家从过程繁琐而门槛高的数据处理中解放出来,从而可以更加专注于分析与理解更深层次的生物大分子工作机理和致病机制等。

图片

图2. CryoWizard流程展示(a)及其自动化解析得到的生物大分子三维结构(b-g)

涟漪效应:加速生命科学领域的探索

Cryo-IEF 与 CryoWizard 的推出,有助于降低先进的冷冻电镜技术门槛,赋能更多科研团队 包括规模较小或非结构生物学主攻方向的实验室 探索其研究领域中的核心分子机理问题。该成果也生动体现了人工智能与实验科学之间的相互促进关系:海量的实验数据训练出强大 AI 模型,而 AI 模型又反过来提升实验科学的效率与质量,形成良性循环。Cryo-IEF 和 CryoWizard 有望成为这一加速发现循环中的重要催化剂。

成果亮点:

1. 首个针对冷冻电镜颗粒的 AI 基础模型:突破 单任务工具 思路,基于 6500 万张图像训练出冷冻电镜领域首个 AI 基础模型 Cryo-IEF,通过无监督学习获得对颗粒图像内在规律的通用理解,为实现全流程自动化奠定基础。

2. 自动化、端到端数据处理流程:基于 Cryo-IEF 开发的 CryoWizard 工具,实现从冷冻电镜原始图像到高分辨率三维结构的全自动解析,全程无需人工干预。

3. 推动 分辨率革命 普及化:显著降低冷冻电镜计算过程对专业知识的依赖,使高分辨率结构解析技术更易于被广大科研群体使用,加速医学、药学及基础生命科学领域的创新发现。

版权声明 本网站所有注明“来源:100医药网”或“来源:bioon”的文字、图片和音视频资料,版权均属于100医药网网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:100医药网”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用100医药网APP 随时阅读、评论、分享交流 请扫描二维码下载->


首页
企业
药品
代理
医院