借助人工智能(AI),研究人员现在可以从氨基酸序列直接预测蛋白质的三维结构。但哥伦比亚大学生物物理学家Hashim Al-Hashimi表示,生物学家真正想要预测的是RNA和DNA编码分子在其天然细胞环境中的行为。
“有时人们忘记了解析结构的目的是理解功能,”Roy and Diana Vagelos生物化学与分子生物物理学教授Al-Hashimi说。“我们真正想要预测的是活性——一个分子在细胞内执行其生物学任务的效率。今天的AI模型无法做到这一点。”
来自Al-Hashimi实验室的新研究,发表在《Cell》上,现在表明,至少对于一类分子——细胞内调节基因活性的小RNA群体,可以从生物物理原理出发进行这样的预测。
预测RNA活性的能力可能开启新类型的药物,解决当前围绕遗传疾病的谜团,并改进细胞的计算机建模。
预测依赖于集合(ensembles)
新研究发现,预测RNA活性的一个关键步骤是理解序列如何改变一个RNA可以采纳的结构集合,即一系列结构。
大多数RNA分子以高度柔性著称:“它们无法保持静止。每个RNA可以呈现不同的形状,在一段时间内采样多种结构,”Al-Hashimi说。
其中一些结构比其他结构更稳定,并在这个结构集合中占主导。另一些则是昙花一现——仅持续皮秒——但可能是生物学活性最高的。因此,从序列预测RNA的细胞活性必须将RNA的整体考虑在内。
来自生物物理的准确性,而非AI
为了开发一个预测模型,Al-Hashimi实验室首先通过实验确定了HIV RNA——TAR的结构集合,以及TAR在其27个核苷酸中大多数位置上带有单点突变的结构集合。他们还测量了这27种不同TAR的活性。(TAR结合一种HIV蛋白以在被感染细胞内启动病毒复制。)
团队发现,RNA的活性可以使用通常用于预测RNA二级结构的现有生物物理模型从其序列中预测出来。利用这些方法,团队直接从序列计算了数千种不同TAR序列的生物学活性。总之,他们的结果通过“结构集合保守性(ensemble conservation)”这一新概念揭示了为什么TAR的几个残基是高度保守的。
“TAR中的大多数突变被拒绝,因为它们通过改变其结构集合——而非其与其他分子的接触——而剧烈改变了其活性,”Al-Hashimi说。“这向我们表明,分子也必须进化其序列,以确保它们在不同构象状态之间拥有正确的平衡。”
Al-Hashimi说,同样的预测模型也适用于另一种称为RRE的HIV RNA,并且应该适用于来自任何生物体的类似RNA。团队的下一个目标是优化这些模型以用于更大、更复杂的RNA,并使它们在预测细胞内活性时更加准确。
新药物与新理解
许多疾病由像TAR这样能呈现不同构象的RNA调控。“有很多遗传疾病的例子与非编码RNA(如TAR)中的单核苷酸多态性相关,”Al-Hashimi说。“现在,有了预测某些突变如何改变结构集合而其他突变不会的能力,我们可以开始建立这些遗传疾病背后机制的模型。”
这些模型也可能加速新类型药物的开发,这些药物通过改变RNA结构集合来改变细胞内的活性,或干扰结构集合中最活跃的成员。
“目前药物开发主要基于锁钥机制,”Hashimi说。“如果我们考虑结构集合,我们就有真正的机会扩展我们的能力,并可能创造出更强大的药物,”Al-Hashimi说。(生物谷Bioon.com)
参考文献:
Ainan Geng et al, Thermodynamic Prediction of RNA Cellular Activity from Sequence via Conformational Ensembles, Cell (2026). DOI: 10.1016/j.cell.2026.02.021.