(来源:MIT News)

从 DNA 转录、细胞分裂调控,到复杂生物体的高级功能,几乎所有生物功能都依赖于不同蛋白质之间的相互作用。

然而在分子层面,这些功能是如何协调运作的,以及蛋白质之间(无论是与其他蛋白质还是自身拷贝)的相互作用机制仍然存在诸多未知。

最新研究发现,即使是很小的蛋白质片段也蕴含巨大的功能潜力。尽管它们只是不完整的片段,但短链氨基酸仍可以与靶蛋白结合,模拟天然的相互作用过程。

通过这一过程,蛋白质片段可以改变靶蛋白的功能,或者干扰它与其他蛋白质的相互作用。因此,蛋白质片段不仅有助于深入研究蛋白质相互作用和细胞过程,还在治疗领域具有潜在应用价值。

近期,麻省理工学院生物学系的科学家开发出一种新方法,基于现有的 AI 模型,通过计算预测能与大肠杆菌中全长蛋白质结合并抑制其功能的蛋白质片段。他们认为,理论上利用这个工具有望开发出针对任何蛋白质的遗传编码抑制剂。

目前,这篇研究论文已经发表在PNAS上。该研究工作由麻省理工学院生物学副教授、霍华德·休斯医学研究所研究员 Gene-Wei Li 与生物工程教授兼系主任 Amy Keating 共同主导完成。



借助 AlphaFold 开发而来

近年来,AlphaFold 在生物学领域取得了不少突破,其能够精准预测蛋白质折叠以及蛋白质相互作用。此次,研究团队开发的名为“FragFold”的计算方法也是基于 AlphaFold。

在这项新研究中,他们利用 AlphaFold 来预测蛋白质片段抑制剂,而这属于其全新的一个应用方向。研究人员通过实验验证,即便在缺乏相互作用机制结构数据的情况下,FragFold 对结合或抑制作用的预测准确率仍然超过 50%。

“我们的研究结果表明,这是一种通用型的方法,能找到可能抑制蛋白质功能的结合模式,包括针对全新的蛋白质靶点,这些预测结果可作为进一步实验的起点。我们甚至能将其应用于功能未知、相互作用未知,甚至结构未知的蛋白质上。”该论文共同第一作者兼通讯作者 Andrew Savinov 表示。

以 FtsZ 蛋白为例,它对细胞分裂过程中发挥重要作用,虽然它早已被广泛研究,但其包含一段天然无序区域,使得针对它的研究特别具有挑战性。

毕竟,无序蛋白质结构动态变化,其功能性相互作用往往非常短暂,以至于现有的结构生物学工具难以捕捉到单一的结构或相互作用。

在这项研究中,他们利用 FragFold 探索 FtsZ 片段(包括那些来自天然无序区域的片段)的活性,识别出了与多种与其他蛋白质的新结合相互作用。

这一成果不仅证实并拓展了此前对 FtsZ 生物活性的实验测量,更重要的是,它在未解析无序区域结构的情况下完成的,展现了 FragFold 的潜力。

“这是 AlphaFold 从根本上改变我们研究分子和细胞生物学方式的一个典型案例。像 FragFold 这样对 AI 方法的创造性应用,为我们开拓了意想不到的功能和全新的研究方向。”Amy Keating 评价道。



抑制作用及其他应用

研究人员通过这种计算方法将每个蛋白质分割成片段,然后模拟这些片段与相关交互对象的结合情况,从而实现了这些预测。

他们将整个序列的预测结合图谱与活细胞中这些片段的影响进行对比(后者通过高通量实验测量确定,该实验中数百万个细胞各自产生一种类型的蛋白质片段)。

AlphaFold 通常利用共进化信息来预测折叠,并在每次预测时借助多重序列比对(MSA)评估蛋白质的进化。尽管 MSA 非常关键,但却是大规模预测的瓶颈,因其需要耗费大量时间和计算资源。

对于 FragFold,研究人员改为预先计算一次全长蛋白质的 MSA,并使用该结果指导对该全长蛋白质每个片段的预测。

除 FtsZ 外,研究人员还预测了多种蛋白质的抑制片段。他们研究的相互作用包括脂多糖转运蛋白 LptF 和 LptG 之间的复合物。

实验发现,LptG 的蛋白质片段能够抑制这一相互作用,可能会干扰脂多糖的递送,而脂多糖是大肠杆菌外细胞膜的关键成分,对细胞健康起着至关重要的作用。

“令人惊喜的是,我们的预测准确率如此之高,甚至还能预测出与抑制相对应的结合情况。针对我们研究的每一种蛋白质都成功找到了抑制剂。” Andrew Savinov 表示。

起初,他们聚焦于蛋白质片段的抑制功能,因为检测片段能否阻断细胞基本功能,是一种相对简单的系统测量方式。

接下来,团队计划进一步探索抑制功能之外的蛋白质片段作用,例如稳定结合蛋白质、增强或改变其功能,以及触发蛋白质降解等。



设计原理

这项研究为系统理解细胞设计原则打下了基础,同时也有助于探索深度学习模型可利用哪些元素做出准确预测。

“我们正朝着更广泛、更长远的目标迈进。”Andrew Savinov 说道,“既然能够进行预测,那么我们能否从预测和实验数据中提取关键特征,进而弄清楚 AlphaFold 对于有效抑制剂的判断依据呢?”

于是,他们深入探索了蛋白质片段的结合方式、其他蛋白质相互作用,并通过改变特定残基来观察这些变化如何影响片段与靶点相互作用。

通过对细胞内数千个突变片段的行为进行实验检查(这种方法名为“深度突变扫描”),研究人员发现了负责抑制的关键氨基酸。在某些情况下,突变后的片段甚至比天然全长序列的抑制效果更好。

“与以往的方法不同,我们不再局限于从实验结构数据中识别片段。”Sebastian Swanson 指出,“这项研究的核心优势在于,高通量实验抑制数据与预测结构模型相互配合,实验数据帮助我们筛选出特别有研究价值的片段,而 FragFold 预测的结构模型则为片段在分子层面的功能提供了具体且可验证的假设。”

展望未来,研究团队对 FragFold 的广泛应用充满期待。“通过创建紧凑的、可遗传编码的结合物,FragFold 为调控蛋白质功能提供了广阔空间。我们可以设想,利用功能化片段修饰天然蛋白质,改变其亚细胞定位,甚至重新编程,从而开发出用于研究细胞生物学和治疗疾病的新工具。” Gene-Wei Li 总结道。

https://news.mit.edu/2025/ai-system-fragfold-predicts-protein-fragments-0220

ad1 webp
ad2 webp
ad1 webp
ad2 webp