撰文丨王聪
编辑 | 王多鱼
排版 | 水成文
RNA 引导系统,是指蛋白质通过与向导 RNA(guide RNA)结合,从而靶向特定的核酸序列,在自然界中,RNA 引导系统允许单个酶根据所装载的不同向导 RNA 靶向不同序列,例如,CRISPR-Cas9 可根据设计的向导 RNA 精确靶向并编辑特定不同的 DNA 序列。
在过去十多年里,来自细菌和古菌的 CRISPR-Cas 系统在基因组和表观基因组编辑以及 RNA 编辑、基因调控和病原体检测方面的应用,彻底改变了基础生物科学、分子医学和生物技术。
除了各种 CRISPR-Cas 系统之外,张锋团队等最近发现了一些具有基因编辑潜力的 RNA 引导系统,例如,OMEGA 系统、Fanzor 系统,以及CRISPR 相关转座酶。然而,这些 RNA 引导系统的发现都是基于它们与 CRISPR-Cas 系统在进化上的关系。要想直接扩展 RNA 引导系统的多样性,还需要更多通用的数据库挖掘方法。
2025年2月27日,张锋团队在国际顶尖学术期刊Science上发表了题为:TIGR-Tas: A family of modular RNA-guided DNA-targeting systems in prokaryotes and their viruses 的研究论文。
该研究从 Cas9 蛋白的向导 RNA 相互作用结构域出发,通过迭代结构和序列同源性挖掘,在噬菌体及寄生细菌中发现了一类古老的 RNA 引导的 DNA 靶向蛋白家族,并将其命名为TIGR-Tas 系统, 其利用 tigRNA 将 Tas 蛋白引导到特定 DNA 位点, 该系统可被重编程以靶向基因组上的任何 DNA 序列(无需依赖 PAM 序列)并直接修饰目标 DNA。更重要的是,与其他 RNA 引导系统(例如 CRISPR 系统)相比,TIGR-Tas 系统结构非常紧凑(Tas 蛋白平均仅为 Cas9 蛋白大小的四分之一),在用于基因编辑疗法时更具优势。
张锋教授表示,TIGR-Tas 系统是一个非常多功能的 RNA 引导系统,具有许多不同的功能。该研究发现的TIGR 相关蛋白(Tas)有一种 RNA 结合成分,与 RNA 向导相互作用,将其引导到基因组中的特定位置,有些则是利用蛋白质中相邻的 DNA 切割片段在特定位置切断 DNA。这种模块化的特点可以促进基因编辑工具的开发,允许研究人员将有用的新功能转换到天然的 Tas 蛋白中。
作为 CRISPR 基因编辑技术先驱,早在 2013 年 1 月,张锋率先将来自细菌的 CRISPR 系统改造成了基因编辑工具——CRISPR-Cas9,并首次实现了对哺乳动物细胞的 CRISPR 基因编辑,这一成果改变了现代生物学,开启了基因编辑新时代。此后,张锋和他的团队陆续发现和改造了多种基因编辑系统。
张锋教授表示, 大自然非常不可思议,它具有巨大的多样性,我们一直在探索大自然的多样性,以找到新的生物学机制,并利用它们进行不同的应用,以操纵生物学过程。
在这项最新研究中,为发现新型可编程的基因编辑系统,张锋团队首先聚焦于 CRISPR 系统中 Cas9 蛋白中与向导 RNA(guide RNA)结合的结构特征。Cas9 蛋白的这种 RNA 引导特性使其成为一个强大的基因编辑工具,因为 RNA 与 DNA 或与其他 RNA 之间通过非常明确的碱基互补配对机制进行结合,这一特性使其更容易被重编程。
张锋团队对数亿种已知结构或有预测结构的生物蛋白质进行系统性筛选,寻找具有与 Cas9 蛋白类似的 RNA 结合结构域的候选蛋白。为进一步挖掘远缘相关蛋白,他们采用迭代研究策略:
从 Cas9 出发,鉴定出一种名为 IS110 的 RNA 结合蛋白;
聚焦 IS110 的 RNA 结合结构域,解析其三维构象特征;
基于新发现的结构特征,重新优化筛选标准并扩大搜索范围。
基于上述策略,张锋团队筛选并发现了大量的 Cas9 远缘蛋白,以至于很难使用依赖于保守序列的标准系统发育方法对这些高度多样化的蛋白进行分析。他们转而使用人工智能 (AI) 来理解这些发现的蛋白。
通过蛋白质大语言模型(Protein Large Language Model) ,研究团队能够根据蛋白质可能的进化关系将他们发现的蛋白质聚类分组。值得注意的是,其中一组与其他组显著不同——其编码基因具有规律间隔重复序列,让人想起了CRISPR 系统,而 CRISPR 的全称是——规律间隔成簇短回文重复序列。
张锋团队将这一新发现命名为TIGR-Tas 系统,其由 TIGR 阵列和 Tas 蛋白组成,他们发现了超过 20000 种不同的 Tas 蛋白,其中大多存在于噬菌体、古菌病毒和寄生细菌中。TIGR 阵列被加工为 36nt 的向导 RNA——tigRNA,每个 tigRNA 包含两个短间隔区(spacer A 和 B),分别靶向 DNA 的两条链,这使得其靶向更加灵活,且避免了自我攻击,无需依赖 PAM 序列。
TIGR-TasR 的 RNA 引导的 DNA 切割作用的结构基础
接下来,张锋团队对数十种 Tas 蛋白进行了实验,证明了其中一些可以通过重编程对人类细胞中的 DNA 进行精确的靶向切割,例如,TaTasR 和 ParTasR 可在人类细胞中的多个基因位点诱导基因编辑,最高编辑效率可达 3.6%。
CRISPR-Cas 系统只能靶向被称为 PAM 序列的短基序两侧的 DNA 片段。而 TIGR-Tas 系统则没有这种需求,这意味着,理论上 TIGR-Tas 系统可以靶向基因组中的任何一个位点。此外,Tas 蛋白结构紧凑,平均只有 Cas9 的四分之一大小,因此更容易进行递送,有望克服基因编辑疗法临床应用中的递送难题。
总的来说,该研究发现的 TIGR-Tas 系统填补了 RNA 引导机制进化中的空白,其不依赖 PAM 序列、双链靶向特性以及小型化的特点,为基因编辑提供了新方向,尽管编辑效率还需要优化,但这一新系统有望成为 CRISPR-Cas 系统之外的基因编辑工具箱的重要补充。
张锋团队目前正在探索 TIGR-Tas 系统在病毒中的天然功能以及如何将该系统用于研究和疾病治疗。他们已经确定了一种能够在人类细胞中发挥基因编辑作用的 Tas 蛋白的分子结构,并对其进行改造升级。此外,他们还注意到 TIGR-Tas 系统和人类细胞中某些 RNA 处理蛋白之间存在联系。
论文链接:
https://www.science.org/doi/10.1126/science.adv9789