- A+
Cas9与Cas12蛋白的尺寸过大,因此应用于基因治疗较为困难。最近的工作进一步表明,微型Cas12f同源物(400-700 aa),包括Un1Cas12f1、SpCas12f1和AsCas12f1,在人类细胞中是有活性的,尽管即使在广泛优化之后,总体中值编辑频率也低于10%。通过增加进化深度,发现IscB和TnpB由相同的转座子家族编码-即插入序列200/605(IS 200/IS 605)-并且分别代表Cas9和Cas12的祖先分支。都可以以RNA引导的方式显著的编辑效率靶向人细胞中的内源基因座,其中TnpB构成了原核生物中最大的基因组,具有超过一百万个推定位点。TnpB代表了微型基因组编辑器的未充分探索的巨大来源。本文建立了一个在原核基因组中标记TnpB系统的框架,其中,ISAam 1(369个氨基酸(aa))和ISYmu 1(382个氨基酸)TnpB在人类细胞中的数十个基因组基因座中表现出稳健的编辑活性。两种RNA引导的基因组编辑器都显示出与SaCas9(1053 aa)相似的编辑效率,同时基本上更小。TnpB的巨大多样性具有发现额外有价值的基因组编辑器的潜力。
首先通过利用ISfinder的注释,生成了包括64个TnpB系统的数据集。为了检验TnpB是否像“剥离、粘贴和复制”模型所预测的那样起到归巢核酸内切酶的作用,我们首先定义了每个TnpB系统的reRNA(右端元件RNA)和TAM(转座子相关基序)。从每个IS元件的3'区域中使用大约200-nt的序列作为reRNA支架,其中3'末端正好位于RE的3'末端,随后是20-nt的引导序列(图A)。对ISDRA2的研究表明, TnpB应该是归巢的核内切酶。之后优化了大肠杆菌电穿孔条件,实现了一步递送含有固定靶点和随机化的碱基对(BP)序列(5'-NNNNN靶点)的质粒文库,以及表达TnpB的质粒(无密码子优化方法)和相应的reRNA。如果TnpB是功能性的,它耗尽了含有有效TAMs的质粒(图A)。在对所有64个候选质粒进行了该分析后,对其余质粒进行了测序,并使用统计模型确定了28个TnpB系统的TAMs(图B)。与ISDRA2类似,18个TnpB系统的TAMs在一定程度上退化,最优序列贡献了26-96%的概率空间(图C)。相比之下,其余10个TnpB系统显示出高度严格的TAMs,最优序列有助于100%的概率。与Cas12F31相似,这些TAMs往往富含T,其中13例中有8例(62%)的T至少占50%的碱基,11例(85%)的T是第一碱基。大多数情况TAM与CL相同,结果有力地支持了TNPB作为IS605扩增的归巢核酸内切酶的功能。考虑到CL和TAM的等价性,我们想知道如何从序列中直接预测TAM。对于多拷贝TnpB系统,我们通过多序列比对(图D)定义了CL的5'边界。结果表明,TAM与CL相匹配;TnpB作为归巢核酸内切酶;对于多拷贝TnpB系统,TAM通常是可预测的。在鉴定TAMs后测定了TnpB在大肠杆菌中的质粒切割活性。用含有TnpB和reRNA的质粒和氯霉素抗性基因共转化一个同时含有TAM前靶序列和卡那霉素抗性基因的质粒。通过在核酸酶结构域中引入一个突变来产生催化死亡的TnpB(DTnpB)作为阴性对照。大多数(25/28)的TNPB具有相当的质粒裂解活性,其中一半的TnpB的质粒耗尽率约为104(图E)。如预期的那样,只在表达功能性TnpB和reRNA的细胞中观察到质粒干扰,而所有DTnpB都未能耗尽目标质粒(图E),表明活性严格依赖于核酸酶结构域。高比例(25/64,40%)的TnpB系统在大肠杆菌中具有活性。
为了测试这25个TnpB系统中有多少在人体细胞中是活跃的,在HEK293T细胞(图A)中使用荧光报告试验筛选了它们。对于每个TnpB,实验确定的TAM和定义的目标插入到编码mRFP和eGFP的序列之间,导致eGFP的移码。在TnpB/reRNA表达质粒和相应的报告质粒共转染后,在靶向位点上产生的插入或缺失(INDELs)可以恢复eGFP信号(图A)。阳性对照ISDRA2 TnpB系统诱导了预期的eGFP表达(图B-C),在25个候选体中,有3个(ISTFU1、ISDGE10和ISABA30 TNPBs)显示出10%-34%的效率(图C)。接下来评估了这三个TnpB对五个随机选择的内源性位点的编辑活性, 虽然ISTFU1和ISABA30 TnpB仅显示出较低水平的编辑活性,以含有INDELs的测序读数的比例来量化(中位数:2-3%;图D,E),但ISDGE10 TnpB显示出相对较高的活性(中位数:20%)。我们进一步测试了ISDGE10 TnpB的另外10个位点,证实了相似的编辑效率(中位数:19%;图F)。对这些内源性靶位点的测序读数的分析进一步揭示了ISTFU1、ISDGE10和ISABA30 TnpB的三种共同模式。首先,在突变中,缺失占主导地位,而插入不太常见(图G,H)。其次,大多数Indel都很小,尺寸都小于20个BP。第三,Indels主要位于TAM远端,峰值在距TAM约15-18 BP(图G,H)。总之,我们确定了三个TnpB系统(ISTFU1、ISDGE10和ISABA30),它们在人体细胞中活跃,表现出不同的编辑效率,但相似的突变模式。
用上述图A的方法分析了reRNA的支架和引导两个片段,并分析了不同参数对reRNA功能的影响。首先,将Re的3'端作为reRNA支架的3'端,从上游大约100 nt到300 nt选择不同的5'端,分析支架长度对reRNA功能的影响。对于四种TnpB体系,我们发现低于100 nt的reRNA支架没有显示活性,活性最短的支架为120-140 nt(图A)。对于reRNA的引导片段,我们首先定量了含有不同长度(10~40 nt)的引导片段的reRNA的编辑活性,并确定了四种TnpB系统(图C)共有的两种模式:(1)引导长度在16~20 nt之间的reRNA具有较高的编辑效率;(2)超过20 nt时,编辑效率随长度的增加而降低, 在这些TNPB系统中,12-nt的功能导联和14-nt的功能导联对ISDGE10的活性最高,而对ISTFU1和ISABA30的功能导联最短,为16nt。这一结果再次表明了TnpB系统功能的多样性。上述特性定义了在TnpB系统中设计高效reRNA的关键参数。
之后开发了一个In Silico管道来注释和从原核基因组中选择潜在的活性TnpB系统。如图A所示,从8个含有活性TnpB的细菌科(图A)出发,从NCBI RefSeq数据库中检索到12671个基因组组合;通过要求存在三个Pfam结构域,鉴定出11531个TnpB位点,平均每个基因组约一个拷贝,其中3098个为IS605群--即邻近tnpa;通过对每个基因组中相似的TnpB蛋白进行聚类,鉴定出2263个IS605个簇,其中386个至少含有两个拷贝;进一步跨基因组聚类,排除ISFinder中注释的,保留57个多拷贝IS605个候选家系;通过不同拷贝的对齐和两端二级结构的检查为23个候选材料制作了TAM和reRNA支架;要求存在10个保守残基,并最终选择14个候选TnpB进行功能测试。通过开发一个从头发现框架,确定了高度活跃的ISAAM1和ISYMU1 TnpB系统。我们分别在两个人类细胞系(HEK293T和HCT116)和一个小鼠细胞系(N2A)的10个基因座和8个基因座上测量了基因组编辑效率。结果在三个细胞系(图C、D)中基本一致,其中ISAAM1和ISYMU1 TnpB与SaCas9一起表现出相对较高的活性,其次是NME2Cas9,而三个Cas12F变体仅表现出低水平的活性。 为了比较体内编辑活性,我们首先用分别包装七个系统的AAV2载体转导小鼠C2C12细胞。以ROSA26位点为靶点,ISAAM1 TNPB和Cas9系统显示出明显的活性(图E)。然后分别将编码五种不同编辑系统的单个AAV8载体导入小鼠,并分析靶器官肝脏中的编辑活性(图F)。这一体内结果大致概括了前面提到的离体数据,其中TNPB和saCas9系统显示出相对较高的活性(图G)。为了量化编辑特异性或脱靶水平,我们在小鼠N2A细胞中使用了一种基于候选的分析,在人类HEK293T细胞中使用了一种无偏见的全基因组分析。对于小鼠ROSA26和AngPTL3基因座,我们预测了7个系统的潜在离靶位点,量化了前两个离靶位点的INDEL频率,并计算了离靶编辑和对靶编辑的比率。对于人MAPK8位点,采用IGUIDE-SEQ41进行特异性定量。在三个位点中,ISAAM1对两个位点(图H、I)的脱靶率最低,ISYMU1的脱靶编辑程度也很低。然而,对这些结果的解释因两个因素而变得复杂。首先,一些编辑,特别是三个Cas12F变体的偏离目标比率,由于其总体活动较低,难以精确量化(图c、d、g)。对于这些低活动的编辑器,以低读数量化的偏离目标比率预计将与更大的不确定性相关联。其次,考虑到不同位点编辑活动的巨大差异,目标之间的脱靶水平不同,使得三个样本量不足以得出一般性结论。尽管如此,推断TnpB的编辑特异性与这些Cas编辑器不相上下应该是相对安全的。总之,一项深入的特性表明,ISAAM1和ISYMU1 TnpB在体内外和体内效率方面优于Cas12变异体,而表现出与Cas9变异体相似的性能。而且,它们的编辑特异性与这些Cas12或Cas9变体不相上下。
本文作者:ZYL 责任编辑:FC 原文链接:https://doi.org/10.1038/s41587-023-01857-x
目前评论: