最新开发的策略可最大程度地减少CRISPR-Cas介导的基因组编辑中的脱靶效应
基因组编辑是一种强大的工具集,涉及到DNA序列的有意改变,正引领着针对癌症,遗传疾病等的分子医学新时代[1]。当前可用的编辑方法包括锌指核酸酶(ZFN),转录激活子样效应子核酸酶(TALEN)和成簇的规则间隔的短回文重复序列(CRISPR)。CRISPR被认为是古细菌和细菌的抗病毒免疫系统,后来被用作基因编辑的有效工具[2]。CRISPR/Cas9比ZFN和TALEN广泛用于基因编辑,因为它具有成本效益,高效,易用和高效的特点[3]。CRISPR/Cas9的成分是指导RNA(gRNA)和Cas9核酸酶。gRNA是一种定制设计的短核苷酸碱基RNA,可募集Cas9来切割和编辑基因组中的特定基因座。CRISPR/Cas9在双链DNA内诱导特定的双链断裂(DSB),从而触发DNA修复途径,例如非同源末端连接(NHEJ)为基因敲除(KO)或同源直接修复途径引入移码突变(HDR)通过提供的模板DNA进行基因替换或基因敲入(KI)[4]。CRISPR/Cas9基因组编辑已在细菌[5],植物[6]和哺乳动物[7,8]中得到利用。CRISPR/Cas9在未来的临床遗传学中具有治疗潜力,这导致美国批准了减少遗传疾病的临床试验[9]。表1所示的核酸酶平台上CRISPR/Cas,ZFN和TALEN之间的临床试验数据和比较特征。
几项研究表明,Cas9结合了意想不到的基因组位点进行切割,称为脱靶效应[10]。CRISPR/Cas9的靶效率通过与靶基因座相邻的20个gRNA和PAM位点的核苷酸序列确定。靶序列与gRNA的20个核苷酸之间的三个以上错配会导致脱靶效应[11]。已经证明,PAM远端有4个错配会引起脱靶效应[12]。研究人员提出了两种类型的脱靶作用,第一种类型的脱靶作用可能是由于靶基因座的序列同源性而发生的,而第二种类型的脱靶位点发生在基因组中而不是靶位点。脱靶效应在生物体的基因组水平上引起严重的问题,大的缺失和基因组重排,由于dsDNA断裂而很少发生[13]。脱靶效应可能导致致命的基因突变,导致基因功能丧失,最终导致动物的癌细胞和植物的不良表型(疾病敏感性)[14](图1)。
天然CRISPR/Cas9系统是细菌中的一种适应性免疫系统,可保护细菌基因组完整性免受入侵病毒的侵害[4]。由于基因组的大小比真核基因组小,因此Cas9在细菌中的特异性很高,后者比细菌大1000倍。细菌中的Cas9进化过程中没有选择压力。因此,与细菌相比,在哺乳动物基因组中脱靶效应的可能性更高[18]。脱靶切割位点已在基因编辑技术,CRISPR/Cas9,ZFNs和TALEN中检测到[19],但在基因敲除工具如RNA干扰(RNAi)和反义[20,21]中也已检测到。基因编辑中的脱靶效应在临床治疗中造成严重风险。研究人员发现了体内/体外生化分析和基于算法的计算方法,可以检测和量化脱靶效应,从而提高基因编辑效率。脱靶检测方法分为两组:有偏检测和无偏检测。
精心设计gRNA对于精确的CRISPR/Cas9靶向至关重要。对于成功的CRISPR/Cas9研究,可以通过计算机工具预测脱靶效应[22]。作者发现,CRISPR/Cas9可以在一定条件下产生脱靶位点。此外,许多科学家开始通过使用具有不同策略的不同CRISPR系统在目标外的站点上产生大量数据[23,24,25]。生成的数据用于开发基于算法的计算机模拟预测模型,以检测和量化脱靶效应。计算机预测可以通过算法设计的软件将脱靶效应降至最低。基于算法的模型可分为两类:
1。基于比对的模型;基于常规算法,其中gRNA与参考基因组比对,脱靶效应基于序列同源性返回;2.基于评分的模型,经过先进的算法设计,根据给定的分数和基于确定的脱靶位点的排名,为实验选择了最合适的gRNA[26,27]。偏置方法见表2。
在此,以同源性为基础将gRNA序列与参考基因组序列比对后预测的脱靶位点。它包括Bowtie,BWN,CasOT,Cas-OFFinder,FlashFry和CrisFlash。
在基于比对的方法中,Cas-OFFinder是查找潜在脱靶位点的更好模型,而FlashFry的总体结果高效且速度高[27]。
它包括MIT,CFD,CRISTA,Elevation和DeepCRISPR。
在基于评分的方法中,Elevation方法被证明是发现所有潜在的脱靶切割位点的最新有效且有效的工具[36,44]。
无偏方法可以在整个基因组水平上检测活细胞中意外的切割位点。这些方法分为体外检测或体外全基因组测定以及体内检测或基于细胞的全基因组测定。表3中说明了无偏工具。
用于检测和定量脱靶效应的体外全基因组检测主要包括Digenome-seq,SITE-seq和CIRCLE-seq。
体外和基于细胞的裂解,条件差异显着,体外确定的许多脱靶分子在体内未裂解(修复);因此,需要开发体内或基于细胞的全基因组检测方法来检测真正的脱靶作用。广泛使用的基于细胞的全基因组检测可检测脱靶位点,包括整合缺陷型慢病毒载体(IDLV),染色质免疫沉淀和高通量测序(Chip-seq),破坏标记,链霉亲和素富集和下一代测序(BLESS),通过测序实现全基因组,DSB的无偏鉴定(GUIDE–seq),发现原位Cas脱靶并通过测序进行验证(DISCOVER–seq),通过两次细胞胚胎注射实现全基因组脱靶分析(GOTI)和体内脱靶验证(VIVO)。
与所有基于细胞的测定法相比,GUIDE-seq是首选,因为它成本更低,组分数量少,假阳性率低,适用于多种细胞系,并且可以检测出靶标部位的低丰度[67]。
CRISPR/Cas9进行的基因编辑主要取决于gRNA的特异性(与目标位点结合的gRNA数量)和效率(在目标位点产生多少gRNA的DSB),这可通过指导Cas9来切割基因组。然而,设计具有低脱靶效应的有效gRNA是一项艰巨的任务[68]。CRISPR/Cas9的广泛应用取决于其基于合成sgRNA序列靶向DNA的能力,即在gRNA序列的5’端占据二十(20)个核苷酸的指导序列。据报道,gRNA序列被认为是提高切割效率和靶向特异性的关键因素[36]。与传统的基因组编辑工具相反,ZFN,TALEN和CRISPR/Cas9技术具有优势,因为其多重靶向突变可通过将许多gRNA实时导入细胞中而产生[69]。此外,完美的gRNA可用于最小的脱靶突变和最大的脱靶诱变。CRISPR/Cas9系统可广泛用于增强或减少靶基因,敲入和敲除基因的表达[70]。因此,有必要仔细设计,工程改造和修饰gRNA,以规避脱靶突变。已经开发出不同的策略,例如GC含量,gRNA长度,截短的gRNA和化学修饰以减少脱靶效应。
通过将最初20bp的gRNA长度缩短至17/18bp,报道的脱靶事件减少了500倍,而不会影响靶标准确性[75,79]。相反,当使用17bpsgRNA时,在哺乳动物细胞中观察到了意想不到的最小变化[75]。gRNA5’端的三个核苷酸显着降低了哺乳动物细胞系统中的不良作用。将gRNA和Cas9与成对的切口酶结合可显着降低哺乳动物的脱靶效应[79]。DeadRNA脱靶抑制(dOTS)是最新开发的策略,其中指导Cas9结合但抑制切割的截短gRNA死亡导致脱靶作用降低和靶上活性增加40倍[80]。
在gRNA核糖磷酸骨架中掺入2-O-甲基-3-膦酰基乙酸酯会导致位点特异性修饰,从而使脱靶裂解减少40-120倍,同时又保持了对靶的性能[81]。通过形成动态RNA-DNA双链体,将桥连和锁定的核酸整合到指导序列中,靶外特异性提高了约25,000倍[82]。CRISPR系统的长期表达引起许多脱靶效应[77]。通过将gRNA与限制Cass9表达的Cas9共表达来设计和交付一个自我限制的CRISPR系统,从而减少脱靶效应[83]。在gRNA上游5’处修饰发夹结构可提高Cas9和Cas12的特异性,约55倍,从而降低脱靶效应[84]。
化脓性链球菌Cas9(SpCas9)是应用最广泛的Cas9,它会产生全基因组范围内的脱靶突变,这导致科学家开发了变异的SpCas9和其他直系同源的Cas9,可以在一定程度上解决这一问题。在这里,我们根据其起源对Cas变体进行了分类。表4所示为Cas核酸酶变体。
spCas9,xCas9和Cas9-NG的工程变体可将脱靶效应降至最低,并提高特异性。xCas9xCas9-3.7的变体有效地针对约16种NGNPAM,这些组合包括GAA,NG,NGG和GAT。在这方面,GAT,GAA和NG是xCas9识别的广泛PAM的一些示例。与SpCas9相比,xCas9在人类细胞中具有更高的特异性和较低的意外遗传修饰[113]。Cas9-NG被认为是用于植物基因编辑的轻松PAM。它在植物中具有更高的特异性,但在动物中会引入带有NGPAM位点的indel[114]。SpCas9的直接进化和其REC3域中的随机突变导致evoCas9突变体的发现。GUIDE-seq用于评估八个不同基因座处evoCas9突变体的效率。evoCas9中的靶向活性明显高于野生型SpCas9[89]。
经过工程改造的高保真SpCas9变体,SpCas9-HF1具有极高的准确性,在人细胞中确认的85%的sgRNA表现出微不足道的脱靶效应。由于其出色的性能,它与WTSpCas9相似,并且可能在治疗应用中使用[115]。对于人类细胞基因组编辑,增强的特异性SpCas9(eSpCas9)被认为是有用的工具。合理生成的eSpCas9(K848A,K1003A,R1060A)可以减少非目标链的结合,从而增强基因编辑的特异性[116]。但是,SpCas9–HFI和eSpCas9在基因组水平的某些目标基因座上的活性均较差[117,118]。为了克服SpCas9–HFI和eSpCas9在许多位点的低活性状态,通过SpCas9的REC3域中的点突变设计了超精确的Cas9。超精确的Cas9变体(Hypa-Cas9)在人细胞中显示出较高的靶上活性,而没有脱靶效应[86]。
Cas9的另一个变体Sniper–Cas9是通过在大肠杆菌中直接进化而开发的。通过截短的gRNA和RNP传递,在人类细胞系中Sniper–Cas9的特异性显着高于SpCas9–HFI,eSpCas9和evoCas9突变体[87]。最近,开发了用途广泛的Cas9变体HiFiCas9,用于原代人细胞中的靶标活性。与所有其他Cas9变体相比,HifiCas9的靶向活性略低,但用途广泛且在许多基因座上更具活性[119]。SpG和SpRY是最新开发的Cas9变体,SpG可以靶向NGNPAM的扩展集,而SpRY是最新开发的核酸酶变体,用于有效靶向人细胞中的所有PAM位点[120]。SpRY设计的工程师为开发具有PAM灵活性的新基因靶向技术铺平了道路。
Cpf1,CRISPR-Cpf1-RNP最初在Prevotella和Francisella1中鉴定的另一种RNA指导的核酸内切酶是Cpf1(或Cas12a)。CRISPR/Cas9和CRISPR/Cpf1系统之间存在一些差异。Cpf1识别5'-TTTV-3’PAM,并且仅需要功能的crRNA(无tracrRNA)即可[121]。根据这项研究,当在玉米中进行基因组编辑时,CRISPR/Cpf1在产生目标突变时效率不如CRISPR/Cas9(90%–100%突变T0植物)(0%–60%突变的T0植物)。此外,他们的研究结果还表明,Cas9具有相对特异性,因为测序未在组成性表达Cas9和gRNA的T1植物中检测到脱靶位点的任何突变[114]。重组CRISPR-Cpf1核糖核酸蛋白(CRISPR-Cpf1-RNP)降低了小鼠细胞的脱靶活性[122]。
引入sgRNA/Cas9编辑机制所用的传递方法对系统的最终准确性至关重要。
通常,基因组中会发生意外突变或脱靶效应,这是由于在基因敲除之前先用DSB进行NHEJ,而在敲入之前则进行HDR。最强大的工具可能是没有DSB的基因组编辑。最近,已经开发了一种新的基因组编辑技术用于碱基编辑,该技术可以在不引入DSB的情况下改变基因组中的特定核苷酸[111,137,138]。碱基编辑技术包括dCas9,脱氨酶(催化碱基修饰酶)和sgRNA。与HDR相比,这些基础编辑工具已显示出显着的基因编辑效率。碱基编辑器比Cas核酸酶更有效地编辑静态细胞的DNA,而Cas核酸酶则需要内源性DNA修复机制,而这种机制在非分裂细胞中是无效的[66]。胞嘧啶基本编辑器(CBE)和胸腺嘧啶基本编辑器是开发的两类基本编辑器,它们可以分别将C/G更改为T/A,将A/T更改为G/C。
Cas核酸酶,sgRNA和AID/APOBEC胞苷脱氨酶是CBE的主要成分。在DNA中,CBE通过两种酶APOBEC(载脂蛋白BmRNA编辑型催化多肽样)和AID(激活诱导的胞苷脱氨酶)催化的胞嘧啶(C)水解脱氨反应生成胸腺嘧啶碱基(T)[139]。第一代CBE(BE1)是大鼠APOBEC与dCas的融合体,它容易因D10A和H840A突变而失活,并且能够将胞嘧啶转化为胸腺嘧啶(在sgRNA的PAM位点之间12-16范围内)。第二代CBE(BE2)是通过在BE1中添加尿嘧啶DNA糖基化酶抑制剂(UGI)形成的,从而将胞嘧啶碱基的功效提高了三倍[140]。为了进一步提高碱基编辑器的编辑效率,第三代碱基编辑器(BE3)是通过结合Cas9n(被突变D10A灭活以在靶链上形成缺口),胞苷脱氨酶和UGI来开发的,它们的编辑效率是后者的六倍。BE2。由于BE3相对较少引起脱靶效应,因此在动物(小鼠),细菌和植物细胞中得到了广泛的应用,以编辑细胞的基因组成。为了更好地抑制内源性碱基切除修复,将另一个UGI副本和BE3融合以开发第四代碱基编辑器(BE4)。与BE3相比,BE4表现出的编辑效率更高。另一个关键因素是DNA甲基化会抑制碱基编辑效率。为基础编辑器开发的人类hA3A衍生的BE系统(hA3A–BE3)在高度甲基化的DNA区域显示出最大的编辑效率[141]。
为将腺苷(A)更改为鸟苷(G)而创建的腺嘌呤基础编辑器(ABE)。基于大肠杆菌TadA(ecTadA)酶开发了一系列ABE。ABE7.1到7.10旨在提高目标上的活动并降低目标外的影响[111]。通过核定位产生的ABE-max降低了脱靶活动[142]。最近,新开发的基础编辑器ABE8e比ABE7.10的目标活动增加了590倍[143]。
最近,在稻米和小鼠胚胎中检测到了整个基因组的许多脱靶突变,其原始频率分别是原始CBEBE3引起的,平均频率为5.3×10-7/bp和5×10-8/bp。[56,144]。过表达的BE3和ABE诱导脱靶RNA突变,其是sgRNA独立的,例如,由rAPOBEC1和TadA-TadA*引起的脱靶[56,145]。需要优化rAPOBEC1和TadA-TadA*以减少意外突变。rAPOBEC1中引入的突变(R33A或R33A/K34A)称为SECURE(选择性阻止有害RNA编辑),显示RNA脱靶活性显着降低[145]。通过点突变(E59A)使ecTadA或ecTadA*失活,从而降低了RNA脱靶效应。为了提高特异性,通过改变特定的三个残基来提高ecTadA*的活性,从而降低了意外的RNA脱靶效率[146]。最近,在ecTadA中引入了单基因修饰(D53E或F148A)以开发可显着降低RNA脱靶的ecTadA*(ecTadA突变体)[147]。
为了拓宽PAM识别位点,许多研究小组已经用各种工程核酸酶(例如KKHSaCas9,EQR,VRER,SaCas9,VQR,xCas9和SpCas9-NG)取代了BE3的spCas9,它们识别了基因组中的不同PAM位点[113,114,151,152]。通过将nCas9替换为ABE7.10中的nXCas9,开发了许多类型的ABE,xABE扩展了包含GAT,GAA和NGPAM位点的基因组靶区域。所有提到的基本编辑器都旨在识别G/C丰富的PAMsites。通过将大鼠APOBEC1与非催化性Cpf1核酸酶融合,开发了“基于CRISPR-Cpf1的BE”来克服这一限制,该酶识别人细胞中相对较少的意料不到的修饰的富TPAM位点[153]。
最近,通过结合编程的逆转录酶与主要编辑gRNA(pegRNA)和Cas切口酶核酸酶的结合,开发了一种新的基因编辑方法(Prime编辑),该酶可以编辑或“搜索和替换”哺乳动物细胞中的碱基而不会产生双链断裂和DNA供体模板,附带损害更少。Prime编辑(PE)涵盖了BE的局限性,BE可以有效地安装四个过渡突变(C到T或G到A,A到G和T到C)。但是,Prime编辑可以在基因组中安装所有12种可能的过渡变化(C/A,C/G,G/C,G/T,A/C,A/T,T/A和T/G)。BE要求目标站点在特定位置编辑PAM。这就是为什么在“编辑窗口”中出现许多胞嘧啶或腺嘌呤碱基,或者相对于目标编辑而言,PAM位置缺乏15±2的情况,才会发生不需要的旁观者突变的原因。当旁观者编辑不可接受或目标站点缺少定位的PAM时,PE可以进行编辑。突变已得到纠正,从而导致镰状细胞性贫血和塔伊-萨克斯病(Tay-Sachsdisease),脱靶编辑最少,PE可以纠正高达89%的已知突变,从而引起致病突变[154]。原始编辑是一项过早的技术。NHEJ可以修复一些场地;这可以视为其他类型的脱靶目标。然而,需要对动植物模型的主要编辑进行更多的研究,以将其转移到治疗性基因编辑中。
CRISPR/Cas9能够以前所未有的精度修饰基因组的成功,可以归因于它的准确性,效率,成本效益以及比传统基因编辑工具(ZFN和TALEN)更易于使用。但是,CRISPR/Cas工具会在基因组水平上造成有害的脱靶效应。报道了各种技术,包括不同的生物信息学方法,例如用于脱靶突变的计算机检测以及改善的脱靶效率以改善脱靶效应。选择合适的脱靶检测工具,例如具有预测性的靶上和脱靶位点的偏倚和无偏,比CRISPR传递系统更为关键。
最优选的脱靶检测有偏和无偏方法分别是Elevation和GUIDE-seq。
在gRNA修饰中,截短的sgRNA规定了减少脱靶效应的简单方法,并且在大多数情况下,基于RNP的递送适用于获得较高的脱靶活性。此外,选择Cas变体对于减少取决于实验性质的脱靶效应也至关重要。
此外,选择Cas变体对于减少脱靶效应也很关键。研究人员正在努力创造工程化的Cas9变体和新的基因靶向技术,从而在哺乳动物细胞中产生可忽略的脱靶效应,从而改善治疗性基因编辑或基因组手术。当前开发的主要编辑工具具有在人类细胞中产生最小脱靶效应的遗传疾病治疗方面的未来前景,但是脱靶效应也限制了Prime编辑应用程序。然而,需要进一步研究以开发超级CRISPR系统来治疗医疗保健系统中的遗传性疾病。