CRISPR-Cas技术可以说是目前生命科学领域发展最为迅速、最耀眼、最有前景的技术了。它究竟是怎么回事?是怎么一步一步发展起来的?为什么这么火?到底怎么用呢?
CRISPR-Cas作为细菌的适应性免疫系统,当外源病毒或质粒DNA进入细胞时,专门的Cas蛋白将外源DNA剪成小片段,并将它们粘贴到连续的DNA片段中,称为CRISPR序列。然后,Cas蛋白表达并加工CRISPR基因座以产生CRISPRRNA(crRNA)。通过序列同源性,这些crRNA基于序列特异性将Cas复合物靶向到外源DNA,并切割目标DNA以干扰外来入侵者。
图.AnoverviewofCRISPR/Casasabacterialadaptiveimmunesystem.(图片来自Wikipedia,accessed25November2013.Author:JamesAtmos)
1987年,Nakata研究组在分析大肠杆菌iap基因及周边序列时发现iap基因3’端存在含有29个核苷酸高度同源重复序列,它们被含32个核苷酸的序列间隔开。但当时人们并不知道这些重复序列究竟有什么作用。之后的几年中,在其它多种微生物中也陆续发现这类重复性序列。
嗜热链球菌广泛用于乳制品行业制作酸奶和奶酪,Danisco公司的Horvath与其同事试图解决嗜热链球菌免受噬菌体攻击这一问题。2007年,他们通过实验证明CRISPR系统确实是一种适应性免疫系统:嗜热链球菌被病毒入侵后整合了来自噬菌体基因组新的间隔区序列,同样的病毒再次入侵时细菌就有了抗性,使其免遭攻击。如果改变特定间隔区序列,则会影响细菌抵抗噬菌体的免疫功能。他们还研究了Cas7和Cas9,认为Cas9蛋白可能是产生这种免疫能力所必需的。
随后,科学家们纷纷开始补充CRISPR-Cas系统干扰噬菌体机制的细节。
2008年,JohnvanderOost研究小组先在大肠杆菌中发现,来自噬菌体的间隔序列被转录成小RNA,成为CRISPRRNA(crRNA),引导Cas蛋白到靶DNA上。Marraffini和Sontheimer在同年证明了CRISPR-Cas系统的目标分子是DNA,而不是RNA。他们还明确指出,如果将该系统转移到非细菌系统中,可能成为一种强大的工具系统。
2010年12月,Moineau团队证明了CRISRP-Cas9在PAM序列上游位置精确切割,使DNA双链断裂。而作为II型CRISPR系统的显著特征,Cas9是切割唯一需要的蛋白,它与crRNAs共同介导CRISPR-Cas9的干扰功能。
2011年,Charpentier研究组对酿脓链球菌进行了小RNA测序,发现除了crRNA以外,还存在一种小RNA,称为式激活CRISPRRNA(tracrRNA)。tracrRNA通过24个核苷酸与crRNA中的重复序列互补配对与形成双链,引导Cas9到其目标DNA。至此,天然CRISPR-Cas9干扰机制的拼图基本拼搭完整。
2011年7月,Siksnys团队克隆了来自嗜热链球菌(II型系统)的整个CRISPR-Cas基因座,使其在不含II型系统的大肠杆菌中表达,实现了对质粒和噬菌体DNA的靶向干扰。证明了Cas9是干扰唯一必需的蛋白,而它的Ruvc和HNH核酸酶结构域都是必不可少的。
他们在体外系统中证明了crRNA通过碱基互补配对与tracrRNA形成双链RNA,指导Cas9蛋白在目标DNA上切割,引起双链断裂。精确的平端切割位点位于PAM上游3个核苷酸位置,而Cas9蛋白的HNH核酸酶结构域切割crRNA的互补链,RuvC样结构域切割非互补链。tracrRNA:crRNA在被融合为单链向导RNA(singleguideRNA,sgRNA)时也可以发挥指导Cas9的作用。此外,crRNA可以减少到20nt,仍足以有效切割;通过改变crRNA的序列可以重新定位Cas9的靶向位点。
ThesefindingspavethewayforengineeringofuniversalprogrammableRNA-guidedDNAendonucleases.
——Siksnys
AsuccessfulexampleoftheapplicationofourbasicresearchinbiotechnologyandmedicineisourrecentdiscoveryofanRNA-guidedDNAcleavagemechanismthathasbeenharnessedasanRNAprogrammablegenomeengineeringtechnologyandthatstemsfromouranalysisoftheadaptiveimmuneCRISPR-Cas9systeminbacterialpathogens.
——EmmanuelleCharpentier
很快,2013年初的3篇论文都将CRISPR-Cas系统成功地应用到了哺乳动物细胞中。
其中,Church研究组设计了II型CRISPR-Cas系统,在人293T细胞、K562细胞以及诱导多能干细胞中通过设计sgRNA成功靶向特定序列,且多个gRNA可以实现对目标基因的多重编辑。
张锋实验室证明了CRISPR-Cas9系统可以在人类和小鼠细胞中进行精确的定点切割,并且将Cas9突变为缺口酶,促进同源修复过程。
Qi研究组则建立了CRISPRi系统,将Cas9改造为失去核酸内切酶活性的dCas9,通过sgRNA的指导定点结合到目标基因座上,从而抑制目标基因的表达。同年,还实现了多sgRNAs靶向多基因(Tet1、Tet2、Tet3、Sry和Uty)的同时定点突变。
Wu等人利用CRISPR-Cas9系统对Crygc显性突变的小鼠进行基因治疗使其获得了健康的后代,为CRISPR-Cas9系统用于遗传疾病的基因治疗提供了依据。
之后,Mizuno等人利用CRISPR-Cas9技术成功构建了酪氨酸酶基因(Tyr)突变的白化病小鼠模型。Thomas等人利用CRISPR-Cas9系统在斑马鱼中成功实现了Gal4基因的定点编辑。
由此,CRISPR系统在多种生物的基因定点编辑、基因组筛选、基因转录调控、基因组成像、基因诊疗、生态应用等领域的研究与应用开始井喷。
图.TimelineofCRISPR-Casandgenomeengineeringresearchfields.(图片来自Ref.4)
2015年,张锋实验室又发现了一类新的CRISPR-Cas系统:CRISPR-Cpf1。Cpf1蛋白是一种比spCas9蛋白更小更简单的核酸内切酶,自然形态下仅需要一条RNA引导。Cpf1蛋白切割DNA后产生黏性末端,便于新DNA序列插入。Cpf1识别富含胸腺嘧啶(T)的PAM序列,这也扩展了基因编辑靶点的选择范围。越来越多的研究发现CRISPR-Cpf1系统在特异性和多基因编辑方面都有着很大的优势。
2016年,张锋实验室发现一种来自纤毛菌(Leptotrichiashahii)的CRISPR酶Cas13a(C2c2)蛋白具有RNA介导的RNA酶功能。8个月后,他们又发现了另一种同类酶Cas13b。
不仅CRISPR技术迅速发展,它在转化医学和疾病治疗领域中的应用也不断创造出惊喜。
2015年12月31日Science杂志发表了三个独立研究小成功使用CRISPR治疗遗传性疾病动物模型的方法。他们利用CRISPR系统编辑Dystrophin基因,能够不同程度修复杜氏肌营养不良症小鼠的肌肉功能,从而达到治疗DMD的效果。2018年,又利用CRISPR技术成功治疗了四只患有DMD(Duchenne型肌营养不良症)的狗,并将其肌肉和心脏组织中的营养不良蛋白恢复到正常水平的92%。
此外,CRISPR技术还与细胞免疫疗法相结合以完善CAR-T疗法,并在小鼠中增强了肿瘤抑制作用。首次利用CRISPR-Cas9在T细胞中敲除PD-1基因的临床试验已被批准用于治疗肌肉浸润性膀胱癌、去势抵抗性前列腺癌、转移性肾癌和转移性非小细胞肺癌,这些I期临床试验已于2016年开始。
CRISPR-Cas系统包含CRISPR基因座和Cas基因两部分。
其中,CRISPR基因座主要由前导序列(leader)、重复序列(repeat)和间隔序列(spacer)构成。前导序列富含AT碱基,且位于CRISPR基因座上游;重复序列的长度约20–50bp碱基且包含5–7bp回文序列,转录出的茎环结构能够稳定RNA的整体二级结构;间隔序列为从外源捕获的核酸片段。
Cas基因位于基因座附近或分散于基因组其他地方,编码Cas蛋白在防御过程中至关重要。
依据Cas蛋白在细菌免疫防御过程中参与的角色,目前将CRISPR-Cas系统分为两大类。
第一大类:它们切割外源核酸的效应因子为多个Cas蛋白形成的复合物,包括Ⅰ型、Ⅲ型和Ⅳ型。第二大类:它们的作用因子是比较单一的Cas蛋白,比如Ⅱ型的Cas9蛋白和Ⅴ型的Cpf蛋白。
目前,被最为广泛应用的CRISPR系统是II型CRISPR-Cas系统,也就是CRISPR-Cas9系统。
图.Schematicdiagramofclassification,typicalarchitecture,functionalcomponentsinCRISPR-Cassystem.(图片来自Ref.11)
II型CRISPR-Cas系统是最为简单的一种CRISPR系统,也是CRISPR介导的基因组编辑技术的基础。
目前应用最广泛的化脓性链球菌(SP)的CRISPR-Cas9系统包括:CRISPR序列,四种蛋白质编码基因(Cas9、Cas1、Cas2和Cns2)和tracrRNA。
spCas9基因编码核酸酶,是切割外源入侵DNA的主要蛋白,而Cas1、Cas2和Cns2蛋白在获取CRISPR间隔序列的过程中起作用(下图A)。该系统工作时,CRISPR序列和tracrRNA被转录,产生长的pre-crRNA和tracrRNA(下图B)。这两种RNA通过互补序列形成双链,并由Cas9和RNaseIII加工成较短的形式(下图C)。随后,Cas9-tracrRNA-crRNA复合物开始搜索与间隔序列匹配的DNA序列(下图D,红色表示目标DNA序列)。与目标DNA靶点的结合还需要存在PAM位点。一旦Cas9被crRNA指引到目标DNA位点上发生结合,它就切割PAM位点上游3nt位置的DNA。
图.Class2,TypeIICRISPR-Cas9SystemfromStreptococcusthermophilus(图片来自Ref.3)
根据上述机制,一个简化的Ⅱ型CRISPR-Cas靶向系统必定要含有:Cas作用蛋白(如最为常用的spCas9)和单链向导sgRNA。sgRNA的结构包括:5‘端的一段短(~20nt)的指导序列(guideRNA,gRNA),与目标DNA序列互补匹配,并决定了Cas9蛋白定向切割的特异性;3’端有用于结合Cas9蛋白的骨架结构(Scaffold)。
图TheCRISPR-Cas9SystemforGenomeEditing(图片来自Ref.12)
随着对II型CRISPR-Cas系统的不断探索,CRISPR-Cas9系统也在不断被优化,旨在降低由于sgRNA与非靶向序列局部匹配或存在非标准PAM(NAG而非NGG)而激活Cas9产生的脱靶效应,并提高整套系统的精确性和实用性。
(1)降低Cas9蛋白的核酸内切酶活性。比如:分别突变Cas9的D10A和H840A使其成为切口酶,只能对单链进行切割,因而需要2条sgRNA同时引导才能引起双链DNA断裂,从而降低脱靶的概率。
(2)降低Cas9蛋白的DNA结合能力。对Cas9蛋白进行定点突变形成eSpCas9(K848A/K1003A/R1060A)、SpCas9-HF1(N497A/R661A/Q695A/Q926A)和HypaCas9(N692A/M694A/Q695A/H698A)。通过削弱Cas9蛋白与DNA的非特异性结合的能力,增强靶向序列与Cas9蛋白结合的竞争力。
(3)降低对非标准PAM(NAG)的识别能力。Cas9突变体D1135E对标准PAM(NGG)的识别更加特异。
(1)采用较短的sgRNA指导序列的长度,20个核苷酸序列可以减低脱靶效应而不影响编辑效果。
(2)增加sgRNA的稳定性。如在gRNA中增加一对A-U碱基配对等方法。
简单地来说,使用CRISPR系统获得基因工程小鼠的过程大致是:
首先,根据目标基因靶序列设计出sgRNA。目标基因靶序列可以是任何约为20个核苷酸的DNA序列,只要它符合两个条件:
通过显微注射的方式,使小鼠受精卵中共表达内切核酸酶(如spCas9)和sgRNA。表达出来的Cas9蛋白通过与sgRNA骨架结合形成核糖核蛋白复合体,Cas9蛋白构象发生改变,成为具有DNA结合活性的构象。
通过sgRNA指导序列与目标基因靶序列的特异性匹配,Cas9蛋白结合到指定基因的靶DNA上,此时发生第二次构象变化,其RuvC和HNH核酸酶结构域在PAM序列上游约3-4个核苷酸的位置分别切割DNA的两条互补链,最终造成目标基因靶DNA的双链断裂(DSB)。
然后,通过以下两种常规修复途径之一修复DNA双链断裂:
NHEJ修复途径是最活跃的修复机制,通常在DSB位点引起核苷酸插入或缺失。NHEJ介导的DSB随机修复就会导致靶DNA中产生小片段插入或缺失,造成移码突变使靶基因的开放阅读框(ORF)过早出现终止密码子。这也就是利用CRISPR-Cas系统建立基因敲除模型的原理。
同源定向修复(HDR)可以将特定的外源突变引入到目标基因DNA中,从单碱基突变到大片段插入都可以,这就为点突变、基因敲入小鼠模型的建立提供了有力工具,比如在目的基因中添加荧光基团或标签、共表达其它基因等。
采用HDR途径进行基因编辑,需要将含有外源序列的DNA修复模板与gRNA和Cas9一起注射到小鼠受精卵中。外源修复模板必须包含所需的外源序列以及紧邻靶标上游和下游的同源序列(称为左右同源臂也称为5’或3’同源臂)。每个同源臂的长度取决于插入片段的大小,一般来说插入片段越大所需要的同源臂长度也越大。
图.DNArepairafterdouble-strandbreak.(图片来自Wikipedia,accessed25September2017.Author:Mariuswalter)
所以,接下来需要将获得的首建鼠与野生型小鼠交配,获得特定等位基因生殖系遗传的F1代小鼠。
进行实验组与对照组小鼠繁育。
图FlowschemeofCRISPR-Cas9mediatedmousemodelgeneration.(图片来自Ref.12)
与传统的利用小鼠ES细胞获得基因工程小鼠模型的方法相比,CRISPR-Cas9技术跳过了小鼠ES细胞的操作与筛选,直接对小鼠受精卵进行操作。这样一来,
与其它核酸酶系统(如ZFNs和TALENs)相比,CRISPR系统也具有一些独特的优势:
图.传统小鼠ES细胞打靶途径VsCRISPR基因编辑途径制备基因工程小鼠周期对比。(图片来自Addgene)
References
1.LedfordH.CRISPR,thedisruptor.Nature.2015Jun4;522(7554):20-4
2.HsuPD,LanderES,ZhangF.DevelopmentandapplicationsofCRISPR-Cas9forgenomeengineering.Cell.2014Jun5;157(6):1262-78.
3.LanderES.TheHeroesofCRISPR.Cell.2016Jan14;164(1-2):18-28.
4.DoudnaJA,CharpentierE.Genomeediting.ThenewfrontierofgenomeengineeringwithCRISPR-Cas9.Science.2014Nov28;346(6213):1258096.
5.CongL,RanFA,CoxD,etal.MultiplexgenomeengineeringusingCRISPR/Cassystems.Science.2013Feb15;339(6121):819-23.
6.WangH,YangH,ShivalilaCS,etal.One-stepgenerationofmicecarryingmutationsinmultiplegenesbyCRISPR/Cas-mediatedgenomeengineering.Cell.2013May9;153(4):910-8.
7.HwangWY,FuY,ReyonD,etal.EfficientgenomeeditinginzebrafishusingaCRISPR-Cassystem.NatBiotechnol,2013,31(3):227–229.
8.ChangN,SunC,GaoL,etal.GenomeeditingwithRNA-guidedCas9nucleaseinzebrafishembryos.CellRes,2013,23(4):465–472.
9.MizunoS,DinhTT,KatoK,etal.SimplegenerationofalbinoC57BL/6JmicewithG291TmutationinthetyrosinasegenebytheCRISPR/Cas9system.MammGenome,2014,25(7-8):327–334.
10.SafariF,ZareK,NegahdaripourM,etal.CRISPRCpf1proteins:structure,functionandimplicationsforgenomeediting.CellBiosci.2019May9;9:36.
11.HuL,ChenS.ResearchprogressofCRISPR-Cassysteminbacteria.ActaMicrobiologicaSinica,2017,57(11):1643-1652.
12.QinW,KutnyPM,MaserRS,etal.GeneratingMouseModelsUsingCRISPR-Cas9-MediatedGenomeEditing.CurrProtocMouseBiol.2016Mar1;6(1):39-66.
Cre-ERT2在无Tamoxifen诱导的情况下,在细胞质内处于无活性状态;当Tamoxifen诱导后,Tamoxifen的代谢产物4-OHT(雌激素类似物)与ERT结合,可使Cre-ERT2进核发挥Cre重组酶活性。
常见的基因工程小鼠可以分为两种命名方式,包括基因定点修饰的小鼠命名,比如:敲除、敲入、点突变等等,和随机转基因的小鼠命名。