当噬菌体感染细菌后,病毒DNA进入细菌细胞内,细菌细胞表达Cas复合体对噬菌体DNA进行切割得到间隔序列(spacer),间隔序列在cas1和cas2作用下插入到CRISPR序列前导区下游,完成外源DNA的捕获(如图1),形成免疫记忆。
图1.细菌对噬菌体免疫-Phase1
图2.细菌对噬菌体免疫-Phase2
CRISPR/Cas可分为二大类群:Class1以多个Cas组成的效应复合体行使功能为特征,包括Ⅰ、Ⅲ和Ⅳ型;Class2则只需单个多结构域的Cas,包括Ⅱ(Cas9)、Ⅴ(Cas12)和Ⅵ(Cas13)型(表1)。Class2系统简单、高效、操作方便,是目前主要的基因编辑系统,其中最具代表性的是Cas9。
本文主要讲解Cas9。
如图3所示,CRISPR-Cas9系统由三部分组成,crRNA(读作CRISPRRNA)、tracrRNA(读作tracerRNA)和Cas(CRISPR-associated)核酸酶。crRNA和tracrRNA一起组成gRNA(guideRNA,向导RNA)。图3左边是自然界gRNA的结构,右边是人为制造的gRNA,将crRNA和tracrRNA融合为一条链(又称为sgRNA)。
gRNA骨架部分与Cas核酸酶相对应。不同的Cas核酸酶结合不同的gRNA骨架。
图3CRISPR-Cas9系统
下图以更加具体的例子来说明CRISPR-Cas9系统。
图4.CRISPR-Cas9system
Cas9蛋白结合sgRNA通过20nt长的向导RNA(蓝色)与人EMX1基因DNA结合;红色部分是sgRNA的骨架;粉色标记的是PAM序列,此处为TGG;Cas9会在PAM序列的上游约3bp出会产生一个双链断裂(DSB),图中红色箭头指示DSB断裂处。
图5spCas9的gRNA
SpCas9(常用的有两个版本)
Chen(2013):
GTTTAAGAGCTATGCTGGAAACAGCATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT
Hsu(2013):
GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT
SaCas9
GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCAAAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAGATTTTTT
FrCas9
GTTTGAGTGTCTTGTTAAGAAATTAACAAGATGAGTTCAAATCAGGCTCCTAGAGAGATCCGAACTTACCTTCATGGCGGGCATTGTGCCCTTTTTT
由于Cas9会在PAM序列的上游约3bp出会产生一个双链断裂(DSB),细胞主要启动两种“DNA修复”细胞信号转导通路:同源重组修复(HDR)与非同源末端连接(NHEJ)。
HDR需要我们额外提供同源模板,如果没有同源模板,NHEJ通路发挥功能,断裂的两条DNA直接连接,同时会产生几个碱基的插入或者删除,只要插入/删除的碱基数不是3的倍数(概率为三分之二),同时DSB在蛋白的编码区,那就有可能产生移码,使得蛋白失去功能,从而达到knockout(ko)的目的。所以,为了实现CRISPRko,Spacer应该尽量避免设计在太靠近氨基端(下游的ATG可能起始翻译)或者太靠近羧基端的位置,更稳当的做法是设计几条gRNA,产生好几个DSB。
如果想通过HDR进行基因编辑,比如引入荧光标签,靶位点的选择很大程度上受到编辑所需位置的限制;当切割位点距离修复模板的近端>30nt时,效率急剧下降(Yangetal,2013)。
如果我们让Cas9失去切割双链DNA的能力,也就是不引起DSB,但仍能在gRNA的引导下,特异性地结合到目标DNA序列上,就可以实现CRISPRa(激活)和CRISPRi(抑制)技术,可以在转录水平调控基因表达。首先,我们需要一个dCas9蛋白(没有切割活性的Cas9),它是在野生型Cas9的两个关键核酸酶活性位点(RuvC和HNH)引入突变(如D10A和H840A)后得到的。当dCas9被引导到靶基因的转录起始位点TSS(transcriptionstartsite)时,dCas9能够物理性阻碍RNA聚合酶的通过,导致基因沉默。同时dCas9融合了一个基因抑制结构域,如KRAB结构域,这样的蛋白称之为dCas9-KRAB,可以进一步提高转录抑制的效率。此外,dCas9也可以融合双抑制结构域KRAB-MeCP2,抑制效果更佳。
当dCas9连上转录激活子(如VP64、p65和HSF1),通过gRNA引导dCas9到目标基因的启动子或增强子区域,来激活基因的转录。这些激活因子通过吸引转录机器(如RNA聚合酶和其他转录因子)增加目标基因的转录水平。
对于CRISPRa,靶向转录起始位点(TSS)上游~100nt的窗口是最有效的,而对于CRISPRi,位于TSS下游~100nt的窗口,具有最高的活性。因此要设计CRISPRa或者CRISPRi的gRNA,需要知道转录起始位点信息。
gRNA的脱靶活性是需要重点考虑的。研究表明引导序列3'端的8-14个碱基对错配的容忍度低于5'端的碱基;一般来说,超过三个错配是不能容忍的;一些引导序列对错配的容忍度低于其他引导序列;脱靶切割对转染量以及Cas9和sgRNA的相对比例高度敏感。
了解完设计的基本原则后,就可以借助在线工具进行gRNA设计了,比如CRISPick。
表1.Class2CRISPRsystem
请注意,表格中的"dsDNA"代表双链DNA,"ssDNA"代表单链DNA,"ssRNA"代表单链RNA,"PAM"代表原间隔序列(protospacer-adjacentmotif),"PFS"代表前间隔序列侧翼位点(protospacerflankingsequence)。"反式剪切"(trans-cleavage)指的是CRISPR-Cas系统在切割目标DNA或RNA后,是否还能进一步切割其他非目标序列。CRISPR-Cas切割目标DNA或者RNA称为顺式剪切(cis-cleavage)
本公司的所有产品仅用于科学研究等非医疗目的,不可用于人类或动物的临床诊断或治疗,非药用、非食用。