分子生物学




CRISPR系统无疑是当今最具影响力的基因编辑技术之一。
它自出现以来,彻底改变了基因编辑的格局,为生命科学研究和基因治疗带来了前所未有的机遇。在此之前,虽然已有ZFN、TALENs等基因编辑工具,但CRISPR-Cas9的出现无疑将基因编辑技术推向了新的高度。经过数十年的研究与创新,科学家们已经开发出一系列功能强大且应用广泛的基因编辑工具。
从最初的 CRISPR-Cas9,到单碱基编辑系统,再到prime编辑系统,每一次技术突破都为生命科学研究和基因治疗带来新的希望。
我们今天就来了解一下热门基因编辑工具。
什么是CRISPR-Cas系统
CRISPR的全称是Clustered Regularly Interspersed Short Palindromic Repeats,中文名称是成簇的规律性间隔的短回文重复序列。而Cas则是一类蛋白的名字,这种蛋白的种类非常多,只是因为Cas9的应用比较广泛,人们提起Cas蛋白首先会想到Cas9蛋白。
天然的CRISPR-Cas系统其实是细菌用于抵抗外来入侵的免疫系统。当病毒入侵的时候,细菌会把病毒的基因序列复制记录下来,下次遇到相同的病毒的时候,细菌会转录产生对应的 RNA 与 Cas9 蛋白结合形成复合物,对病毒进行识别和剪切。所以到这里我们可以知道,CRISPR-Cas9系统的基本组成成分就是识别序列的sgRNA,以及具有核酸酶剪切活性的Cas蛋白。
CRISPR-Cas系统的sgRNA基本都是识别靶向序列的功能,但是在Cas蛋白上做文章,不同的蛋白不同的改造可以产生各式各样的基因编辑工具。
CRISPR/Cas9
尽管新的编辑器层出不穷,CRISPR/Cas9仍然是应用最广泛的基因编辑工具。Cas9核酸酶包含RuvC和HNH两个结构域,在guide RNA引导下,可以识别并结合到目的DNA序列。但是Cas9蛋白对序列具有偏好性,目的序列附近必须存在PAM(Protospacer Adjacent Motif),即原间隔相邻基序。PAM由Cas9的种类决定,最常用的spCas9的PAM是NGG(5‘→3’)。
Cas9蛋白会切割双链,产生DSB(double strand break)双链断裂。细胞对于出现的DSB会启动修复程序,哺乳动物主要有三种修复方式,分别是:非同源末端连接(NHEJ)、微同源介导的末端连接(MMEJ)以及同源定向修复(HDR)。修复过程中可能会在序列上产生indel,即 insertion and deletion 插入和删除。

单碱基编辑 base editing
单碱基编辑器最早由哈佛大学David Liu实验室于2016年发表,指胞嘧啶碱基编辑器(CBE)和腺嘌呤碱基编辑器(ABE)。单碱基编辑器不会产生双链断裂,相对于CRISPR/Cas9系统更加安全。
CBE可以实现C→T胞嘧啶到胸腺嘧啶的替换,它由Cas9切口酶(nCas9)融合胞嘧啶脱氨酶(如rAPOBEC1)和尿嘧啶糖基化酶抑制剂(UGI) 构成,胞嘧啶脱氨酶将单链DNA上的胞嘧啶C脱氨基为尿嘧啶U,UGI抑制细胞内的碱基切除修复,防止U被修复为未编辑状态。细胞复制或修复过程中,U被识别为胸腺嘧啶(T),最终实现 C→T 的转换(或互补链上的 G→A)。
ABE可以实现A→G腺嘌呤到鸟嘌呤的替换,它由nCas9融合人工定向进化的腺嘌呤脱氨酶(如TadA变体)构成,ABE可以使单链上的腺嘌呤A脱氨基变为肌苷I,细胞会将肌苷I识别当成鸟嘌呤G,在后续的读码与复制中实现A→G的转换。需要注意的是,单碱基编辑器的nCas9仍然需要依赖近端有PAM序列的出现。

Prime Editors
Prime Editors(PEs)是一种新型的基因编辑工具,同样是哈佛大学David Liu团队开发的,文章在2019年发表。PE的出现大大地扩大了基因编辑的可操作性,它不会引起DNA双链断裂,而且不需要额外引入修复模板,即可完成多种类型的基因编辑。
PE的组成部分包括H840A nCas9,逆转录酶 MMLV-RT和pegRNA(Prime Editor Guide RNA)。pegRNA除了包含guide RNA序列以外,还有一段引物结合序列(Primer binding site,PBS)和转录模板序列(RT template)。
PE在pegRNA的引导下在目的DNA产生单链断裂,断裂后被释放的DNA单链会与pegRNA上的Primer binding site结合,这一段序列将充当引物,在逆转录酶的催化下根据RT template逆转录出一段新的序列,随后被整合到原来的DNA序列中。
由此产生一段异质双链,一条链是原本的DNA序列,一条链是编辑后的序列,在后续的DNA修复和复制中形成新的被编辑好的双链,被保留在细胞中。

基于CRISPR的导向作用,科学家们又利用CRISPR/Cas9系统设计了转录激活的CRISPRa和转录抑制的CRISPRi技术
CRISPRa转录激活
CRISPRa使用失活型Cas9(dCas9),这种dCas9不具备切割DNA链的能力,将dCas9与转录激活结构域比如P64, p65, Rta 和HSF1融合,sgRNA将其靶向至目的基因的启动子或增强子区域,实现增强目的基因的表达,CRISPRa已经改进发展出多种版本,例如CRISPRa v2 synergistic activation mediator (SAM)系统包含一个有MS2茎环结构的单向导RNA(sgRNA),这个sgRNA整合了两个MS2适配体,MS2蛋白招募转录激活因子p65和HSF1,从而实现更高效的转录激活。

CRISPRi转录抑制
CRISPRi由失活的dCas9蛋白与转录抑制结构域(如KRAB和MeCP2)融合而成,用于进行转录抑制的作用。在第一代CRISPRi构建体中,研究者将dCas9与锌指蛋白10的抑制结构域KRAB融合。后续为了提高效率,研究者将抑制结构域换成了锌指印迹蛋白3(ZIM3)中更强的KRAB。通过在KRAB基础上叠加其他抑制结构域(如MeCP2和SID4x),被发现可以进一步增强转录抑制的效果。

参考文献:
Villiger, L., Joung, J., Koblan, L. et al. CRISPR technologies for genome, epigenome and transcriptome editing. Nat Rev Mol Cell Biol 25, 464–487 (2024). https://doi.org/10.1038/s41580-023-00697-6