史上最全的基因编辑常用技术指南
史上最全的基因编辑常用技术指南
基因编辑技术是现代生物技术领域的重要突破,它使得人类能够精确地修改生物体的遗传信息,从而在医学、农业等多个领域展现出巨大的应用潜力。从最初的锌指核酸酶到如今广为人知的CRISPR/Cas9技术,基因编辑技术经历了快速的发展和迭代。本文将为您详细介绍几种主要的基因编辑技术及其工作原理。
锌指核酸酶(ZFN)
锌指核酸酶(ZFN)是迈向高效、有针对性的核酸酶的第一步。为了产生ZFN,需设计一系列锌指与特定基因组基因座结合,然后与FokI核酸酶融合,识别两个相邻位点的配对ZFN切割DNA,从而启动HDR。
最经典的锌指核酸酶是将一个非特异性的核酸内切酶FokI与含有锌指的结构域进行融合,其目的是对特定序列进行切割。锌指识别三联体,FokI核酸酶作为二聚体起作用,在两个不同ZF目标位点之间的间隔区切开DNA。被切开的DNA可以由切除的修复机制使切开处的单链部分被删除,然后又重新接到一起。
理论上,我们可以利用这种方法完成对染色体上特定片段的删除,从而达到构造突变体或完成治疗的工作。但是ZFN的效用受到合成时间长和非模块化组装工艺的限制,尽管计算工具有助于改善设计,但无法为每个基因组基因座设计合适的ZFN对。
TALENs
TALENs在基因编辑技术上迈出了一大步。该模块系统基于从Xanthomonas spp分离的TAL效应子DNA结合蛋白与FokI核酸内切酶的融合。经验丰富的科学家制作ZFN可能需要六个星期的时间,而TALENs技术的出现使得新手在短短几天内便能完成TALEN的构建。
TAL中心靶向结构域由33-35个氨基酸重复序列组成。这些重复由两个彼此不同的氨基酸组成,也就是它们的重复可变双残基(repeat-variable di-residue,RVD)。最终,正是这种RVD决定了TAL效应子(TALe)将识别出哪个单核苷酸:HD靶向胞嘧啶、NI靶向腺嘌呤、NG靶向胸腺嘧啶和NN靶向鸟嘌呤。
由于ZF靶标仅限于由具有相应锌指的三联体组成的序列,因此平均每500bp基因组中有潜在的可靶向位点。TAL效应子有一些限制,例如目标必须以T开头,但它们仍然具有大约每35bp就可以找到的潜在目标位点。
Cre-Loxp
Cre-loxp是一个非常有趣的工具,该工具可用于在转基因动物、胚胎干细胞和(或)组织特异性细胞类型中创建特定的靶向DNA修饰。现已广泛用于控制基因表达、Cre重组酶在各种启动子的控制下或以其可诱导的形式对基因表达进行复杂的时空控制,尤其是在转基因小鼠研究中的应用尤为广泛。
Cre-loxp系统的组成及原理
Cre-loxp系统由源自P1噬菌体的两个成分组成:Cre重组酶和loxP识别位点。
Cre重组酶最初命名是因为它“引起重组( causes recombination)”,后来也称之为“环化重组酶(cyclization recombinase)”,它是一个38 kDa的蛋白质,在loxP识别位点负责分子内和分子间的重组。该系统的主要优势在于Cre的作用不依赖于任何其他辅助蛋白或辅因子,因此可广泛用于各类实验中。
LoxP((Locus of X(cross)-over in P1)则是位于P1噬菌体中的34bp序列,由两个13bp的反向回文序列和8bp的中间间隔序列共同组成,核心序列的不对称赋予了loxP位点方向性,典型的loxP序列为ATAACTTCGTATA-GCATACAT-TATACGAAGTTAT。loxP序列在除P1噬菌体之外的任何已知基因组中都不是天然存在的,并且由于足够长,几乎没有机会随机出现。因此,在DNA序列感兴趣的位置插入loxP位点可以进行非常特殊的操作。
具体原理
Cre重组酶介导两个loxP位点之间的位点特异性重组事件,这些位点可以位于相同或不同的DNA片段。单个loxP位点上,每个13 bp重复序列均被Cre蛋白识别并结合,形成二聚体。然后,两个loxP位点以平行方向排列,从而允许四个Cre蛋白形成四聚体。双链DNA断裂发生在每个loxP位点的核心间隔区内,然后两条链被连接,从而导致相互交换事件发生。
根据loxP位点的位置和方向,有以下三种情景:
- Inversion:当两个LoxP位点位于一条DNA链上但方向相反时,Cre重组酶能诱导两个LoxP位点间的序列翻转;
- Deletion:当两个LoxP位点位于一条DNA链上且方向相同,Cre重组酶能有效地敲除两个LoxP位点间的序列;
- Translocation:当两个LoxP位点分别位于两条不同的DNA链或染色体上,Cre重组酶能诱导两条DNA链发生交换或染色体易位。
However,从以上情景我们也可以看到在Cre酶存在时,三种情景的变化其实是可逆的,那么该如何使这种动态变化达到一种稳定状态呢?
如下图所示,通过引入两对不同的LoxP位点,经过两组LoxP点的两轮重组我们即可达到一种稳定状态,也就可以通过Cre的存在与否来控制基因的表达了。
具体原理如下:
图中的白色箭头对应的是LoxP位点,黑色箭头对应的是Lox-2722位点。这两种位点都能被CRE所识别,并在相同位点间发生重组,而不同位点之间不能发生重组。
发生重组时,方向相反的两个位点之间的序列会被颠倒,而方向相同的两个位点之间的序列被切除。
在图中,假设第一次重组发生在LoxP位点之间,原本反向插入在启动子后的目的基因(不表达),重组后变成顺式结构,能够被启动子驱动表达。第二次的重组发生在两个Lox-2722位点之间,它们的重组导致了中间的LoxP位点丢失,同时只保留下一个Lox-2722位点。最后剩下的Lox-2722和LoxP位点之间不能发生重组,所以整个基因结构便被固定下来。
在这个基础上,也就产生了DO(Cre-off)、DIO(Cre-on)和Cre-Switch(Cre-off/on)。这三种系统中,LoxP序列在同一条载体上,并且方向相同, 只是外源基因的插入方向不同。
◉ DO系统(Cre-off):插入基因与启动子方向一致,在Cre重组酶存在的情况下会发生重组导致基因方向反向,因此基因不表达,所以称之为Cre-Off;
◉ DIO系统(Cre-on):插入基因方向与启动子方向相反,在Cre重组酶不存在的情况下不表达,只有当Cre酶存在时,发生重组使基因方向与启动子方向一致,才能使该基因表达,因此该系统称之为Cre-On;
◉ FLEX系统(Cre-on):FLEX系统与DIO系统一致,只是LoxP位点方向与DIO系统不同。插入基因方向与启动子方向相反,在Cre重组酶不存在的情况下不表达,只有当Cre酶存在时,发生重组使基因方向与启动子方向一致,才能使该基因表达;
◉ Cre-Switch系统(Cre-off/on):对于Cre-Switch,则是在LoxP序列之间插入了两个阅读框,而这两个阅读框的方向相反,可以通过Cre酶的存在与否来控制这两个基因的表达。
Cre-loxp系统的优点
Cre-loxp系统是在神经系统中应用最广泛的条件性基因敲除工具,Cre-loxp系统优点如下:
◉ 高效性:Cre重组酶与具有LoxP位点的DNA片段形成复合物之后,可以提供足够的能力引发之后的DNA重组过程,重组过程简约高效;
◉ 特异性强:LoxP序列的唯一性,保证基因重组的特异性;
◉ 应用范围广:Cre重组酶可以在生物体不同的组织、不同的生理条件下发挥作用;
◉ 可由二型启动子启动表达:Cre重组酶的编码基因可由任何一种二型启动子驱动,由此保证Cre重组酶在生物体不同的细胞、组织、器官或者在不同的发育阶段或不同的生理条件下表达,从而实现较高的组织和细胞特异性。
Cre/loxp系统的应用
Cre/loxp系统是一种完善的研究工具,由于上述优点而应用广泛,尤其是在转基因小鼠领域。最常见的用途有:
◉ Cre依赖性基因表达:在目标基因上游放置两边都带有loxP位点的终止密码子(通常称为“ lox-stop-lox”或“ LSL”表达盒),在没有Cre重组酶的情况下,将阻止基因表达;在Cre存在的情况下,切除终止密码子,基因表达;
◉ Cre依赖性基因敲除:将loxP位点置于基因的两侧(称为“ floxing”,意为“flanked by loxP”),在Cre不存在时允许基因表达;当Cre存在时该基因表达将被破坏或删除;
◉ 选择标记的去除:在常规的小鼠编辑中,通常使用选择标记进行目标克隆筛选,但是在初始选择过之后,通常希望删除标记。此时通过对选择标记进行floxing处理,利用Cre可轻松执行此操作;
◉ 调节Cre表达:在发育的某些阶段通过将Cre置于特异性启动子下游,或通过将Cre置于诱导启动子(例如强力霉素诱导表达系统),这样Cre重组酶只能在指定的细胞中或指定的时间表达,同时结合上述一些loxP使用方法,可以进行不同要求的基因修饰。
CRISPR
CRISPR是细菌免疫系统的重要组成部分,可使细菌记住并破坏噬菌体。在基因编辑应用中,Cas9核酸内切酶通过gRNA序列进行靶向,从而诱导双链断裂。像ZFN和TALENs一样,CRISPR/Cas9也使用HDR,但是使用RNA来指定编辑使得该系统更便宜、更省时、更精确。与TALENs相比,CRISPR的应用更为广泛,每周都会有使用该技术发表的新论文。
CRISPR/Cas9系统有两个不同的组成部分:指导RNA(gRNA)和核酸内切酶,在上图中为Cas9。当在细胞中表达时,gRNA/Cas9复合物通过gRNA之间的碱基配对募集到靶序列及其在基因组DNA中的互补序列。为了使Cas9成功结合到DNA,基因组DNA中的靶序列不仅必须与gRNA序列互补,而且必须紧随其后的是正确的PAM(protospacer adjacent motif)序列。请注意,PAM序列存在于DNA靶序列中,但不存在于gRNA序列中,任何具有正确靶序列且后接PAM序列的DNA序列都将被Cas9结合。不同的cas9蛋白识别的PAM序列不同。
CRISPR/Cas9技术的应用
- 导致双链断裂:完整功能的CRISPR/Cas酶将根据gRNA序列在特定位置引入双链断裂(DSB)。DSBs优先通过非同源末端连接(NHEJ)在细胞中修复,该机制经常会导致DNA中引物插入或缺失(indels),插入缺失会导致移码功能等位基因缺失。
导致单链断裂:CRISPR/Cas切口酶突变体导致gRNA靶向的DNA单链断裂,而不是野生型Cas酶产生的双链断裂。使用切口酶突变体,需要两个gRNA,两个gRNA位于DNA的两条链,且两个gRNA的位置距离合适。
碱基编辑:将dCas9与胞苷脱氨酶蛋白融合,可以成为一种特定的碱基编辑器,可以改变DNA碱基而不会引起DNA断裂,该系统可以进行C→T转换(或相反链上的G→A转换)。
2019年10月21日发表在Nature上的文章"Search-and-replace genome editing without double-strand breaks or donor DNA”已经实现碱基任意转换与增删。
- 激活上调基因表达:将dCas9与转录激活肽融合可以增加特定基因的转录。合理设计gRNA序列以将dCas9激活子引导至感兴趣的基因的启动子或调控区域,实现基因的上调。
- 干扰下调基因表达:将dCas9与转录抑制肽(如KRAB)融合,可以通过干扰转录来降低基因表达。
Sleeping Beauty transposon
睡美人转座子(Sleeping Beauty transposon)系统由两个部分组成:SB转座酶(催化转座所需的酶) 和含有可在基因组内移位的基因表达盒的转座子。
睡美人转座子被证明是无需使用病毒载体即可产生特定基因突变和基因破坏的工具。睡美人转座子同样可用于基因组编辑,可以作为CRISPR/Cas9技术的一种有价值的替代工具,并且睡美人转座子的使用可能会在未来几十年内有所增长。
如上图:
- 转座子由位于质粒主链中目标基因(蓝色)侧翼的一组反向重复序列(绿色)组成。第二个质粒包含用于表达转座酶的转座酶基因(红色);
- 转座酶表达(红色星号)并结合反向重复序列(绿色);发生核酸内切酶反应,切割DNA;
- 释放的转座子可以与带有TA二核苷酸DNA链结合(在人类基因组中有许多这样的位点),除去转座子后,原始质粒为空,然后质粒被细胞降解;
- 转座酶在DNA中产生双链断裂,并允许转座子整合。
借助随手可得的多种强大有效的基因编辑方法,我们已经进入了基因编辑的黄金时代。相信在以后会有越来越多的工作将注重于完善这些技术,以确保基因编辑的高特异性和高活性。
【参考文献】
- Genesis. 2000 Feb;26(2):99-109. Cre recombinase: the universal reagent for genome tailoring;
- Nature. 2019 Oct 21. doi: 10.1038/s41586-019-1711-4. Search-and-replace genome editing without double-strand breaks or donor DNA;
- Plasmids 101: A Desktop Resource Created and Compiled by Addgene March 2017 (3rd Edition);
- CRISPR 101: A Desktop Resource Created and Compiled by Addgene May 2017 (2nd Edition).