问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

测序原理:一代二代三代测序原理详解

创作时间:
作者:
@小白创作中心

测序原理:一代二代三代测序原理详解

引用
简书
1.
https://www.jianshu.com/p/26c32b777a16?utm_campaign=hugo

测序技术是现代生物科学研究的重要工具,它的发展经历了三代技术的演进。从最初的Sanger测序到现在的单分子实时测序和纳米孔测序,每一次技术革新都极大地推动了生命科学研究的进步。本文将详细介绍这三代测序技术的工作原理、特点及应用。

一代测序(Sanger测序)

一代测序技术,也称为Sanger测序,采用双脱氧链终止法。该方法基于DNA复制原理,反应体系中包含目标DNA片段、脱氧三磷酸核苷酸(dNTP)、双脱氧三磷酸核苷酸(ddNTP)、测序引物及DNA聚合酶等。其中,ddNTP是核心,由于缺少3'-OH基团,无法与另一个dNTP连接形成磷酸二酯键,因此可以用来终止DNA链的延伸。此外,ddNTP上连接有放射性同位素或荧光标记基团,便于后续检测。

设置四个反应体系,分别加入引物、DNA聚合酶、四种dNTP、一定比例的ddNTP(带有放射性标记)。例如,第一个反应体系中加入ddATP,负责测定T碱基的位置;依次类推,第二个反应体系加入ddCTP,第三个加入ddTTP,第四个加入ddGTP。在扩增过程中,ddNTP遇到相应的碱基位点时会结合并终止延伸。经过一段时间的反应,大量的ddNTP会结合到所有测序位点。

最后通过凝胶电泳和放射自显影技术,只能看到带有荧光标记的ddNTP。通过分析电泳条带的前后关系,再利用A-T, T-A, C-G, G-C的碱基配对关系,可以确定测序序列。

一代测序技术的主要特点包括:

  • 测序读长可达1000bp
  • 准确性高达99.999%
  • 通量低,成本高
  • 目前主要用于验证序列和基因组组装完整性

二代测序(Sequencing by Synthesis, SBS)

二代测序技术的代表包括Roche公司的454技术、Illumina公司的Solexa/Hiseq技术和ABI公司的SOLID技术。其中,Illumina公司的技术占据了75%以上的市场份额,主要包括Miseq和Hiseq平台。下面主要介绍Illumina平台的PE(Pair End双端)测序原理。

文库构建

在二代测序中,首先需要构建DNA文库。这个过程包括以下几个关键步骤:

  1. 打断DNA:将长DNA片段打断成短片段,以便后续处理。
  2. 末端补平:打断后会出现末端不平整的情况,使用酶进行补平处理。
  3. 加A尾:在3'端使用酶加上一个特异的碱基A,便于后续的互补配对。
  4. 连接接头:加上A之后,可以利用互补配对的原则,加上adapter。这个adapter可以分成两个部分,一部分是测序时需要用的引物序列,另一部分是建库扩增时需要用的引物序列。
  5. PCR扩增:对DNA样品进行PCR扩增,使其浓度达到上机要求。

测序原理

二代测序的核心是边合成边测序(Sequencing by Synthesis, SBS)技术。具体过程如下:

  1. 上样:将构建好的文库中的待测序列配置到一定浓度,通过flowcell进行吸附。flowcell是用于吸附流动DNA片段的槽道,测序就在此进行。在特异的化学试剂作用下,DNA片段会强力随机地附着在lane上,与上面的短序列配对。

  2. 桥式PCR:在flowcell表面进行桥式PCR扩增。第一轮扩增模版是flowcell表面固定的序列。扩增后,通过NaOH强碱性溶液使双链DNA变性,互补链由于和lane上短序列强力连接固定住了;模板链则被洗脱。然后通过桥式形成,加入缓冲溶液,互补链的p7‘和lane上的p7互补,形成桥状结构。经过大约35个循环后,每个DNA片段都会在各自的位置上集中成束,形成cluster,这是一群完全相同的序列。最终通过甲酰胺基嘧啶糖苷酶(Fpg)选择性切除lane上p5‘连接的链,只留下与lane p7连接的链即Forward Strand。

  3. 测序:测序过程包括Forward Strand测序、Index测序和Reverse Strand测序三个阶段。

  • Forward Strand测序:首先primer结合到靠近p5的sequencing primer binding site1上,加入特殊的dNTP(其3’羟基被叠氮基团替代,每次只能添加一个dNTP;还含有荧光基团,能激发不同颜色)。在dNTP被添加到合成链上后,所有未使用的游离dNTP和DNA聚合酶会被洗脱掉;再加入激发荧光缓冲液,用激光激发荧光信号,光学设备记录荧光信号,计算机将光学信号转化为测序碱基。如此重复直至所有链的碱基序列被检测出,得到Forward Strand序列。

  • Index测序:在Forward Strand测序结束后,read product被冲掉,index1 primer和链上的index1互补配对,进行index1的检测。测完后,洗脱产物,得到index1的序列。接下来p5与lane上的p5‘配对,测得了index2,并洗脱。

  • Reverse Strand测序:洗脱掉index2产物后,进行桥式扩增,得到双链,再变性得到原始Forward strand和新的Reverse Strand,除去测完的Forward strand。然后和测Forward一样,也是先连接primer,只是连接的位点是Primer Binding Site2,测完后得到reverse strand序列。

数据产生

Hiseq2000测序仪搭配了两个flowcell,简称双流动槽。比较经典的Hiseq2500一次能产出700-800Gb数据(此处Gb为测序碱基数,不同于字节数的Gb)。数据量计算公式为:数据量=单端reads长度 * 单端reads个数 * 2(PE)。测序深度计算公式为:测序深度=数据量大小 / 参考基因组大小。

第三代测序技术

第三代测序技术以PacBio公司的SMRT和Oxford Nanopore Technologies的纳米孔单分子测序技术为标志,被称之为第三代测序技术。与前两代相比,最大的特点就是单分子测序,测序过程无需进行PCR扩增,超长读长,平均达到10Kb-15Kb,是二代测序技术的100倍以上,值得注意的是在测序过程中这些序列的读长也不再是相等的。

PacBio SMRT

PacBio SMRT技术其实也应用了边合成边测序的思想,并以SMRT芯片为测序载体(如同flowcell)。基本原理是:DNA聚合酶和模板结合,用4色荧光标记A,C,G,T这4种碱基(即是dNTP)。在碱基的配对阶段,不同的碱基加入,会发出不同的光,根据光的波长与峰值可判断进入的碱基类型。

这个DNA聚合酶是实现超长读长的关键之一,读长主要跟酶的活性保持有关,它主要受激光对其造成的损伤所影响。PacBio SMRT技术的一个关键点是在于如何将反应信号与周围游离碱基的强大荧光背景区别出来。他们利用的是ZMW(零模波导孔)原理:如同微波炉壁上可看到的很多密集小孔。这些小孔的直径是有严格要求的,如果直径大于微波波长,能量就会在衍射效应的作用下穿透面板从而泄露出来(光波的衍射效应),从而与周围小孔相互干扰(光波的干涉)。如果孔径能够小于波长,那么能量就不会辐射到周围,而是保持直线状态,从而可起到保护的作用。同理,在一个反应管(SMRTCell:单分子实时反应孔)中有许多这样的圆形纳米小孔,,即 ZMW(零模波导孔),外径100多纳米,比检测激光波长小(数百纳米),激光从底部打上去后不会穿透小孔进入上方的溶液区,能量会被限制在一个小范围(体积20X 10-21 L)里,正好足够覆盖需要检测的部分,使得信号仅仅只是来自于这个小反应区域,孔外过多的游离核苷酸单体依然留在黑暗中,从而实现将背景噪音降到最低的目的。

PacBio SMRT技术除了能够检测普通的碱基之外,还可以通过检测相邻两个碱基之间的测序时间,来检测碱基的表观修饰情况,如甲基化。因为假设某个碱基存在表观修饰,则通过聚合酶时的速度会减慢,那么相邻两峰之间的距离会增大,我们可以通过这个时间上的差异来检测表观甲基化修饰等信息。

SMRT技术的测序速度很快,每秒约10个dNTP。但这么快的测序速度也带来了一些明显的缺点——测序错误率比较高(这几乎是目前单分子测序技术的通病),可以达到10%-15%,而且以缺失序列和错位居多,但好在它的出错是随机的,并不会像第二代测序技术那样存在一定的碱基偏向(PCR biasing),因此可以通过多次测序来进行有效纠错。

Oxford Nanopore

这个技术的关键点在于他们所设计的一种特殊纳米孔,孔内共价结合分子接头。当DNA分子通过纳米孔时,它们使电荷发生变化,从而短暂地影响流过纳米孔的电流强度(每种碱基所影响的电流变化幅度是不同的),最后高灵敏度的电子设备检测到这些变化从而鉴定所通过的碱基。

纳米孔测序以及其他第三代测序技术,有可能会彻底地解决目前第二代测序平台的诸多不足。另外,MinION的主要特点是:读长很长,而且比PacBio的都长得多,基本都是在几十kb上百kb以上,最新的数据显示可以达到900 kb!错误率是5%-15%,也是随机错误,MinION最大的特点除了极小的体积之外,就是数据将是可实时读取/的,并且起始DNA在测序过程中不被破坏!这种纳米孔单分子测序仪还有另一大特点,它能够直接读取出甲基化的胞嘧啶,而不必像二代测序方法那样需要事先对基因组进行bisulfite(酸性亚硫酸盐)处理。这对于在基因组水平直接研究表观遗传相关现象有极大的帮助。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号