为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

第二代高通量测序的三大巨头比拼.doc

2017-09-19 12页 doc 30KB 31阅读

用户头像

is_180829

暂无简介

举报
第二代高通量测序的三大巨头比拼.doc第二代高通量测序的三大巨头比拼.doc 第二代高通量测序的三大巨头比拼(之一) 第二代高通量测序准确率,延长度都明显优于第一代高通量测序,更重要的是,价格比第一代大幅度降低,使得高通量测序的产业化成为现实。第二代高通量测序仪的三大代表是Illumina公司的Solexa基因组分析仪(Illumina Genome Analyzer),罗氏公司(Roche)的454测序仪(Roch GS FLX sequencer)和ABI的SOLiD测序仪(ABI SOLiD se-quencer)。 摘要:第二代高通量测序准确率,延长...
第二代高通量测序的三大巨头比拼.doc
第二代高通量测序的三大巨头比拼.doc 第二代高通量测序的三大巨头比拼(之一) 第二代高通量测序准确率,延长度都明显优于第一代高通量测序,更重要的是,价格比第一代大幅度降低,使得高通量测序的产业化成为现实。第二代高通量测序仪的三大代是Illumina公司的Solexa基因组分析仪(Illumina Genome Analyzer),罗氏公司(Roche)的454测序仪(Roch GS FLX sequencer)和ABI的SOLiD测序仪(ABI SOLiD se-quencer)。 摘要:第二代高通量测序准确率,延长度都明显优于第一代高通量测序,更重要的是,价格比第一代大幅度降低,使得高通量测序的产业化成为现实。 一、Illumina公司的Solexa基因组分析仪 Illumina公司的新一代测序仪Genome Analyzer最早由Solexa公司研发,利用其专利核 ”,实现自动化样本制备及基因心技术“DNA簇”和“可逆性末端终结(reversible terminator) 组数百万个碱基大规模平行测序。Genome Analyzer作为新一代测序技术平台,具有高准确性,高通量,高灵敏度,和低运行成本等突出优势,可以同时完成传统基因组学研究(测序和注释)以及功能基因组学 (基因表达及调控,基因功能,蛋白/核酸相互作用)研究。 1、Genome Analyzer技术的基本原理: Solexa 方法是利用单分子阵列测试 genotyping ,此种测序法首先将 DNA 从细胞中提取,然后将其打断到约100,200bp大小,再将接头连接到片段上,经 PCR 扩增后制成 Library 。随后在含有接头的芯片(flow cell)上将已加入接头的 DNA 片段绑定在flow cell上,经反应,将不同片段扩增。在下一步反应中,四种荧光标记的染料应用边合成边测序的原理,在每个循环过程里,荧光标记的核苷和聚合酶被加入到单分子阵列中。互补的核苷和核苷酸片断的第一个碱基配对,通过酶加入到引物上。多余的核苷被移走。这样每个单链DNA分子通过互补碱基的配对被延伸,利用生物发光蛋白,比如萤火虫的荧光素酶,可通过碱基加到引物后端时所释放出的焦磷酸盐来提供检测信号。针对每种碱基的特定波长的激光激发结合上的核苷的标记,这个标记会释放出荧光。荧光信号被CCD采集,CCD快速扫描整个阵列检测特定的结合到每个片断上的碱基。通过上述的结合,检测可以重复几十个循环,这样就有可能决定核苷酸片断中的几十个碱基。 Solexa的这种方法,可在一个反应中同时加入4种核苷的标签,采用边合成边测序(SBS,sequencing by synthesis),可减少因二级结构造成的一段区域的缺失。并具有所需样品量少,高通量,高精确性,拥有简单易操作的自动化平台和功能强大等特点,此反应可以同时检测上亿个核苷酸片断 , 因此在同一个芯片或几个芯片上花费很少(只需常规方法的1,)的成本就可测试全基因组。 2、Solexa高通量测序技术特点: 1)可扩展的超高通量:Genome Analyzer系统目前每次运行后可获得超过20GB的高品质过滤数据。这个技术的可扩展性保证了更高的数据密度和输出,能用更少的经费完成更复杂的项目。到今年底,通量还有望上升到95 GB,相当于人类基因组的30倍覆盖度。 2)需要样品量少:Genome Analyzer系统需要的样品量低至100ng,能应用在很多样品有限的实验(比如免疫沉淀、显微切割等)中。这也是很多研究人员所考虑的因素。 3)简单、快速、自动化:Genome Analyzer 系统提供了最简单和简洁的工作。即使是最小的也能像大型基因组中心一样进行大规模的实验。制备样品文库可以在几小时内完成,一个星期内就能得到高精确度的数据。Cluster Station可以说是Genome Analyzer的核心。由独立软件控制的自动生成DNA簇的过程可以在5小时之内(30分钟手工操作)完成。这个自动化的流程不需要进行Emulsion PCR,减少了手工操作误差和污染可能性,也不需要机器人操作或洁净室。快速的实验流程使Genome Analyzer的能力增至最大,而自动化步移降低了项目的时间和费用。 4)新颖的测序化学技术:Genome Analyzer通过合成测序来支持大规模并行测序。利用新颖的可逆荧光标记终止子,可以在DNA链延伸的过程中检测单个碱基掺入。由于四个可逆终止子dNTP在每个测序循环都存在,自然的竞争减少了掺入的误差。 5)单个或配对末端支持:Genome Analyzer 系统支持单个片段或配对末端文库。文库构建过程简单,减少了样品分离和制备的时间。制备基因组DNA的单个片段或配对末端文库需要6个小时,只有3个小时需要手工操作。2×50个碱基或更长的读长增加了比对基因组的能力,并拓展了在其他方面的应用。 3、实验流程 1) 文库制备 将基因组DNA打成几百个碱基(或更短)的小片段,在片段的两个末端加上接头(adapter)。 2) 产生DNA簇 利用专利的芯片,其表面连接有一层单链引物,DNA片段变成单链后通过与芯片表面的引物碱基互补被一端“固定”在芯片上。另外一端(5’或3’)随机和附近的另外一个引物互补,也被“固定”住,形成“桥 (bridge) “。反复30轮扩增,每个单分子得到了1000倍扩增,成为单克隆DNA簇。DNA簇产生之后,扩增子被线性化,测序引物随后杂交在目标区域一侧的通用序列上。 3)测序 Genome Analyzer 系统应用了边合成边测序(Sequencing By Synthesis)的原理。加入改造过的DNA聚合酶和带有4种荧光标记的dNTP。 这些核苷酸是“可逆终止子”,因为3’羟基末端带有可化学切割的部分,它只容许每个循环掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3’端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列。目前的配对末端读长可达到2×50 bp,更长的读长也能实现,但错误率会增高。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。 4)数据分析 自动读取碱基,数据被转移到自动分析通道进行二次分析 4、Genome Analyzer系统得到国内外大型研究机构的认可 Genome Analyzer系统之所以如此畅销,关键在于其技术上的优势。根据去年底的数据,Genome Analyzer已售出约200台,估计是市场占有率最广的。前不久,华大基因再添置了12台,准备放在香港和深圳的实验室,至此华大基因已经有29台Genome Analyzer。而著名的麻省理工学院和哈佛大学Broad研究院拥有47台Illumina测序仪。众多实验室之所以 选择Illumina,看中的无疑是Genome Analyzer的高性价比。 上个月,Illumina将Genome Analyzer II升级到Genome Analyzer IIx,距年底实现单次运行获得95 GB数据的宏伟目标又近了一步。Genome Analyzer IIx有两个核心特征:其一是更大的试剂冷却器,支持超过100个测序循环,进一步提升了系统的易用性和自动化;其二是全新的流动池支架,让每轮运行所得的高质量数据增加20%。依靠系统软件和试剂的改进,Genome Analyzer IIx现在能够支持100 bp以上的配对末端读长,并在每次运行中产生超过20 GB的高质量数据。 第二代高通量测序的三大巨头比拼(之二) 摘要:罗氏公司 (Roche) 的 454 测序仪 结合了 DNA 扩增的乳胶系统 (emulsion system) 和皮升级焦磷酸 (pyrophosphate) 为基础的测序方法——焦磷酸测序 (pyrosequencing) 方法。 二、罗氏公司 (Roche) 的 454 测序仪 (Roch GS FLX sequencer) 罗氏 2005 年,在国际顶级的学术期刊《 Nature 》上,来自 454 生命科学公司的 Margulies 等人发表文章介绍了一种快速简单的测序方法:结合了 DNA 扩增的乳胶系统 (emulsion system) 和皮升级焦磷酸 (pyrophosphate) 为基础的测序方法——焦磷酸测序 (pyrosequencing) 方法。这是一种依靠生物发光进行 DNA 序列分析的新技术;在 DNA 聚合酶, ATP 硫酸化酶,荧光素酶和双磷酸酶的协同作用下,将引物上每一个 dNTP 的聚合与一次荧光信号释放偶联起来。通过检测荧光信号释放的有无和强度,就可以达到实时测定 DNA 序列的目的。此技术不需要荧光标记的引物或核酸探针,也不需要进行电泳;具有分析结果快速、准确、灵敏度高和自动化的特点。 1、GS FLX系统的工作流程 GS FLX 系统的流程概括起来,就是 “ 一个片段 = 一个磁珠 = 一条读长( One fragment = One bead = One read ) ” 。 1 ) 样品输入并片段化 : GS FLX 系统支持各种不同来源的样品,包括基因组 DNA 、 PCR 产物、 BAC 、 cDNA 、小分子 RNA 等等。大的样品例如基因组 DNA 或者 BAC 等被打断成 300 , 800 bp 的片段;对于小分子的非编码 RNA 或者 PCR 扩增产物,这一步则不需要。短的 PCR 产物则可以直接跳到步骤 3) 。 2 ) 文库制备 :借助一系列标准的分子生物学技术,将 A 和 B 接头( 3’ 和 5’ 端具有特异性)连接到 DNA 片段上。接头也将用于后续的纯化,扩增和测序步骤。具有 A 、 B 接头的单链 DNA 片段组成了样品文库。 3 ) 一个 DNA 片段,一个磁珠 :单链 DNA 文库被固定在特别设计的 DNA 捕获磁珠上。每一个磁珠携带了一个独特的单链 DNA 片段。磁珠结合的文库被扩增试剂乳化,形成油包水的混合物,这样就形成了只包含一个磁珠和一个独特片段的微反应器。 PCR 扩增 :每个独特的片段在自己的微反应器里进行独立的扩增,而没有其他4 ) 乳液 的竞争性或者污染性序列的影响。整个片段文库的扩增平行进行。对于每一个片段而言,扩增后产生了几百万个相同的拷贝。随后,乳液混合物被打破,扩增的片段仍然结合在磁珠上。 5 ) 一个磁珠,一条读长 :携带 DNA 的捕获磁珠随后放入 PTP 板中进行后继的测序。 PTP 孔的直径( 29um )只能容纳一个磁珠( 20um )。然后将 PTP 板放置在 GS FLX 中,测序开始。放置在四个单独的试剂瓶里的四种碱基,依照 T 、 A 、 C 、 G 的顺序依次循环进入 PTP 板,每次只进入一个碱基。如果发生碱基配对,就会释放一个焦磷酸。这个焦磷酸在 ATP 硫酸化酶和萤光素酶的作用下,经过一个合成反应和一个化学发光反应,最终将萤光素氧化成氧化萤光素,同时释放出光信号。此反应释放出的光信号实时被仪器配置的高灵敏度 CCD 捕获到。有一个碱基和测序模板进行配对,就会捕获到一分子的光信号;由此一一对应,就可以准确、快速地确定待测模板的碱基序列。这也就是大名鼎鼎的焦磷酸测序。 6 ) 数据分析 : GS FLX 系统在 10 小时的运行当中可获得 100 多万个读长,读取超过 4-6 亿个碱基信息。 GS FLX 系统提供两种不同的生物信息学工具对测序数据进行分析,适用于不同的应用:达 400 MB 的从头拼接和任何大小基因组的重测序。 GS FLX 系统的准确率在 99% 以上。其主要限制来自同聚物,也就是相同碱基的连续掺入,如 AAA 或 GGG 。由于没有终止元件来阻止单个循环的连续掺入,同聚物的长度就需要从信号强度中推断出来。这个过程就可能产生误差。因此, 454 测序平台的主要错误类型是插入 - 缺失,而不是替换。 2、 454 GS 测序系统的优点 数据高效获取 10 小时内可得到超过 1000000 条的序列,平均读长高达 450bp! 极大的拓展研究思路,大量的高读长的序列,为研究者提供更广阔的思路~获取等量数据,比传统方法的花费大大降低 , 454 Titanium 系统,可以帮助您: 1 )获取各个物种的基因组序列草图 2 )大规模 PCR 扩增产物测序 3 )寻找基因组中, Sanger 测序法不能发现的稀有突变 4 )开放阅读框 (ORF) 的鉴定,不同生物间的同源性分析,基因组结构概况分析 5 )鉴定不同菌株的保守区域,突变热点和基因插入或者缺失,了解药物抗性的遗传基础 6) 识别微生物产生的药物前体有关的基因或者途径,比较致病性和非致病性微生物的区别作为发展抗微生物药物的遗传学基础 7) 进行病毒基因组、 microRNA 、 SAGE 文库、 cDNA 文库和 BAC 文库的测序 第二代高通量测序的三大巨头比拼(之三) 摘要:第二代高通量测序的三大巨头比拼(之三)ABI的SOLiD测序仪 三、ABI的 SOLiD 测序仪 (ABI SOLiD se-quencer) SOLiD 全称为 supported oligo ligation detetion , SOLiD 系统是一个端到端的新一代基因组研究,包含测序组件、化学组件、计算集群和数据存储组件。这个平台基于通过寡核苷酸连接和检测进行测序。 它的独特之处在于以四色荧光标记寡核苷酸的连续连接合成为基础,取代了传统的聚合酶连接反应,可对单拷贝 DNA 片段进行大规模扩增和高通量并行测序。 与聚合酶测序方法不同的是, SOLiD 系统利用专利的逐步连接( stepwise ligation )技术来产生高质量的数据,可应用于全基因组测序、染色质免疫共沉淀( ChIP )、微生物测序、数字核型分析、临床测序、基因型分析、基因表达分析和小分子 RNA 的发现等等。 就通量而言, SOLiD 3 系统是革命性的,目前 SOLiD 3 单次运行可产生 50GB 的序列数据,相当于 17 倍人类基因组覆盖度。而其无以伦比的准确性、系统可靠性和可扩展性更让它从其他新一代测序平台中脱颖而出。为什么 SOLiD 能轻松实现貌似不可能的任务,让生物通带你从测序原理入手,一探究竟。 1、SOLiD工作流程 1)文库制备 SOLiD 系统能支持两种测序模板:片段文库 (fragment library) 或配对末端文库 (mate-paired library) 。使用哪一种文库取决于你的应用及需要的信息。片段文库就是将基因组 DNA 打断,两头加上接头,制成文库。如果你想要做转录组测序、 RNA 定量、 miRNA 探索、重测序、 3’, 5’-RACE 、甲基化分析、 ChIP 测序等,就可以用它。如果你的应用是全基因组测序、 SNP 分析、结构重排 / 拷贝数,则需要用配对末端文库。配对末端文库是将基因组 DNA 打断后,与中间接头连接,再环化,然后用 EcoP15 酶切,使中间接 头两端各有 27bp 的碱基,再加上两端的接头,形成文库。 2)乳液PCR/微珠富集 在微反应器中加入测序模板、 PCR 反应元件、微珠和引物,进行乳液 PCR ( Emulsion PCR )。 PCR 完成之后,变性模板,富集带有延伸模板的微珠,去除多余的微珠。微珠上的模板经过 3’ 修饰,可以与玻片共价结合。看到这里,是不是有一种似曾相识的感觉呢,那就对了,此步骤与 454 的 GS FLX 基本相同。不过 SOLiD 系统的微珠要小得多,只有 1 um 。 乳液 PCR 最大的特点是可以形成数目庞大的独立反应空间以进行 DNA 扩增。其关键技术是 “ 注水到油 ” ,基本过程是在 PCR 反应前,将包含 PCR 所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的 PCR 反应空间。理想状态下,每个小水滴只含一个 DNA 模板和一个 P1 磁珠,由于水相中的 P2 引物和磁珠表面的 P1 引物所介导的 PCR 反应,这个 DNA 模板的拷贝数量呈指数级增加, PCR 反应结束后, P1 磁珠表面就固定有拷贝数目巨大的同来源 DNA 模板扩增产物。 3)微珠沉积 3’ 修饰的微珠沉积在一块玻片上。在微珠上样的过程中,沉积小室将每张玻片分成 1 个、 4 个或 8 个测序区域。 SOLiD 系统最大的优点就是每张玻片能容纳更高密度的微珠,在同一系统中轻松实现更高的通量。 4)连接测序 这一步可就是 SOLiD 的独门秘笈了。它的独特之处在于没有采用惯常的聚合酶,而用了连接酶。 SOLiD 连接反应的底物是 8 碱基单链荧光探针混合物。连接反应中,这些探针按照碱基互补规则与单链 DNA 模板链配对。探针的 5’ 末端分别标记了 CY5 、 Texas Red 、 CY3 、 6-FAM 这 4 种颜色的荧光染料。探针 3’ 端 1 , 5 位为随机碱基,可以是 ATCG 四种碱基中的任何一种碱基,其中第 1 、 2 位构成的碱基对是表征探针染料类型的编码区,下图的双碱基编码矩阵规定了该编码区 16 种碱基对和 4 种探针颜色的对应关系,而 3 , 5 位的 “n” 表示随机碱基, 6 , 8 位的 “z” 指的是可以和任何碱基配对的特殊碱基。 单向 SOLiD 测序包括五轮测序反应,每轮测序反应含有多次连接反应。第一轮测序的第一次连接反应由连接引物 “n” 介导,由于每个磁珠只含有均质单链 DNA 模板,所以这次连接反应掺入一种 8 碱基荧光探针, SOLiD 测序仪下探针第 1 、 2 位编码区颜色信息,随后的化学处理断裂探针 3’ 端第 5 、 6 位碱基间的化学键,并除去 6~8 位 碱基及 5’ 末端荧光基团,暴露探针第 5 位碱基 5’ 磷酸,为下一次连接反应作准备。因为第一次连接反应使合成链多了 5 个碱基,所以第二次连接反应得到模板上第 6 、 7 位碱基序列的颜色信息,而第三次连接反应得到的是第 11 、 12 位碱基序列的颜色信息 …… 几个循环之后,引物重置,开始第二轮的测序。由于第二轮连接引物 n-1 比第一轮错开一位,所以第二轮得到以 0 , 1 位起始的若干碱基对的颜色信息。五轮测序反应反应后,按照第 0 、 1 位,第 1 、 2 位 ... … 的顺序把对应于模板序列的颜色信息连起来,就得到由 “0 , 1 , 2 , 3…” 组成的 SOLiD 原始颜色序列。 5 )数据分析 SOLiD 测序完成后,获得了由颜色编码组成的 SOLiD 原始序列。理论上来说,按照 “ 双碱基编码矩阵 ” ,只要知道所测 DNA 序列中任何一个位置的碱基类型,就可以将 SOLiD 原始颜色序列 “ 解码 ” 成碱基序列。但由于双碱基编码规则中双碱基与颜色信息的简并特性(一种颜色对应 4 种碱基对),前面碱基的颜色编码直接影响紧跟其后碱基的解码,所以一个错误颜色编码就会引起 “ 连锁解码错误 ” ,改变错误颜色编码之后的所有碱基。 和其它所有测序仪一样,测序错误在所难免,关键是对测序错误的评价和后续处理。由于 SOLiD 系统采用了双碱基编码技术,在测序过程中对每个碱基判读两遍,从而减少原始数据错误,提供内在的校对功能。这样,双保险确保了 SOLiD 系统原始碱基数据的准确度大于 99.94% ,而在 15X 覆盖率时的准确度可以达到 99.999% ,是目前新一代基因分析技术中准确度最高的。 为避免 “ 连锁解码错误 ” 的发生, SOLiD 数据分析软件不直接将 SOLiD 原始颜色序列解码成碱基序列,而是依靠 reference 序列进行后续数据分析。 SOLiD 序列分析软件首先根据 “ 双碱基编码矩阵 ” 把 reference 碱基序列转换成颜色编码序列,然后与 SOLiD 原始颜色序列进行比较,来获得 SOLiD 原始颜色序列在 reference 的位置,及两者的匹配性信息。 Reference 转换而成的颜色编码序列和 SOLiD 原始序列的不完全匹配主要有两种情况: “ 单颜色不匹配 ” 和 “ 两连续颜色不匹配 ” 。由于每个碱基都被独立地检测两次,且 SNP 位点将改变连续的两个颜色编码,所以一般情况下 SOLiD 将单颜色不匹配处理成测序错误,这样一来, SOLiD 分析软件就完成了该测序错误的自动校正;而连续两颜色不匹配也可能是连续的两次测序错误, SOLiD 分析软件将综合考虑该位置颜色序列的一致性及质量值来判断该位点是否为 SNP 。 2、SOLiD系统的优点所在 1 )高的测序通量:测序通量大于 20GB/ 次,读长可达 50 个碱基(随机片段测序)和 2×50 个碱基(末端配对测序); 2 )无可匹敌的准确度:基于连接反应高度可靠的测序技术,创新的双碱基编码技术,可选择性重复连接反应步骤; 3 )系统的易操作性:样品制备支持随机片段文库和最高达 10Kb 插入片段的末端配对文库。无人式的工作模式结合简单操作流程和流水线式自动数据分析为您提供高效的研究平台; 4 )系统的灵活性:两个独立控制的流动池,可以进行一张或二张玻片的同时分析。开放式高密度磁珠沉置,每张玻片可分为 1 个, 4 个或 8 个测序区域,支持多重技术 Barcode , 支持更高密度的微珠富集。开放式玻片形式、微珠富集、以及软件算法的结合,能使平台轻松升级到更高的通量,而无需对基础技术和配置做重大改变; 5 )应用广泛灵活:超高通量的数据支持大规模测序和结构变异性分析。独特的双碱基编码特性使系统具备自检功能,对单核苷酸多态性( SNP )的检测精确率可以达到最高。以最大通量的标签实验为应用的基础,可以为全转录组、染色质免疫共沉淀( ChIP )和小 RNA ,甲基化研究等提供高度敏感的检测方法。
/
本文档为【第二代高通量测序的三大巨头比拼.doc】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索