为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 转录组转录组及转录组测序

转录组转录组及转录组测序

2019-02-23 21页 doc 47KB 76阅读

用户头像

is_995397

暂无简介

举报
转录组转录组及转录组测序第一章转录组及转录组测序 第一节前言 1953年,沃森与克里克对DNA双螺旋结构的精确描绘开创了生命科学的黄金时代,随后如火如荼的开展起来的人类基因组计划建立起庞大复杂的基因组数据库使人类对了解生命本源和控制生命进程燃起无限憧憬。随着越来越多的基因测序工作渐渐完成,一本“写满生命密码的天书”呈现在我们面前, 然而,接下来的问题更纷扰而至: 1) 这些基因有什么功能? 2) 不同的基因参与了哪些细胞内不同的生命过程? 3) 基因的表达是如何调控的呢? 4) 基因与基因产物之间是如何相互作用的呢? 5) 相同的基因...
转录组转录组及转录组测序
第一章转录组及转录组测序 第一节前言 1953年,沃森与克里克对DNA双螺旋结构的精确描绘开创了生命科学的黄金时代,随后如火如荼的开展起来的人类基因组计划建立起庞大复杂的基因组数据库使人类对了解生命本源和控制生命进程燃起无限憧憬。随着越来越多的基因测序工作渐渐完成,一本“写满生命密码的天书”呈现在我们面前, 然而,接下来的问题更纷扰而至: 1) 这些基因有什么功能? 2) 不同的基因参与了哪些细胞内不同的生命过程? 3) 基因的表达是如何调控的呢? 4) 基因与基因产物之间是如何相互作用的呢? 5) 相同的基因在不同的细胞内的表达水平有差异吗? 6) 相同的基因处于疾病和治疗状态下的表达水平会有哪些改变? 如何读懂这本“天书”是目前横亘在科学家们面前严峻的挑战。 因此,在人类基因组项目后,转录组学,蛋白组学,代谢组学等组学不断涌现,生命科学研究已经跨入后基因组时代。其中,转录组学作为一个率先发展起来的学科是研究细胞表型和功能的一个重要手段,转录组高通量测序技术开始在生物学前沿研究中得到了广泛的应用。 第二节转录组(transcriptome)与转录组学(transcriptomics) 读懂基因组这本“天书”,最先要研究清楚基因是怎么表达的。所谓基因表达,是指将基因携带的遗传信息转变为可辨别的表型的整个过程。基因表达的第一步, 也即基因表达调控的关键环节,是以DNA为合成RNA的转录过程。转录后的所有mRNA的总称即转录组。由转录组延伸出来一门学科即转录组学,它是分子生物学的分支,负责研究在单个细胞或一个细胞群的特定细胞类型内所产生的mRNA分子,是从RNA层次研究基因表达的情况。 第三节转录组研究的重要性 转录组是连接基因组遗传信息与生物功能的蛋白质组的纽带,转录水平的调控是最重要也是目前研究最广泛的生物体调控方式。转录组的研究比基因组的研究能给出更高效的有用信息。比如,人类基因组包含有30亿个碱基对,其中大约只有5万个基因转录成mRNA分子,而转录后的mRNA仅部分被翻译生成功能性的蛋白质。与基因组不同,转录组更有时间空间性。比如,我们人体大部分细胞具有一模一样的基因,而即使同一细胞在不同的生长时期及生长环境下,其基因表达情况也是不完全相同的。所以,除了异常的mRNA降解现象(如转录衰减)以外,转录组反映的是特定条件下活跃表达的基因。 同时,蛋白质组研究需要更多的转录组研究的信息。因为单一的蛋白质组数据不足以清楚地鉴定基因的功能,因此蛋白质组的数据也需要转录组的研究结果加以印证。因此,转录组的研究可以提供什么条件下什么基因表达什么信息,从而推断相应未知基因的功能,揭示特定调节基因的作用机制。通过对转录组的研究,科研人员还可以确定不同种类的细胞和组织的基因在何时何地被激活或进入睡眠,对转录本的定量可以了解特定基因的活性和表达量,用于疾病的诊断和治疗,比如与癌症相关的基因表达量的改变可以帮助我们揭开癌症的秘密。通过对转录组的研究,也让个性化医疗的目标,从共性转移到个性,成为可能。 第四节转录组测序 真核生物的基因由三类RNA聚合酶进行转录:RNA聚合酶I和III负责种类稀少、功能重要的看家非编码RNA基因的转录,包括rRNA,tRNA,snoRNA,snRNA等。由这两类 RNA聚合酶转录的非编码RNA属于看家RNA,在各种生理和病理状态下都被高水平转录,转录产物占细胞内RNA总量的95%以上,不是生命科学研究前沿领域的主要关注对象。相反地,RNA 聚合酶II负责蛋白质编码基因和调控非编码RNA的转录,在真核生物的不同生理和病理状态下表达量被严格调控,一直吸引着各生命科学研究领域的重点关注。无比幸运的是,由RNA聚合酶II生成的转录的末端均含有3’端多聚腺苷尾【3’poly(A) tail】。转录组测序一般是对用多聚胸腺嘧啶(oligo-dT)进行亲和纯化的RNA聚合酶II转录生成的成熟mRNA和ncRNA进行高通量测序。这样的数据有效排除了看家非编码RNA 的干扰,可以通过一次测序获得一种细胞内几乎所有重要基因的表达参数。 基于高通量测序平台的转录组测序技术使能够在单核苷酸水平对任意物种的整体转录活动进行检测,在分析转录本的结构和表达水平的同时,还能够发现未知转录本和稀有转录本,精确的识别可变剪接位点以及cSNP(编码序列单核苷酸多态性),提供最全面的转录组信息。相对于传统的芯片杂交平台,转录组测序无需预先针对已知序列设计探针,即可对任意物种的整体转录活动进行检测,提供更精确的数字化信号,更高的检测通量以及更广泛的检测范围,是目前深入研究转录组复杂性的强大工具。 随着二代测序技术的发展,测序成本大幅度降低,大规模转录组测序将成为转录组研究的重要方法。多项研究已经表明,二代测序技术的应用,能有效改善诸如EST 、SAGE 、CAGE、MPSS 、PET 和全长cDNA测序等传统转录组研究方法的结果,使之得到大大的提升。基于转录组高通量测序的种种技术优势,此种技术应用范围较广,主要有转录本结构研究(基因边界鉴定、可变剪接研究等),转录本变异研究(如基因融合、编码区SNP研究),非编码区域功能研究(Non-coding RNA研究、microRNA前体研究等),基因表达水平研究以及全新转录本发现。 第二章高通量测序 第一节测序技术的发展 测序技术最早是在20世纪70年代,是用双脱氧终止法[1]和化学降解法[2-3]测定多聚核糖核苷酸序列,也就是我们今天说第一代测序。双脱氧核苷酸末端终止测序法是利用ddNTP 在DNA合成反应中不能形成磷酸二酯键的原理来中断DNA的合成反应。在反应体系中加入一定量的带有放射性同位素标记的ddNTP,通过凝胶电泳和放射自显影技术,根据电泳带的位置确定待测分子的DNA序列。化学降解法是用特定的化学试剂去标记碱基然后用化学方法打断待测序列,再用电泳方法读出序列。两者有很明显的区别:双脱氧核苷酸末端终止测序法是利用ddNTP随机中断合成待测序列,化学降解法是用特定化学试剂标记碱基再用化学方法降解成待测序列。 由于操作放射性同位素标记在某些方面很繁琐,80年代中期,有人以荧光标记代替了放射性同位素标记、以荧光信号接收器和计算机信号分析系统代替放射自显影[4]。90年代中期,也有毛细管电泳技术的出现大大提高了测序的通量[5]。另外,在这一时期,也出现了一些其他测序方法,比如焦磷酸测序法[6],其实就是后来Roche公司的454技术;还有连接酶测序法[7],也就是后来ABI公司的SOLiD技术。 大家熟知的人类基因组测序,当时只有第一代测序,完成整个人类基因组计划花费了30亿美元和三年时间。其成本之高,速度之慢激发了人们不断的创新,终于有了第二代测序技术,简称高通量测序技术。与第一代相比,没有了高成本、慢速度,拿人类基因组计划来说, 原来30亿美元和三年时间等同于现在一周时间和低成本。当然我们也不能完全就摒弃掉第一代测序,因为高通量测序技术产生的测序结果较短,更适合于对已知序列的基因组进行重新测序,对全新的基因组测序还要结合第一代测序技术。 第二节高通量测序 高通量测序技术(High-throughput sequencing)又称“第二代”测序技术("Next-generation" sequencing technology)[8],以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。同时,高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(deep sequencing)。第二代高通量测序准确率,延长度都明显优于第一代高通量测序,更重要的是,价格比第一代大幅度降低,使得高通量测序的产业化成为现实。除此之外,高通量测序还具有很多普通测序技术没有的优势。 1. 可扩展的高通量 Genome Analyzer系统每次配对末端运行后可以得到超过20Gb的高质量过滤数据。这个技术的可扩展性保证了更高的数据密度和输出,能用更少的经费完成更复杂的项目。 2. 需要样品量少 Genome Analyzer系统需要的样品量低至100ng,能应用在很多样品有限的实验中,如免疫沉淀、显微切割等。 3. 简单、快速、自动化 Genome Analyzer系统提供了最简单和简洁的工作流程。样品文库制备可以在几小时内完成,一个星期内就能获得高精确度的数据。 4. 新颖的测序化学技术 Genome Analyzer利用新颖的可逆荧光标记终止子,可以在DNA链延伸的过程中检测单个碱基掺入。由于四个可逆终止子dNTP在每个测序循环都存在,自然竞争减少了掺入的误差。 5. 单个或配对末端支持 Genome Analyzer系统支持单个片段或配对末端文库。文库构建过程简单,减少了样品分离和制备的时间。制备基因组DNA的单个片段或配对末端文库需要6h,手工操作只需3h。 第三节高通量测序技术的应用 测序技术推进科学研究的发展,随着第二代测序技术的迅猛发展,科学界也开始越来越多地应用第二代测序技术来解决生物学问题,应用领域也较为广泛,主要应用如下: 1. 重头测序(de novo sequencing) 在基因组水平上对还没有参考序列的物种进行重头测序(de novo sequencing),获得该物种的参考序列,为后续研究和分子育种奠定基础; 2. 重测序(resequencing) 对有参考序列的物种,进行全基因组重测序(resequencing),在全基因组水平上扫描并检测突变位点,发现个体差异的分子基础[9]; 3. 全转录组测序(whole transcriptome resequencing) 在转录组水平上进行全转录组测序(whole transcriptome resequencing),从而开展可变剪接、编码序列单核苷酸多态性(cSNP)等研究; 4. 小分子RNA测序(small RNA sequencing) 进行小分子RNA测序(small RNA sequencing),通过分离特定大小的RNA分子进行测序,从而发现新的microRNA分子[10-11]; 5. 染色质免疫共沉淀测序(ChIP-seq) 染色质免疫共沉淀技术是研究DNA-蛋白质相互作用的经典技术,广泛应用于组蛋白修饰、特定转录因子调控作用等相关领域[12-13]。在转录组水平上,与染色质免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技术相结合,从而检测出与特定转录因子结合的DNA 区域和基因组上的甲基化位点。 目前,高通量测序开始广泛应用于寻找疾病的候选基因上。内梅亨大学的研究人员使用这种方法鉴定出Schinzel-Giedion 综合征中的致病突变,Schinzel-Giedion综合征是一种导致严重的智力缺陷、肿瘤高发以及多种先天性畸形的罕见病。他们使用Agilent SureSelect序列捕获和对四位患者的外显子组进行测序,聚焦于全部四位患者都携带变异体的12个基因,最终将候选基因缩小至1个。而贝勒医学院基因组测序中心也计划对15种以上疾病进行研究,包括脑癌、肝癌、胰腺癌、结肠癌、卵巢癌、膀胱癌、心脏病、糖尿病、自闭症以及其他遗传疾病,以更好地理解致病突变以及突变对疾病的影响。 参考文献 1. Sanger, F., S. Nicklen, and A.R. Coulson, DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A, 1977. 74(12): p. 5463-7. 2. Whitfeld, P.R., A method for the determination of nucleotide sequence in polyribonucleotides. Biochem J, 1954. 58(3): p. 390-6. 3. Maxam, A.M. and W. Gilbert, A new method for sequencing DNA. Proc Natl Acad Sci U S A, 1977. 74(2): p. 560- 4. 4. Automatableprocessforsequencingnucleotide. 5. Heiger, D.N., A.S. Cohen, and B.L. Karger, Separation of DNA restriction fragments by high performance capillary electrophoresis with low and zero crosslinked polyacrylamide using continuous and pulsed electric fields. J Chromatogr, 1990. 516(1): p. 33-48. 6. Hyman, E.D., A new method of sequencing DNA. Anal Biochem, 1988. 174(2): p. 423-36. 7. Pfeifer, G.P., et al., In vivo footprint and methylation analysis by PCR-aided genomic sequencing: comparison of active and inactive X chromosomal DNA at the CpG island and promoter of human PGK-1. Genes Dev, 1990. 4(8): p. 1277-87. 8. Shaffer, C., Next-generation sequencing outpaces expectations. Nat Biotechnol, 2007. 25(2): p. 149. 9. Hillier, L.W., et al., Whole-genome sequencing and variant discovery in C. elegans. Nat Methods, 2008. 5(2): p. 183-8. 10. Jagadeeswaran, G., et al., Deep sequencing of small RNA libraries reveals dynamic regulation of conserved and novel microRNAs and microRNA-stars during silkworm development. BMC Genomics, 2010. 11: p. 52. 11. Zhang, H., et al., Genome-wide analysis of small RNA and novel MicroRNA discovery in human acute lymphoblastic leukemia based on extensive sequencing approach. PLoS One, 2009. 4(9): p. e6849. 12. Wallerman, O., et al., Molecular interactions between HNF4a, FOXA2 and GABP identified at regulatory DNA elements through ChIP-sequencing. Nucleic Acids Res, 2009. 37(22): p. 7498-508. 13. Zhang, Z.D., et al., Modeling ChIP sequencing in silico with applications. PLoS Comput Biol, 2008. 4(8): p. e1000158. 第三章三种常见的测序平台 第一节Illumina Genome Analyzer 1. 历史渊源 Solexa技术最早由两位剑桥大学的化学家创立,利用专利核心技术“DNA 簇”和“可逆性末端终结”,达成自动化样本制备及基因组数百万个碱基大规模平行测序,2007年,Illumina 公司花费6亿美金的巨资收购了Solexa,利用其专利核心技术,实现自动化样本制备及基因组数百万个碱基大规模平行测序。 Genome Analyzer作为新一代测序技术平台,具有高准确性,高通量,高灵敏度,和低运行成本等突出优势,可以同时完成传统基因组学研究(测序和注释)以及功能基因组学(基因表达及调控,基因功能,蛋白/核酸相互作用)研究。 2. Genome Analyzer IIx测序技术原理 1)文库制备 将基因组DNA打成几百个碱基(或更短)的小片段,并在两个末端加上接头(adapter)。 2)桥式PCR产生DNA簇 a、Solexa 测序专用的测序芯片(flow cell)表面连接有一层单链引物(Primer),单链状 态的DNA片断与芯片表面的引物通过碱基互补被一端固定在芯片上; b、通过扩增反应使得单链DNA成为双链DNA; c、双链再次变性后成为单链,其一端固定在测序芯片上,另外一端(5’或3’)随机 和附近的另外一个引物互补,被固定住,形成“桥“(bridge); d、在测序芯片上同时有上千万DNA 单分子发生以上的反应; e、c 中形成的单链桥,以周围的引物为扩增引物,在测序芯片表面再次进行扩增,形 成双链; f、双链经变性成单链,再次形成桥,成为下一轮扩增的模板继续扩增反应; g、在反复进行30 多轮扩增,每个单分子得到了1000 倍扩增,成为单克隆“DNA簇群”; h、“DNA簇群”在Genome Analyzer IIx测序仪上进行序列分析; 3)测序反应 Illumina Genome AnalyzerIIx是一种基于单分子簇的边合成边测序技术,基于专有的可逆终止化学反应原理。测序时加入带有4种荧光标记的dNTP,每个碱基末端被保护基团封闭,每个循环只充许单个碱基合成,经过扫描,读取该次反应后后的荧光信号结果,该保护基团被除去,下一个反应可继续进行,如此反复,得出碱基的精确序列。 3. illumina测序平台的特点 1)可控制的高通量 Genome Analyzer IIx系统一次实验可读取量大于15 亿个碱基/芯片 2)上样需求低 Genome Analyzer系统需要DNA样品的上样量只在pmol级(ng级),并且能应用在很多样品有限的实验(比如ChIP-seq、Trscriptome- Sequencing,microRNA-seq)中。 3)简单、快速、自动化 这个优势体现在:最小的实验室也能像大型基因组中心一样进行大规模的实验。制备样品文库可以在几小时内完成,一个星期内就能得到高精确度的数据。由独立软件控制的自动生成DNA簇的过程可以在5小时之内(30分钟手工操作)完成。这个自动化的流程不需要进行Emulsion PCR,减少了手工操作误差和污染可能性,也不需要机器人操作或洁净室。快速的实验流程使Genome Analyzer的能力增至最大,而自动化步移降低了项目的时间和费用。 4)低错误测序比例 利用新颖的可逆荧光标记终止子,可以在DNA链延伸的过程中检测单个碱基掺入。由于四个可逆终止子dNTP在每个测序循环都存在,自然的竞争减少了掺入的错配。 第二节454/Roche FLX System 1. 历史渊源 454公司的的创始人Jonathan Rothberg博士,也是大规模并行测序的发明者。上世纪90年代,很多学者也都想到了大规模并行测序,但都没有成功。1999年Rothberg博士的儿子出世,小家伙出生后被送入婴儿特护病房,Rothberg非常担心,甚至想获取儿子的基因组信息。这段担惊受怕的经历给了他灵感,他突然意识到焦磷酸测序(pyrosequencing)不仅简单,而且具有可扩展性。之后,就开始着手,逐步解决了测序硬件的设计和制造问题以及样品制备问题。最后,证实了基于焦磷酸测序的可能性。这种测序方法比传统的Sanger测序的方法快100倍,假如利用这种方法来进行人类基因组的测序,那么在100多天内就可以完成。在2005年年底,454公司的研究人员将这种崭新的测序技术转化成了商品化的仪器——Genome Sequencer 20 系统。GS 20的出现,揭开了测序历史上崭新的一页,开创了边合成边测序的先河。454公司真可谓是第二代测序技术的奠基者。 之后,454公司被罗氏诊断公司以1.55亿美元收购。2007年,他们推出了性能更优的第二代基因组测序系统—Genome Sequencer FLX System (GS-FLX)。2008年10月,GS-FLX Titanium 系统试剂和软件的推出,更是提高了GS-FLX 5倍的通量,及其准确性和读长。 2. 454/ GS-FLX 系统的测序技术原理及工作流程 1)技术原理:GS FLX System是一种基于焦磷酸测序原理而建立起来的高通量基因组测序系统。焦磷酸测序的原理如下: (1)1个特异性的测序引物和单链DNA模板结合,然后加入酶混合物(包括DNA Polymerase、ATP Sulfurylase、Luciferase和Apyrase)和底物混合物(包括APS和Luciferin)。 (2)向反应体系中加入1种dNTP,如果它刚好能和DNA模板的下一个碱基配对,则会在DNA 聚合酶的作用下,添加到测序引物的3’末端,同时释放出一个分子的焦磷酸(PPi)。 (3)在ATP硫酸化酶的作用下,生成的PPi可以和APS结合形成A TP;在荧光素酶的催化下,生成的ATP又可以和荧光素结合形成氧化荧光素,同时产生可见光。通过CCD光学系统即可获得一个特异的检测峰,峰值的高低则和相匹配的碱基数成正比。 (4)反应体系中剩余的dNTP和残留的少量A TP在Apyrase的作用下发生降解。 (5)加入另一种dNTP,使第2-4步反应重复进行,根据获得的峰值图即可读取准确的DNA序列信息。 2)工作流程: (1)文库制备: GS FLX系统支持各种不同来源的样品,包括基因组DNA、PCR产物、BAC、cDNA、小分子RNA等等。大的样品例如基因组DNA或者BAC等首先需要被片段化,即打断成400 -800 bp的片段。小分子的非编码RNA及这些小片段再借助一系列的分子生物学技术,在两个末端连接上A和B接头(3’和5’端具有特异性)。具有A、B接头的单链DNA 片段被纯化回收后即组成了样品文库,将用于后续的扩增和测序步骤。如果是PCR扩增产物,则不需要进行这一步,则可以直接跳到步骤(3)。 (2)乳液PCR 扩增: 将特定比例的单链DNA文库固定在特别设计的DNA捕获磁珠上。由于每一个磁珠携带了一个独特的单链DNA片段,因此一个DNA片段对应一个磁珠。磁珠结合的文库被扩增试剂乳化,形成油包水的混合物,即为每个DNA片段提供了一个自己的微反应器。由此样品文库中每个DNA片段就可以在没有其他的竞争性或者污染性序列影响的微环境中平行进行扩增,产生几百万个相同的拷贝。随后,打破乳液混合物,扩增后仍结合在磁珠上的片段也可以被回收纯化用于测序实验。短的PCR产物则不需进行文库建立,而直接进行扩增。 (3)测序反应: 将反应混合物及回收的携带DNA的磁珠放入PTP (Pico TiterPlate)板中。PTP板含有160多万个由光纤组成的孔,孔的直径(29um)只能容纳一个磁珠(20um),孔中载有化学发光反应所需的各种酶和底物。然后将PTP板放置在GS FLX中,测序开始。每一个与模板链互补的核苷酸的添加都会产生化学发光的信号,并被CCD照相机所捕捉,就可以达到实时确定待测模板的碱基序列的目的。 (4)数据处理:可通过GS FLX系统提供两种不同的生物信息学工具对测序数据进行分析。 图2 454/GS-FLX高通量测序方法工作流程示意图 3. GS FLX系统的技术优势和限制 1)读长优势: 与其他新一代测序平台相比,454平台的最突出优势当然就是读长较长了。单个序列的读长平均可达到450个碱基左右。对于那些需要长读长的应用,如从头拼接和宏基因组学,是最理想的选择。尤其适合于Denovo测序和新物种的转录组测序。 2)操作简便高效 不需要进行建库、克隆挑取、质粒提取等工作,一个人可以在一天内完成一个微生物物种的测序工作。 3)分析结果快速、信息高通量 GS FLX系统在10小时的运行当中可获得100多万个读长,读取超过4-6亿个碱基信息。 4)应用广泛且稳定 广泛应用在基因组deovo测序、基因组重测序、目标基因捕获测序、宏基因组测序和RNA 测序分析等研究领域。测序结果一致性较高。 5)同聚物的限制 其主要限制来自同聚物,也就是相同碱基的连续掺入,如AAA或GGG。由于没有终止元件来阻止单个循环的连续掺入,同聚物的长度就需要从信号强度中推断出来。这个过程就可 能产生误差。因此,454测序平台的主要错误类型是插入-缺失,而不是替换。 4. 参考信息: 焦磷酸测序(Pyrosequencing)技术原理参见: 第三节ABI SOLID3 system 1. SOLID历史渊源 自ABI的创始人Leroy Hood教授在上世纪80年代中期设计了世界上第一台DNA自动测序仪,生命科学研究就从繁琐的手工测序迈入了自动测序的新时代,ABI公司也开始在测序方面占据着垄断地位。直到2005年,Roche公司推出的454测序技术动摇了ABI的领先地位。06年,美国贝克曼-库尔特公司以1.2亿美金转手卖出Agencourt公司,收购者是ABI。Agencourt公司的重要部门——AgencourtPersonal Genomics(APG)与NHGRI(美国家人类基因组研究院)关系密切: 不仅参与了美国政府组织的人类基因研究计划(Human Genome Project),而且在像狗基因组测序拼接这样的研究项目中发挥了重要的作用。此举扩增了ABI 公司在个人基因组测序方面的实力。2007年10 月,ABI公司的SOLID(Sequencing by Oligonucleotide Ligation and Detection)测序系统于投入商业使用。 Applied Biosystems? SOLiD? 3 Plus System 2. SOLID平台技术原理 SOLID是基于寡核苷酸连接和检测进行测序的技术。它以4色荧光标记寡核苷酸的连续连接反应为基础,以双碱基编码技术为检测技术,对单拷贝的DNA片段进行大规模扩增和高通量测序。 基本过程如下: (1)文库制备:根据实际情况制备文库:片段文库或末端配对文库。 a片段文库制备:片段化后,连接测序接头,形成文库(如:转录组测序、重测序、、甲基化分析、ChIP测序) b末端配对文库制备:基因组DNA片段化后,与中间接头连接,再环化,然后用EcoP15酶切,使中间接头两端各有27bp的碱基,再加上两端的接头,形成文库 (如:全基因组测序、SNP分析) (2)乳液PCR: 待测文库被连接在1μm微珠上,混合PCR元件,在“油包水”的微反应器中进行PCR。其关键技术也就是“注水到油”,基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR反应空间。理想状态下,每个小水滴只含一个DNA模板和一个P1磁珠,由于水相中的P2引物和磁珠表面的P1引物所介导的PCR反应,达到模板指数扩增的目的。 (3)磁珠富集技术制备单分子模板:含有DNA模板的磁珠共价结合在SOLiD玻片表面。 (4)连接测序:上机测序,边连接边测序,获得SOLiD原始颜色序列。 3. SOLiD系统特点 1)高准确度:SOLiD系统最为引人注目的地方就是高准确度。因为双碱基编码检测技术在测 序过程中对每个碱基判读两遍,从而减少原始数据错误,提供内在的校对功能,这样,双保险确保了SOLiD系统原始碱基数据的准确度。 2)高通量:SOLiD 3单次运行可产生50GB的序列数据。 3)可扩展性:SOLiD系统采用开放玻片式的结构,使用包被DNA样品的微珠来输入基因组信息。微珠密度并不是一成不变的,系统支持更高密度的微珠富集。 4)灵活性:SOLiD 3系统具有两个独立的流动室,玻片也能分成1个、4个或8个小室。而20个条形码序列则提供了额外的灵活性。 5)运行时间较长,测序片段相对较小:单次运行时间长达7天,最短3.5天。最长2*50bp 第四节测序技术的比较 根据发展历史、影响力、测序原理和技术不同等,主要有以下几种:大规模平行签名测序(Massively Parallel Signature Sequencing, MPSS)、聚合酶克隆(Polony Sequencing)、454焦磷酸测序(454 pyrosequencing)、Illumina (Solexa) sequencing、ABI SOLiD sequencing、离子半导体测序(Ion semiconductor sequencing)、DNA 纳米球测序(DNA nanoball sequencing)等。 然而,精明的用户更看重的是性价比,这也是他们选择Illumina的重要原因。Illumina的售价约为45万美元,低于454 GS FLX的50万和SOLiD系统的59万(以上皆为美国的售价)。此外,运行成本也是一个关键因素。因此,低样品需求、简单的流程、高质量的数据以及应用灵活性让Illumina Genome Analyzer从其他高通量测序技术中脱颖而出。” 第四章测序技术的回顾与发展 第一节Microarray技术 人人皆知的人类基因组计划发生在第二代测序技术出现之前,人类基因组计划工作量和耗资的巨大促使人们去研究更先进的测序方法。微阵列(microarray)或生物芯片技术就是随着"人类基因组计划"(HGP)的进展而发展起来的分子生物学里又一项里程碑式的重大技术革新。它是融微电子学、生物学、物理学、化学、计算机科学于一体,通过平面微细加工技术在固相表面构建的微流体分析单元和系统的新技术。其最大优点是:在分析速度成千上万倍提高的同时,所需样品及化学药品却成千上万倍地减少,因而又称为生物芯片技术。目前生物芯片技术包括基因芯片、蛋白质芯片、细胞芯片、组织芯片、以及元件型微阵列芯片、通道型微阵列芯片、生物传感芯片等新型生物芯片。由于生物芯片的检测范围取决于芯片上探针的信息,因此只能检测人们已知序列的特征,缺乏发现寻找新基因的能力。但是基因芯片技术已经发展了近二十年,其实验技术及后期数据分析理论已经很成熟很完备,也积累了庞大的公共数据库,在高通量技术不够成熟时应用占主导优势,但随着高通量技术日益成熟,目前应用较少。 第二节其他测序技术 EST技术 EST技术全称expressed sequence tags,中文名表达序列标签。它是指从不同组织来源的cDNA 序列,这一概念首次由Adams 等于1991年提出。当时主要应用于基因识别、绘制基因表达图谱、寻找新基因等研究领域,并且取得了显著成效。在人类基因组计划进入后基因组时代时,EST技术利用结构基因组学的同存数据为大规模进行基因识别、克隆和表达分析提供了强大的动力。 SAGE技术 SAGE技术全称Serial Analysis of Gene Expression,中文名基因表达系列分析,它是1995年Velculescu等提出的,它的特点是快捷有效,可在3个小时对上千个转录物进行分析。SAGE 技术能获得较完整的基因组表达信息,当时大大加快了基因组研究的进展,但要和其他技术相互结合才能最大可能地进行基因组基因表达的全面研究。 MPSS技术 MPSS技术全称Multiple parallel signature sequencing,中文名多重性平行定序。MPSS可以侦测到极为罕见的基因表现,它为生物晶片开启了一扇门窗,也为分子生物学和当时的人类基因组计划提供了有力的工具。 这些技术不像第一代测序技术和第二代测序技术应用那么广泛,所以很少被人提到。 第三节测序技术的回顾及展望 从费用角度、适用范围和限制性来说,传统测序仪和新一代测序仪之间具有明显的差距。因此,对于每一个具体的项目来说,都需要仔细考虑,选择出最合适的测序仪。 第一代测序技术适用于对kb~mb长度的DNA片段进行的小规模的测序项目。相比第二代测序法而言具有极大的“间隔尺寸”,既能用于大型项目也能用于小型项目。第二代测序技术与第一代测序技术的原理都是基于边合成边测序的思想,在测序原理上没有本质的飞跃,那么测序的时间和费用都大大降低的原因是什么呢?其关键在于第二代测序技术采用了高通量测序技术,使测序通量大大提高,从第一代测序法一次读取一条序列到毛细管测序的一次读取96条序列再到现在的一次读取几百万条序列的实现,不得不说这是对第一代测序技术的一次革命性的变革。 但是第二代测序技术也不是十全十美,在测序长度和准确率方面不够完美。由于Illumina和SOLiD的测序结果都较短,更适合重测序,而不太适用于没有基因组序列的全新测序。 就在这时,惊爆全球的新闻来了!据《科技日报》2011年9月21日报道:美国物理学家组织网9月18日报道,最近,来自美国加利福尼亚大学圣地亚哥分校、克雷格?文特尔研究院和Illumina公司的科学家对现代基因测序算法进行了改良,只需从一个细菌细胞中提取的DNA(脱氧核糖核酸)就可组装成接近完整的基因组,准确率达到90%,而传统的测序方法至少需要10亿个相同的细胞才能完成。这一突破为那些无法培养的细菌提供了测序方法。 这就是我们俗称的单分子测序技术所带来的惊人的成果。目前已知的有Helicos公司的Heliscope单分子测序仪、Pacific Biosciences公司的SMRT技术和Oxford Nanopore Technologies公司正在研究的纳米孔单分子技术。Heliscope技术和SMRT技术是利用荧光信号进行测序,纳米孔单分子技术是利用不同碱基产生的电信号进行测序。目前在美国第三代测序技术已经被很多人关注,预计会有很多新的发现,将会解决相当多的生物学问题。 第三代测序技术是通过增加荧光的信号强度及提高仪器的灵敏度等方法解决了错误率的问题,使测序不再需要PCR扩增这个环节,实现了单分子测序并继承了高通量测序的优点。第三代测序技术里的纳米孔单分子技术则更是在原理上做出本质变革,不再基于目前所用测序技术广泛使用的边合成边测序的思想,而是使用外切酶从ssDNA的末端逐个切割形成单 碱基,并采用新技术对切落下来的单碱基进行检测,这样可以更好地提高读取长度,减少测序后的拼接工作量,实现对未知基因组进行重新测序。 第二代和第三代测序技术的特点都是高通量,但是目前第二代测序技术应用比较广泛,第三代测序技术还在成熟完善中。高通量的特点带给我们的是一次测序就可以获得上百万条甚至几百万条序列信息。高通量测序技术可以实现对不同组织mRNA差异表达的检测,通过与基因组进行比较可以确定组织特异表达的基因,因此具有取代“microarray”技术的态势。因为基因芯片的检测依赖于芯片上探针的信息,所以只能检测已知序列的特征,不能发现新基因,高通量测序刚好弥补这个不足。 随着生命科学研究的深入,我们相信高通量测序技术在生物学、医学、农学等方面的应用会越来越广泛。
/
本文档为【转录组转录组及转录组测序】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索