为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 基于测序的微生物多样性分析总结

基于测序的微生物多样性分析总结

2019-02-17 7页 doc 20KB 54阅读

用户头像

is_882336

暂无简介

举报
基于测序的微生物多样性分析总结基于二代高通量测序的环境微生物多样性分析 一般认为土壤、海洋、肠道等生态系统中的微生物数量繁多、种类多样。传统的培养方法只限于对环境样品中极少部分(0.1%-1%)可培养的微生物类群的研究,而变性梯度凝胶电泳(DGGE)、克隆文库等常规的分子生物学方法也因操作复杂、成本高、痕量菌发现困难等因素无法达到深入分析环境微生物多样性的目的。高通量测序技术的出现,极大的促进了对环境中不可培养微生物以及痕量菌的研究,为环境微生物多样性的研究开启了新的研究热潮。 微生物群落中物种的多样性依然是目前研究的重点。对群落结构的研究,将有助于...
基于测序的微生物多样性分析总结
基于二代高通量测序的环境微生物多样性分析 一般认为土壤、海洋、肠道等生态系统中的微生物数量繁多、种类多样。传统的培养只限于对环境样品中极少部分(0.1%-1%)可培养的微生物类群的研究,而变性梯度凝胶电泳(DGGE)、克隆文库等常规的分子生物学方法也因操作复杂、成本高、痕量菌发现困难等因素无法达到深入分析环境微生物多样性的目的。高通量测序技术的出现,极大的促进了对环境中不可培养微生物以及痕量菌的研究,为环境微生物多样性的研究开启了新的研究热潮。 微生物群落中物种的多样性依然是目前研究的重点。对群落结构的研究,将有助于了解种群结构的稳定性,进而了解种群内物种间的相互依赖、相互制约的内在联系,为将来构建功能性种群服务。鉴于微生物群落是一个多物种的集合体,其中高达95%以上的微生物物种无法分离也不能独立培养,拼装出每个独立个体的基因组现在也无法实现,细菌16S 或真菌ITS测序分析依然是现阶段微生物群落多样性和多态性分析的基石。 一、高通量测序背景介绍 高通量测序技术,可以一次对几十万到几百万条DNA分子进行序列测定,使得对PCR扩增产物直接进行序列测定成为可能。极大的促进了对环境中不可培养微生物以及痕量菌的研究,为环境微生物多样性的研究开启了新的研究热潮。目前高通量测序的主要平台代有Illumina公司的Solexa基因组分析仪(Illumina Genome Analyzer)、罗氏公司(Roche)的454测序仪(Roch GS FLX sequencer)和ABI的SOLiD测序仪(ABI SOLiD sequencer)。微生物多样性分析中,以Illumina 及454测序平台应用最为广泛。 二、工作 1 PCR引物的 2 PCR扩增条件摸索 3琼脂糖凝胶电泳检测结果 4 全部样品进行PCR 5 PCR产物的凝胶回收及检测 6 PCR产物精确定量(Qubit 2.0 ) 将纯化后的PCR产物采用微量荧光核酸定量仪进行精确定量(精确到0.1ng/ul) 7. 将定量后混匀的DNA样本再次进行磁珠法纯化后,进行高通量测序 三、可分析项目 1)有效序列数据统计 在测序实验中,通常采用多个样品平行测序的方法,即多个样品混合测序。为了能区分样品,各样品中的序列均引入了一段标示其样本来源信息的barcode标签序列。若所测序列中不含有barcode 标签序列,则无法确定其样本来源,进而导致后续生物信息错误或意义不明。因此,仅当原始序列中含有完整的barcode 标签序列时,该条序列才被认可为有效序列。 2)优化序列数据统计 通常情况下,有效序列可以直接用于后续生物信息学分析。在实验过程中,测序产物可能含有非特异性扩增片段,利用特异性引物信息可以将其去除;序列中可能含有模糊碱基(ambiguous)、单碱基高重复区(homologous )以,长度过短的序列(序列长度小于200bp),及PCR过程中产生的一些嵌合体,将这些序列纳入分析范围会降低分析质量,因此修剪、去除(trim)此部分序列,可得到供精准分析的优化序列。在数据去除(trim)时,把maxambig=0,axhomop=8, maxlength=200,及其嵌合体序列去掉,并对数据进行统计,得到优化序列的百分率。 3) OTU生成 根据序列的相似性,将序列归为多个OTU(操作分类单元),以便后续分析。OTU (Operational Taxonomic Units)是在系统发生学研究或群体遗传学研究中,为了便于进行分析,人为给某一个分类单元(品系,种,属,分组等)设置的同一标志。在生物信息分析中,一般来说,测序得到的每一条序列来自一个菌。要了解一个样品测序结果中的菌种、菌属等数目信息,就需要对序列进行归类操作(cluster)。通过归类操作,将序列按照彼此的相似性分归为许多小组,一个小组就是一个OTU。根据客户指定的相似度(96%、97%或者98%),对所有序列进行OTU 划分并进行生物信息统计分析。 OTU 分析主要步骤 (1) 提取非重复序列,碱基完全一致序列为重复序列; (2) 与silva库中的aligned(16S/18S, SSU)核糖体序列比对; (3) Chimeric 序列检测与去除 (4) 距离计算与OTU 聚类。 4) 多样性分析(Alpha-diversity) 计算菌群丰度(Community richness)的指数有: (1)Chao:是用chao1 算法估计群落中含OTU 数目的指数,chao1 在生态学中常用来估计物种总数,由Chao (1984) 最早提出。 (2)Ace:用来估计群落中含有OTU 数目的指数,由Chao 提出,是生态学中估计物种总数的常用指数之一,与Chao I 的算法不同。 计算菌群多样性(Community diversity)的指数有: (1)Simpson:用来估算样品中微生物的多样性指数之一,由Edward HughSimpson (1949) 提出,在生态学中常用来定量的描述一个区域的生物多样性。Simpson 指数值越大,说明群落多样性越低。 (2)Shannon:用来估算样品中微生物的多样性指数之一。它与Simpson多样性指数均为常用的反映alpha多样性的指数。Shannon值越大,说明群落多样性越高。 测序深度指数有: Coverage:是指各样品文库的覆盖率,其数值越高,则样本中序列没有被测出的概率越低。该指数实际反映了本次测序结果是否代表样本的真实情况。 使用软件:mothur及BioLinker自编程序。 5) 稀释性曲线(Rarefaction curve) 稀释性曲线:一般是从样本中随机抽取一定数量的个体,统计出这些个体所代表物种数目,并以个体数与物种数来构建曲线。它可以用来比较测序数量不同的样本物种的丰富度,也可以用来说明样本的取样大小是否合理。分析采用对优化序列进行随机抽样的方法,以抽到的序列数与它们所能代表OTU的数目构建稀释性曲线。稀释性曲线图中,当曲线趋向平坦时,说明取样的数量合理,更多的取样只会产生少量新的OTU,反之则表明继续取样还可能产生较多新的OTU。因此,通过作稀释性曲线,可以得出样品的取样深度情况。 稀释性曲线分析结果默认是在97%相似性水平下划分OUT并制作各样品的稀疏曲线。 6) 分类学分析(Taxonomy) 在之前的分析步骤中,已经将序列按照其自身的碱基组成的相似性,分归到各OTU 中。在进行分类学分析时,首先,将每一条优质序列都与SILV A(最新版)数据库进行比对,找出其最相近且可信度达80%以上的种属信息。之后,将每一个OTU 中的所有序列进行类比,找出同一OTU 中的不同序列的最近祖先的种属信息。最后,将得到的结果记录在表格文件中。这样做,可以在保留最可能多的信息量的情况下,确保得出信息的准确性。 7) 样本间比较 各样品群落结构分析柱状图或者饼状图 在某一分类地位上根据各样品中的微生物组成绘制饼图或者柱状图。 8) 全样品相似度分析树状图 比较多个样品中OTU组成的差异及各OTU中含有序列的丰度,计算这些样品的相似性,并绘制相似性图谱。 9) 样品OTU分布比较-VENN图 统计多个样品中所共有的OTU 数目可以反映环境样品的相似性及重叠情况。10) Heatmap热图分析 Heatmap可以用颜色变化来反映二维矩阵或表格中的数据信息,它可以直观地将数据值的大小以定义的颜色深浅表示出来。常根据需要将数据进行聚类,将聚类后的数据表示在heatmap的相似性和差异性。如在属水平上对样品和OTU 类型(样品所含菌属)进行聚类(依据是不同样品中各OTU 所含序列数越相近,即所含菌属数量越相近,样品间相似性越高),对聚类后各样品中不同OTU(不同菌属)所含序列的丰度作heatmap图,能够反映出在菌属水平上各样品菌落结构的相似性和差异性。将指定种属水平上的分类信息分别按照样品和分类进行聚类后作出Heatmap图,能够反映出所有样品在各分类水平上表现的相似性或者差异性。 11) 组间显著性差异分析(metastats分析) 分析多个样品时,如果这些样品分属于两个组,则可以进行Metastats分析。该分析通过对比两组条件下的多个样品,找出两组中具有显著差异的微生物类型。结果如下表所示: 12) PCA分析(Principal Component Analysis) PCA 分析,即主成分分析,是一种对数据进行简化分析的技术,这种方法可以有效的找出数据中最“主要”的元素和结构,去除噪音和冗余,将原有的复杂数 据降维,揭示隐藏在复杂数据背后的简单结构。它的优点是简单,而且无参数限制,可以方便的应用于各个场合。我们可以用PCA 来分析不同样品OTU组成的差异,通过方差分解,将多组数据的差异反映在二维坐标图上,坐标轴取能够最大反映方差值的两个特征值。如样品组成越相似,反映在PCA图中的距离越近。不同环境间的样品可能表现出分散分布。PCA 分析可以用来反映不同样品中微生物群落组成的相似性以及影响微生物多样性的主要因素,一般情况下是用来对假设进行验证。 如PCA 可以用来做以下分析: 确定环境中的样品是否具有显著不同的微生物群落。将环境间的差异以图的形式表现出来等。 13) RDA分析 利用冗余分析(RDA)可以反映在OTU的水平或者某生物学分类水平上各样品中菌群与环境因子之间关系。 14) UniFrac分析 选取一个组的多个样品或者不同组的样品,进行Weighted unifracPCoA分析或者unweightedunifracPCoA分析,可以在OTU的水平上反映各样品间或者不同组间微生物群落结构的差异。 15) 进化树分析 挑选各样品丰度≥0.1%的OUT的代表序列,构建系统发育树。 16) 微生物种类分级进化树分析 以样本所得genus菌种信息为源数据,对其进行微生物的分级进化树分析,图中不同的颜色对应不同的样本,饼图的面积代表序列数目的多少,最后一个级别的饼图代表每个genus水平的序列数目,前一个级别饼图的大小为后面相应物种信息序列数目的汇总,所以级别越高,饼图的面积就会越大。
/
本文档为【基于测序的微生物多样性分析总结】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索