引物338f-806r中DB引物od值是什么意思思

微生物多样性分析方案
&&&&微基生物——解码微生物的奥秘微生物多样性分析方案ngs / 第二代测序技术 illimina miseq 2*300bp 平台 roche 454 gs flx 平台2015 年 1 月微基生物科技(上海)有限公司1 / 36 微基生物——解码微生物&&&&的奥秘目一、 二、 三、 四、录微基生物公司简介 ........................................................................................................... 3 微基生物代表客户及项目列表 ....................................................................................... 4 微基生物公司技术优势 ................................................................................................... 5 微生物多样性分析项目 .......................................................................................... 9 1、细菌多样性分析 ............................................................................................... 9 2、真核生物多样性分析 ...................................................................................... 10 3、真菌多样性分析 ............................................................................................. 11 4、古菌多样性分析 ............................................................................................. 13 5、指定功能微生物多样性分析: ....................................................................... 15 五、 建库流程......................................................................................................................... 17 1. 微基优势: ............................................................................................................... 17 2. 建库实验步骤: ........................................................................................................ 17 2.1 基因组 dna 抽提 ................................................................................................... 17 2.2 pcr 引物的设计 ................................................................................................... 18 2.3 pcr 扩增 ............................................................................................................... 18 2.4 pcr 产物的凝胶回收及检测 ............................................................................... 19 2.5 已送样品的 qubit 2.0 dna 定量 ......................................................................... 19 六、 生物信息学分析流程 ..................................................................................................... 20 1、 测序数据统计分析 ............................................................................................... 20 2、otu-based 分析 ....................................................................................................... 21 3、多样性分析 (alpha-diversity) ............................................................................ 22 4、稀释性曲线(rarefaction curve) .......................................................................... 23 5、 分类学分析(taxonomy) .................................................................................... 25 6、 各样本间不同分类水平的比较 ............................................................................. 27 7、 全样本相似度分析 ................................................................................................. 28 8、样品 otu 分布比较-venn 图 .............................................................................. 29 9、 heatmap .................................................................................................................. 30 10、 pca 分析(principal component analysis) ........................................................... 31 11、 rda 分析(redundancy analysis) ........................................................................ 32 七、 高级数据分析及绘图服务 ............................................................................................. 34 1、微生物种类分级进化树分析 ................................................................................... 34 2、网络图分析方案 ....................................................................................................... 35 3、进化树分析............................................................................................................... 35 联系方式:..................................................................................................................................... 36微基生物科技(上海)有限公司2 / 36 微基生物——解码微生物的奥秘一、 微基生物公司简介微基生物科技(上海)有限公司,是一家应用分子生物学技术专门研究微 生物领域相关问题的高科技公司。微基生物专注于微生物多样性分析,16s / 18s / its 宏基因组,功能基因建库分析,协助客户寻找微生物和环境因子、健康与 疾病之间隐藏的关系,探索其中的规律。 微基生物是国内唯一一家同时具有 pcr-dgge 平台、454 及 illumina 高通 量测序平台、克隆文库、rflp 等多种微生物多样性分析平台的公司。公司拥有 经验丰富的技术团队,涉及分子生物学、生态学、生物信息学、统计学方面,团 队核心成员具有 10 余年一线科研工作经验。 微基生物已完成 300 余项微生物多样性分析项目,分析样本 6000 余例。研 究对象涉及土壤、粪便、水体、肠道、发酵物、人体微生物等各类样本,代表客 户有中科院、清华大学、复旦大学、同济大学、新华医院、中山医院、海洋研究 所、中国极地研究中心等众多科研客户及乳制品、化妆品行业内的企业客户。 微基生物,将继续围绕微生物多样性分析核心业务,紧跟国际分子生物学 技术、生物信息学、统计分析技术发展,以优良的服务质量,协助研究者解码微 生物世界的奥秘!微基生物科技(上海)有限公司3 / 36 微基生物——解码微生物的奥秘二、 微基生物代表客户及项目列表合作单位 复旦大学 同济大学 清华大学深圳研究生院 华东理工大学 东华大学 中山大学 长江大学 中南大学 兰州大学 山东农业大学 河南农业大学 青岛农业大学 新疆农业大学 大连医科大学 华中科技大学 四川理工学院 仁济医院 上海长征医院 中医药大学 附属龙华医院 国家海洋局 第一海洋研究所 东海水产研究所 光明乳业股份有限公司 乳业研究院 陕西省微生物研究所 中科院上海高等研究院 中国极地研究中心 中国农业科学院 植物保护研究所 南海水产研究所 涉及领域 淤泥微生物 生物膜微生物 植物根系表面微生物 土壤、淤泥微生物 沉积物微生物 淤泥微生物 土壤微生物 沉积物微生物 水样微生物 油田微生物 土壤微生物 土壤微生物 土壤微生物 植物根系 土壤微生物 鸡肠道微生物 瘤胃微生物 人肠道微生物 油田微生物 食品微生物 人肠道微生物 小鼠肠道微生物 大鼠肠道微生物 人肠道微生物 土壤微生物 淤泥微生物 鱼肠道微生物 乳品微生物 河流微生物 淤泥微生物 海洋及冰川微生物 昆虫肠道微生物 淤泥微生物 分析平台 pcr-dgge 高通量测序平台 高通量测序平台 高通量测序平台 高通量测序平台 高通量测序平台 pcr-dgge 高通量测序平台 高通量测序平台 高通量测序平台 高通量测序平台 高通量测序平台 高通量测序平台 pcr-dgge 高通量测序平台 pcr-dgge 高通量测序平台 高通量测序平台 高通量测序平台 高通量测序平台 pcr-dgge 高通量测序平台 pcr-dgge pcr-dgge pcr-dgge 高通量测序平台 高通量测序平台 高通量测序平台 高通量测序平台 高通量测序平台 pcr-dgge pcr-dgge 高通量测序平台 高通量测序平台 高通量测序平台 检测类型 细菌、aob 和 nob 细菌 细菌 细菌 细菌、真菌和古菌 细菌 细菌 古菌 古菌 细菌 细菌 细菌 细菌 细菌和真菌 细菌 细菌、真菌和甲烷菌 细菌 细菌 细菌和真菌 细菌 细菌 细菌 细菌 细菌、古菌 细菌 细菌 细菌 细菌 细菌 细菌、古菌、真核 细菌 细菌、古菌微基生物科技(上海)有限公司4 / 36 微基生物——解码微生物的奥秘三、 微基生物公司技术优势研究环境中微生物的多样性,最重要的是能够更真实的反应环境中微生物 的实际存在状况, 因此采用更好的分子生物学建库方法至关重要;要从众多的分 析数据得出有价值的信息,后继完备的种属信息数据库、个性化的数据分析、统 计就显得必不可少。这两方面,微基生物都具有明显的技术优势。1. 最全面的数据库:最新的 silva,greengene,rdp 三大微生物数据库,目前 涵盖非重复细菌序列信息:464618 条。 已建立 产甲烷菌、硫酸盐还原菌、硝化细菌、氨氧化细菌、反硝化菌、固碳微 生物、固氮微生物、厌氧氨氧化菌等 10 余种功能基因分类数据库,可按客户指 定的功能基因开展建库及微生物种属分析。 2. 基因组 dna 抽提是宏基因组研究的第一步,其质量的好坏,直接关系到后期分 析的准确性,差之毫厘谬以千里。微基生物高度重视这最初的环节,严格根据客 户样本的类型,选取最佳的样本基因组 dna 抽提方案,拒绝大一统的通用抽提 方案,已达到最佳的基因组抽提效果。 已完成优化的样本抽提方案: 消化道或粪便/发酵物,土壤/淤泥,水样/融冰/融雪3. pcr 放大是 16s/18s/靶基因宏基因组分析必不可少的一步, 其放大过程中的偏差不可避免,但采用好的扩增策略,可显著降低其扩增偏差。微基生物是国内独 家推出 低偏差扩增测序(lea-seq) 来建立扩增文库的。与常规建库方法相比 ,lea-seq 更能准确的反应出样本微生物真实的多样性分布。微基生物科技(上海)有限公司5 / 36 微基生物——解码微生物的奥秘在高通量测序过程中,需要 pcr 扩增进行原始样本序列的指数放大,而在 此过程中产生的差异也是必不可免的,微基生物采用顶级期刊 science 发表的 文章中 lea-seq 方法, 以低偏差扩增的方法更真实的反应环境中微生物的存在。 lea pcr 扩增原理:首先利用低浓度的反向内侧引物,进行少数循环的目 的片段线性扩增, 随后加入正向内侧引物、 正向外侧引物及反向外侧引物进行目 的片的指数扩增,详细描述可参见参考文献。参考文献:the long-term stability of the human gut microbiota. science 341.20134. 目前高通量测序平台中,illumina miseq 平台对于环境微生物样本的研究更经 济实惠,微基生物是国内首家采用 illumina-miseq 2x300bp 平台(目前 illumina 平台中最长)来进行微生物多样性研究的公司。 myseq2*300bp 平台,最大测序长度 550bp,适合进行 v3,v4 或 v4,v5 双高变区微生物种属鉴定,与采用 myseq2*300bp 分析策略来说,其分析的准 确度大大提高。5. 微基生物可针对原核生物 9 个 v 区分别进行了测序分析优化,可根据客户样本 情况,选择最优分析区域进行分析,也可针对多个区域分别进行分析。细菌的 16s 基因序列包含 9 个高变区(v 区),在以往的研究中,有众多 的通用引物对被用于扩增检测 16s 不同的 v 区,微基生物前期已查阅大量文献 ,并对相同样本采用不同 v 区扩增引物对进行优化评测分析。微基生物科技(上海)有限公司6 / 36 微基生物——解码微生物的奥秘目前微基生物已验证过的适用的扩增区域及平均长度分别为:v1-v3 为 526bp、v3-v4 为 469bp、v5-v7 为 410bp、v7-v9 为 415bp,都适用于 miseq 2*300bp 测序平台。参考文献:critical evaluation of two primers commonly used for amplification of bacterial 16s rrna genes. applied and environmental microbiology. 20086. 微基生物可根据客户需求,针对功能基因或靶基因,设计 pcr 通用引物,收集 genebank 中所有已知序列及其对应信息,开展个性化建库及分析。 此类方法 ,可针对属内各种,甚至亚种,进行细致的分类分析,与环境数据结合,可用于 某类微生物精细的分类及进化研究。 常用功能基因建库分析及引物列表:功能微生物 产甲烷菌 硫酸盐还原菌 srb 硝化细菌 aob 氨氧化细菌 aob 氨氧化古菌 aoa 硝化细菌 nob 硝化细菌 nob 厌氧氨氧化菌 amx 测序基因 16s dsrb 16s amoa amoa 16s nxra 16s narg nirk nirs nosz lsu cbbl cbbm nifh 特异引物 arch519f / arch915r dsrf / dsrr cto189f / cto653r amoa-1f / amoa-2r arch amoa f /arch amoa r fgps1269 / fgps872 nxra f / nxra r amx368 / amx820r narg1960f / narg2650r f1acu / r3cu cd3af / r3cd noszf / noszr f/r 595f / 1387r f/r polf / polr 推荐平台 454 / miseq 2*300 454 / miseq 2*300 454 / miseq 2*300 454 / miseq 2*300 454 454 / miseq 2*300 454 / miseq 2*300 454 / miseq 2*300 454 454 / miseq 2*300 454 / miseq 2*300 454 / miseq 2*300 454 / miseq 2*300 454 454 / miseq 2*300 454 / miseq 2*300反硝化菌定鞭金藻 固碳微生物 固氮微生物微基生物科技(上海)有限公司7 / 36 微基生物——解码微生物的奥秘7. 微基生物,提供多种统计分析方法,除目录中已列出的统计分析方法,还可针对 客户的需求定制开发特色的分析方法。例如:双序图分析,将正常人群/病人中 显著差异的微生物种群筛选出来,用于筛选与疾病相关联的微生物种群。 微基生物特色的双序图,分析不同人群(如:正常人群/病人)中微生物组 成的差异。首先将正常人群/病人中显著差异的微生物种群筛选出来(一般差异 度 5%),对于正态性分布的数据,我们采用 t 检验(student's t-test),对 于无法判断或不符合正态分布的数据我们采用 mann-whitney 检验,而后通过 rda 双序图直观的显示出来。同时利用 monte carlo permutation test 来检 验模型的正确性。通过该图可清晰的显示出与疾病相关的微生物种群。 附图:参考文献: structural segregation of gut microbiota between colorectal cancer pati ents and healthy volunteers. the isme journal. 2012微基生物科技(上海)有限公司8 / 36 微基生物——解码微生物的奥秘四、 微生物多样性分析项目 1、细菌多样性分析分析对象:细菌微生物 常用引物示意图:常用引物列表:鉴定物种 16s rdna 细菌 16s rdna 细菌 细菌 细菌 细菌 16s rdna 16s rdna 16s rdna 目标区域 单 v 区 v3 区 单 v 区 v4 区 双v区 v1-v2 双v区 v2-v3 双v区 v3-v4 双v区 v4-v5 三v区 v1-v3 三v区 v5-v7 三v区 v6-v8 三v区 v7-v9 长度 180bp 300bp 330bp 330bp 460bp 引物序列 357f/533r 515f/806r 27f/338r v2fw/533r 357f/806r 推荐平台 miseq 2*300/454 miseq 2*300/454 miseq 2*300/454 miseq 2*300/454 miseq 2*300/454 miseq 2*300/454 454 miseq 2*300/454 miseq 2*300/454 miseq 2*300/454细菌 细菌 细菌 细菌16s rdna 16s rdna 16s rdna 16s rdna410bp 530bp 410bp 434bp515f/926r 27f/533r 785f/1175r f-968/r-1401细菌16s rdna415bpbsr-mp分析数据库:silva、rdp、greengene 微基生物拥有 silva、rdp、greengene 三大数据库。其中 silva 数据库是目前信 息最全,使用最广泛的数据库。目前涵盖非重复细菌序列信息:464618 条。 详细分析请参考第三部分内容微基生物科技(上海)有限公司9 / 36 微基生物——解码微生物的奥秘2、真核生物多样性分析分析对象:真核微生物 常用引物示意图:常用引物列表:鉴定物种 18s rdna 真核 目标区域 单 v 区 v4 区 长度 405bp 引物序列 547f/952r 推荐平台 miseq 2*300/454分析数据库:silva、rdp 微基生物拥有 silva、rdp 数据库。其中 silva 数据库是目前信息最全,使用最广 泛的数据库。目前涵盖非重复序列信息:51553 条。 详细分析请参考第三部分内容微基生物科技(上海)有限公司10 / 36 微基生物——解码微生物的奥秘3、真菌多样性分析分析对象: 真菌微生物 较使用 18s 分析,其区分度更大,能得到更准确的种属分类信息。 常用引物示意图:常用引物列表:鉴定物种 真菌 真菌 目标区域 its1 its2 长度 350bp 400bp 引物序列 its1f/its1r its2f/its2r 推荐平台 miseq 2*300/454 miseq 2*300/454分析数据库: 微基生物自建数据库。 微基生物收集到 ncbi 中所有已知 its1 及 its2 序列及其 对应分类信息,目前涵盖非重复真菌序列信息:46701 条。 分析结果举例: 真菌 otu 划分:otu name a b c d e otu1 45
3 6 otu2 0
0 otu3 0 0
0 0 otu5 34 78 176 922 1328 otu6 0 0 0 0 3656 otu7 4
0 0 otu9 95 67 84 781 734 otu10 24 4 14 0 18 otu11 0 0 0 1896 0 otu12 0
94 otu13 0 1 0 0 1413 otu14 0
0 otu15 213 502 258 56 55 otu16 0 0 0 1031 0 otu17 0 0 0 888 0 otu18 847 0 0 0 0 otu19 798 1 1 0 0 f 13 0 0 0
0 0 15 0 0 0 0 otusize
85 25 96 88 8 847 800taxonomy phylum class order family all_fungi(100){fungi};ascomycota(100){phylum};saccharomycetes(100){class}; ascomycota saccharomycetes saccharomycetales saccha all_fungi(100){fungi};basidiomycota(100){phylum};tremellomycetes(100){class} basidiomycota tremellomycetes cystofilobasidiales cystofi all_fungi(100){fungi};basidiomycota(100){phylum};tremellomycetes(100){class} basidiomycota tremellomycetes cystofilobasidiales cystofi all_fungi(100){fungi};basidiomycota(100){phylum};tremellomycetes(100){class} basidiomycota tremellomycetes cystofilobasidiales cystofi all_fungi(100){fungi};ascomycota(100){phylum};dothideomycetes(100){class};p ascomycota dothideomycetes pleosporales pleosp all_fungi(100){fungi};unclassified_fungi(100){phylum};unclassified_fungi(100){c unclassified fungiunclassified fungi unclassified fungi unclass all_fungi(100){fungi};ascomycota(100){phylum};saccharomycetes(100){class}; ascomycota saccharomycetes saccharomycetales saccha all_fungi(100){fungi};unclassified_fungi(100){phylum};unclassified_fungi(100){c unclassified fungiunclassified fungi unclassified fungi unclass all_fungi(100){fungi};ascomycota(100){phylum};dothideomycetes(100){class};c ascomycota dothideomycetes capnodiales all_fungi(100){fungi};ascomycota(100){phylum};saccharomycetes(100){class}; ascomycota saccharomycetes saccharomycetales saccha all_fungi(100){fungi};unclassified_fungi(100){phylum};unclassified_fungi(100){c unclassified fungiunclassified fungi unclassified fungi unclass all_fungi(100){fungi};basidiomycota(100){phylum};tremellomycetes(100){class} basidiomycota tremellomycetes cystofilobasidiales cystofi all_fungi(100){fungi};basidiomycota(100){phylum};tremellomycetes(100){class} basidiomycota tremellomycetes cystofilobasidiales cystofi all_fungi(100){fungi};unclassified_fungi(100){phylum};unclassified_fungi(100){c unclassified fungiunclassified fungi unclassified fungi unclass all_fungi(100){fungi};basidiomycota(100){phylum};tremellomycetes(100){class} basidiomycota tremellomycetes cystofilobasidiales cystofi all_fungi(100){fungi};unclassified_fungi(100){phylum};unclassified_fungi(100){c unclassified fungiunclassified fungi unclassified fungi unclass all_fungi(100){fungi};unclassified_fungi(100){phylum};unclassified_fungi(100){c unclassified fungiunclassified fungi unclassified fungi unclass all_fungi(100){fungi};basidiomycota(100){phylum};tremellomycetes(100){class} basidiomycota tremellomycetes cystofilobasidiales cystofi all_fungi(100){fungi};basidiomycota(100){phylum};tremellomycetes(100){class} basidiomycota tremellomycetes cystofilobasidiales cystofi微基生物科技(上海)有限公司11 / 36 微基生物——解码微生物的奥秘真菌物种信息的汇总:分类的级别 phylum phylum phylum phylum phylum class class class class class class class class class class class class class order order order order order order order order order order order order order order family family family family 分类名称 ascomycota basidiomycota unclassified fungi unclassified chytridiomycota saccharomycetes tremellomycetes dothideomycetes unclassified fungi microbotryomycetes sordariomycetes unclassified eurotiomycetes agaricostilbomycetes leotiomycetes cystobasidiomycetes taphrinomycetes exobasidiomycetes saccharomycetales cystofilobasidiales pleosporales unclassified fungi capnodiales tremellales sporidiobolales unclassified eurotiales dothideales agaricostilbales hypocreales trichosporonales leucosporidiales cystofilobasidiaceae pleosporaceae unclassified fungi saccharomycetaceae 10 394
15 0 73 30 144 56 97 14 11 23 2 3 0 73 0 172 989 124 193 14 2 11 4 5 20 0 4 11
73 12 46 22 9 19 0
99 7 198 209 10 3 46 2 7 44 1 37
383 329 120 27 56 19 25 163 4 0 0
253 329 125 436 55 264 19 5 25 3 36 65
819 7 09 25 0 7 09 243 443 42 7 6 61 8 1 1 7 09 7 562 4 31 6 16 4 46 09 0 8 19 274 1 57 19 579 744 298 7 18 90 68 2 4 57 19 0
18 100 28 69 19 3 9 otusize
255 314 47 153 91 450 31 122 3 28 1 6
21 850 5 259 7 249 298 24 119 47 153 38 163 92 172 73 317 440
21 6 3112详细分析请参考第三部分内容微基生物科技(上海)有限公司12 / 36 微基生物——解码微生物的奥秘4、古菌多样性分析分析对象: 古菌微生物常用引物及最适引物筛选: 下面列表是文献中常用的进行古菌分析的引物,我们通过各个引物在 silva 119 数据库中进行查找,得到每对引物能分析的微生物在数据库中的序列数。519f/915r 344f/915r 349f/806r 515f/806r a109f/parch519r 古菌
12813 细菌 0 0
111840 真核微生物 1 0 0 0 29 长度 410bp 570bp 460bp 300bp 410bp 适合平台 miseq 2*300/454 454 miseq 2*300/454 miseq 2*300/454 miseq 2*300/454图解: 1 前面两对引物都是古菌的特异引物,但是用于 miseq 2*300 分析我们选取第一 对 519f/915r,这对引物扩增得到的目的产物的长度 410bp,适合 miseq 平台; 344f/915r 这对引物扩增得到的目的产物的长度 570bp,适合 454 平台。 2 后面三对引物对古菌分析的特异性不好。 分析数据库: 微基生物拥有 silva、rdp、greengene 三大数据库。其中信息最全面的是 silva 数据库,目前涵盖非重复序列信息:18797 条。微基生物科技(上海)有限公司13 / 36 微基生物——解码微生物的奥秘分析结果举例: 古菌的物种分级信息: 根据文献报道,古菌除了门、纲、目、科、属、种的分类级别外,还会通过 group (类群) 来分析。 比如泉古菌 (thaumarchaeota) 包括 miscellaneous crenarchaeotic group( mcg)、marine benthic group b( mbgb)、marine group i ( mg i)、marine benthic group a( mbga)等几个类群。 广古菌(euryarchaeota)包括 marine benthic group d( mbgd)、marine benthic group e ( mbge)、marine group ll (mgll)等几个类群。 微基生物针对这种情况,专门自编程序进行数据的分析,案例分析结果如下: 可以清楚的了解到每个门都包含哪些 group(类群) 。分类的级别 分类名称 superkingdom archaea pmarine_group_i pgroup_c3 pmarine_benthic_group_b pmiscellaneous_crenarchaeotic_group psoil_crenarchaeotic_group pmarine_benthic_group_a pterrestrial_hot_spring_gp marine_benthic_group_d_and_dhveg-1 deep_sea_hydrothermal_vent_gp_6 marine_benthic_group_e marine_hydrothermal_vent_group marine_group_ii marine_group_iii miscellaneous_euryarchaeotic_group deep_sea_euryarchaeotic_group south_african_goldmine_gp terrestrial_miscellaneous_gp terrestrial_miscellaneous_gp phylum unclassified class unclassified class methanomicrobia class thermoplasmata class halobacteria class methanobacteria class thermococci class thermoprotei class methanococci 1 2 801
3 152 135 1 24 6 1 0 11 0 0 0 59
171 5 0 0 0 2
6 168 113 57 23 3 0 10 13 0 0 0 434
160 2 1 0 0 3
104 345 102 1 22 2 0 11 15 11 0 0 181
156 5 0 0 0 4 6 693
12 312 143 6 31 5 0 10 19 1 1 1 206
208 0 1 1 0 5
147 440 138 8 49 1 1 12 27 4 0 0 232
227 1 1 0 0 6 otusize
109 7 510 48 1 13 20 104 55 327 614
52 125 49 198 2 19 2 4 57 100 32 117 0 16 1 2 0 1 640 934 417 8 252
0 3 0 1 0 0详细分析请参考第三部分内容微基生物科技(上海)有限公司14 / 36 微基生物——解码微生物的奥秘5、指定功能微生物多样性分析:分析对象:指定功能微生物,或特定微生物群 可将特定功能基因的序列差异作为区分标准, 针对特定基因进行已知序列及分类 信息建库,分析样本中该基因序列的分布信息,能对特定微生物进行详尽分类。 常见分析功能基因及引物列表:功能微生物 产甲烷菌 硫酸盐还原菌 srb 硝化细菌 aob 氨氧化细菌 aob 氨氧化古菌 aoa 硝化细菌 nob 硝化细菌 nob 厌氧氨氧化菌 amx 测序基因 16s dsrb 16s amoa amoa 16s nxra 16s narg nirk nirs nosz lsu cbbl cbbm nifh 特异引物 arch519f / arch915r dsrf / dsrr cto189f / cto653r amoa-1f / amoa-2r arch amoa f /arch amoa r fgps1269 / fgps872 nxra f / nxra r amx368 / amx820r narg1960f / narg2650r f1acu / r3cu cd3af / r3cd noszf / noszr f/r 595f / 1387r f/r polf / polr 推荐平台 454 / miseq 2*300 454 / miseq 2*300 454 / miseq 2*300 454 / miseq 2*300 454 454 / miseq 2*300 454 / miseq 2*300 454 / miseq 2*300 454 454 / miseq 2*300 454 / miseq 2*300 454 / miseq 2*300 454 / miseq 2*300 454 454 / miseq 2*300 454 / miseq 2*300反硝化菌定鞭金藻 固碳微生物 固氮微生物微基生物科技(上海)有限公司15 / 36 微基生物——解码微生物的奥秘指定功能基因数据分析流程:分析结果举例: otu 代表序列与标准菌株进行发育树的绘制:每一种颜色代表一个 class。详细分析请参考第三部分内容微基生物科技(上海)有限公司16 / 36 微基生物——解码微生物的奥秘五、 建库流程1. 微基优势:pcr 扩增建库的质量决定了测序结果是否能真实地反应样本中微生物的分 布情况: 样本中所有微生物的分布比例是否得到正确的反映;样本中微量或痕量 的微生物是否能被检测到。 微基生物在常规建库方法的基础上,查阅大量相关文献,自己建立了一套低 偏差扩增建库(low error amplicon sequencing,lea-seq)的方法。 lea-seq 示意图如下:2、 建库实验步骤: 2.1 基因组 dna 抽提根据客户的样本来源不同,我们采用不同的方法进行基因组 dna 抽提。 (1) 肠粘膜或是粪便样本,采用 qiaamp dna stool mini kit (2) 土壤或淤泥等样本,采用 mobio powersoil dna isolation kit (3) 水膜或其他菌液滤膜样本,采用微基生物优化的 ctab 法 (4) 其他来源样本我们会根据样本类型采取最优的基因组 dna 抽提方法。微基生物科技(上海)有限公司17 / 36 微基生物——解码微生物的奥秘下图为微基生物抽提基因组 dna 电泳检测结果:说明:a-c 为样本所抽提基因组 dna,上样量 3ul;m 为 9kb marker 上数第一条带为 9 kb,亮带浓度为 30ng/ul,其余为 10 ng/ul。2.2pcr 引物的设计根据 illumina miseq 高通量测序要求,双向测序,设计 pcr 融合引物,带有“5’miseq 接头-barcode-测序引物-特异引物 3’”的融合引物。 引物设计模式图如下图所示:2.3pcr 扩增采用微基生物自己建立了一套低偏差扩增建库(low error amplicon sequencing,lea-seq)的方法。 取 3ul pcr 产物于 2%琼脂糖凝胶检测,dl2000 marker 3ul(从上至下为 2000bp 1000bp 750bp 500bp 250bp 100bp,其中亮带为 20ng/ul,其余为 10 ng/ul )电泳结果显示: 首先进行 8 个循环的线性扩增,而后进行 30 个循环指数扩 增,tm=50℃,pcr 产物条带单一,目的条带大小正确,浓度适中,可用于后续 axyprepdna 凝胶回收。微基生物科技(上海)有限公司18 / 36 微基生物——解码微生物的奥秘2.4pcr 产物的凝胶回收及检测将 pcr 扩增产物电泳检测效果好的样品,于 2%琼脂糖凝胶电泳切胶回收 (电泳槽保持干净, 更换电泳缓冲液) 。 采用 axygen 公司的 axyprepdna 凝 胶回收试剂盒回收 pcr 产物,取 3 μl 回收产物进行电泳检测。检测结果显示 ,pcr 产物回收效果良好。 产物胶回收检测结果:2.5已送样品的 qubit 2.0 dna 定量采用微量荧光核酸定量仪 qubit 2.0 对胶回收产物进行定量。 曲线结果如下:各样品定量结果如下:样品 编号 a1 a2 a3 浓度 (ng/ul) 25.47 20.48 23.14 样品 编号 b1 b2 b3 浓度 (ng/ul) 22.15 30.28 25.27 样品 编号 c1 c2 c3 浓度 (ng/ul) 26.31 22.12 25.45微基生物科技(上海)有限公司19 / 36 微基生物——解码微生物的奥秘六、 生物信息学分析流程1、测序数据统计分析1.1 有效序列数据统计 在测序实验中,通常采用多个样品平行测序的方法,即多个样品混合测序。 为了能区分样品, 各样品中的序 列均引入了一段标示其样本来源信息的 barcode 标签序列。若所测序列中不含有 barcode 标签序列,则无法确定其样本来源,进 而导致后续生物信息错误或意义不明。 因此, 仅当原始序列中含有完整的 barcode 标签序列时, 该条序列才被认可为有效序列。2*300 miseq 测序结果包括每个样 品的正向和反向测序结果,首先我们进行序列的拼接。 各样品有效序列统计列表如下: 表 1 有效序列的统计 客户样品名称 a1 a2 a3 b1 b2 有效序列数(个)
10253 客户样品名称 b3 c1 c2 c3 有效序列数(个)
微基生物科技(上海)有限公司20 / 36 微基生物——解码微生物的奥秘总序列长度分布图(原图详见 distribution of sequence length.pdf)见下图: 图 1 各样品序列长度分布图注: 该图显示样本中所有序列的长度分布统计情况。1.2 优化序列数据统计 通常情况下,有效序列可以直接用于后续生物信息学分析。但如果需要得 到更高质量及更精准的生物信息分析结果,则应对有效序列进行去杂。在实验过 程中, 测序产物可能含有非特异性扩增片段,利用特异性引物信息可以将其去除 ;序列中可能含有模糊碱基(ambiguous) 、单碱基高重复区 (homologous )以 ,长度过短的序列(序列长度小于 200bp),及 pcr 过程中产生的一些嵌合体,将 这些序列纳入分析范围会降低分析质量,因此修剪、去除(screen)此部分序列 ,可得到供精准分析的优化序列。 在数据去除(screen)时,把 maxambig=0,maxhomop=8,minlength=200, maxlength=580bp 及其嵌合体序列去掉,得到优化序列。2、otu-based 分析2.1 otu 简介 otu(operational taxonomic units)是在系统发生学研究或群体遗传学研究中, 为了便于进行分析,人为给某一个分类单元(品系,种,属,分组等)设置的同 一标志。在生物信息分析中,一般来说,测序得到的每一条序列来自一个菌。要 了解一个样品测序结果中的菌种、菌属等数目信息,就需要对序列进行归类操作 (cluster) 。通过归类操作,将序列按照彼此的相似性分归为许多小组,一个小 组就是一个 otu。根据客户指定的相似度(96%、97%或者 98%) ,对所有序列 进行 otu 划分并进行生物信息统计分析。微基生物科技(上海)有限公司21 / 36 微基生物——解码微生物的奥秘2.2 otu 分析主要步骤 (1) 提取非重复序列,碱基完全一致序列为重复序列; (2) 与 silva 库(http://www.arb-silva.de/)中的 aligned(16s/18s, ssu)核糖体序列 比对; (3) chimeric 序列检测与去除; (4) 距离计算与 otu 聚类。unique align chimeric remove distance calculate otu cluster使用软件:mothur 参考网址:http://www.mothur.org/wiki/main_page3、多样性分析 (alpha-diversity)3.1 指数介绍 计算菌群丰度(community richness)的指数有: (1)chao:是用 chao1 算法估计群落中含 otu 数目的指数,chao1 在生态学 中常用来估计物种总数,由 chao (1984) 最早提出。chao-the chao1 estimator (http://www.mothur.org/wiki/chao);(2)ace:用来估计群落中含有 otu 数目的指数,由 chao 提出,是生态学中 估计物种总数的常用指数之一,与 chao i 的算法不同。ace- the ace estimator (http://www.mothur.org/wiki/ace);计算菌群多样性(community diversity)的指数有: (1)simpson:用来估算样品中微生物的多样性指数之一,由 edward hugh simpson ( 1949) 提出,在生态学中常用来定量的描述一个区域的生物多样性。 simpson 指数值越大,说明群落多样性越低。simpson - the simpson index (http://www.mothur.org/wiki/simpson);(2)shannon:用来估算样品中微生物的多样性指数之一。它与 simpson 多样 性指数均为常用的反映 alpha 多样性的指数。shannon 值越大,说明群落多样性 越高。shannon - the shannon index (http://www.mothur.org/wiki/shannon);测序深度指数有: coverage:是指各样品文库的覆盖率,其数值越高,则样本中序列没有被测出的 概率越低。该指数实际反映了本次测序结果是否代表样本的真实情况。coverage - the good’s coverage (http://www.mothur.org/wiki/coverage)。微基生物科技(上海)有限公司22 / 36 微基生物——解码微生物的奥秘3.2 指数分析结果统计(estimator) 使用软件:mothur、shannon-ace-table.pl 及 biolinker 自编程序。 本次分析选取评估指数包括:ace,chao,simpson,shannon,coverage; 用于评估的 otu 相似水平:unique, 97% (0.03),95% (0.05),90% (0.10)。 分析结果见附件中 estimator 文件夹,其中 estimator.xls 文件为每个样品的指数值 ,est.summray html 文件为综合结果表。 *.summary 文件内容说明: label:unique.03.05 即相似水平(通常选取 97%(0.03) 、95%(0.05) 、90% (0.10) ) ; acechao simpson simpson jackknife coverage:各指数; ace_lci ace _hci :统计学计算时的下限和上限值。 est.summray 表格说明: 表 3 各多样性指数统计sample id:样品名; reads:被分入所有 otu 的序列数; otu:本次实验中该样品优化序列划分得到的 otu 数目; chao, ace, coverage, jackknife, shannon, simpson 各指数介绍见上文; 0.03:相似性水平为 0.03。4、稀释性曲线(rarefaction curve)4.1 稀释性曲线简介 稀释性曲线: 一般是从样本中随机抽取一定数量的个体,统计出这些个体所代表 物种数目, 并以个体数与物种数来构建曲线。它可以用来比较测序数量不同的样 本物种的丰富度, 也可以用来说明样本的取样大小是否合理。分析采用对优化序微基生物科技(上海)有限公司23 / 36 微基生物——解码微生物的奥秘列进行随机抽样的方法,以抽到的序列数与它们所能代表 otu 的数目构建 rarefaction curve。稀释性曲线图中,当曲线趋向平坦时,说明取样的数量合理, 更多的取样只会产生少量新的 otu,反之则表明继续取样还可能产生较多新的 otu。因此,通过作稀释性曲线,可以得出样品的取样深度情况。 4.2 稀释性曲线分析结果 *.rarefaction 文件内容说明: numsampled:随机取样数 (预设为从 1 开始每增加 100 计算一次直到本次该样 品取样数) ; 0.03:相似水平; lcihci :统计学计算时的下限和上限值; 使用软件:mothur、plot-rarefaction 及 biolinker 自编程序。 根据.rarefaction 文件作图方法:在 window 系统下用右键点击文件选择打开方式 为 excel,在打开的表格中选定需要的列,在菜单栏选择插入折线图,可用右键 选项调整图形各元素,横轴设定为第一列数据,纵轴为选定的 otu 相似水平对 应列。做多个样品的 rarefaction 曲线比较时可打开多个文件将数据放在一起, 一次选取多列数据。 本次分析是在 97%相似性水平下划分 otu 并制作各样品的稀疏曲线。 图 2 rarefaction curve微基生物科技(上海)有限公司24 / 36 微基生物——解码微生物的奥秘5、 分类学分析(taxonomy)5.1 分类学分析简介(classify) 在之前的分析步骤中,已经将序列按照其自身的碱基组成的相似性,分归到各 otu 中。在进行分类学分析时,首先,将每一条优质序列都与 silva 数据库进 行比对,找出其最相近且可信度达 80%以上的种属信息。之后,将每一个 otu 中的所有序列进行类比,找出同一 otu 中的不同序列的最近祖先的种属信息。 最后,将得到的结果记录在表格文件中。这样做,可以在保留最可能多的信息量 的情况下,确保得出信息的准确性。 5.2 分类学分析方法 根据 silva 库中的参考序列对 otu 进行种属鉴定; 使用软件:mothur。 5.3 分类学分析结果说明 分类学分析结果见附件中的 otu.0.03.taxonomy.ranked.groups.xls, 0.03.otu.taxonomy. summary.xls。 (1)otu.0.03.taxonomy.ranked.groups.xls :otu 分类学综合信息表 文件各列说明: otu name 为 otu 编号; 第二列至 otusize 列的前一列为各样本的序列在所有 otu 中的含有情况。 例如 ,第二行第二列的数字代表样品 a 中有多少序列被划分入 otu1 中。 otusize 为该 otu 中所含序列的数量; otusize 之后的列为 otu 对应的种属信息。种属信息按照分类学水平分为多 列,我们将物种的门、纲、目、科、属、种的信息及相关的其他分类信息的全部 内容都进行了分类分析,便于对数据的筛选提取。例如,需要提取所有含有属信 息的 otu 的相关信 息,可在 excel 中选取属这一列,在工具栏的 数据项中,点选筛选,查看该列第一行的单元格,在下拉菜单中的文本筛选项下 方的区域内,取消选择“空白” ,点确定,即得到所有含有属信息的 otu 信息。 表 4 分级分类统计表(2)0.03.otu.taxonomy.summary.xls :分类学信息统计表微基生物科技(上海)有限公司25 / 36 微基生物——解码微生物的奥秘推荐使用 excel 软件打开 0.03.otu.taxonomy. summary.xls 文件。 0.03.otu.taxonomy. summary.xls 中的信息都是根据 otu 数统计得出的, 包括以下 两个文件 0.03.otu.taxonomy.otu.summary.xls 和 0.03.otu.taxonomy.sequence. summary.xls。 表 5 otu 分级综合统计表文件各列说明: taxlevel:分类学等级编号; rankid:分类等级编号;例如,0.1.1 与 0.1.2 平级且皆为 0.1 的子级。 taxon :分类学名称; daughterlevels:该级分类学下所含子级的数目; total:在该分类学单元下所包含的序列数或 otu 数;如:0.1.1.1.1 为 1;0.1.1.1.2 为 2;0.1.1.1.3 为 3;此后并无 0.1.1.1.n(n&=4)出现,则,0.1.1.1 为 1+2+3=6 。 之后各列为每个样品的数据统计情况。 备注:数据里如果出现 11-24、bd1-5 等这些分类学名称,是由于在数据库中, 有很多参考序列并没有通过相关试验研究得到非常详细的分类学水平信息。 因此 , 会根据序列的某些通性, 将这些序列划分到特定编号命名的组中以待后续研究 分析。 另外,会出现例如筛选出来的 taxlevel=2 的全部数据,在 taxon 中大部分是 {phylum},极少数是{no_rank}或者其他分类学水平,因为 taxlevel=2 只是机械地 将 rankid 为 0.n.n 形式的数据提取出来,虽然大部分可以和门对应起来,但是 会有误差,需要人工校正一下信息。也可以直接在 taxon 列中提取所有含 {phylum}内容的各行信息。 (3)report.otu.0.03.taxonomy.ranked.groups:将 otu 综合分类表中的信息 按照门、纲、目、科、属、种 6 个水平分别提取信息,分别统计各样品在不同 分类水平上的菌群组成及丰度。微基生物科技(上海)有限公司26 / 36 微基生物——解码微生物的奥秘表 6 分级汇总报告表6、 各样本间不同分类水平的比较在不同分类水平上, 根据各样品中的微生物组成绘制柱状图,比较各样本不同分 类水平上群落结构组成的差异。 根据文件 report.otu.0.03.taxonomy.ranked.groups 中 phylum、 class、 order、 family、 genus、species 的信息绘制,详细数据及绘制图原始图片详见 report.otu.0.03.taxonomy. ranked.groups 的 excel 表。 图 3 各样本门(phylum)水平上群落结构组成的差异全部样本在门水平上的物种分布统计微基生物科技(上海)有限公司27 / 36 微基生物——解码微生物的奥秘单样本 b1 在门水平上的物种分布统计7、 全样本相似度分析比较多个样品中 otu 组成的差异及各 otu 中含有序列的丰度,计算这些样品 的相似性,并绘制相似性图谱。 图 4 全样本相似度分析0 .3 4 1 3 0 .0 1 1 7 0 .1 3 8 6 0 .0 0 7 8 0 .4 4 1 2 0 .4 2 6 8 0 .0 5 0 5 0 .0 1 4 4 0 .0 2 0 6 0 .4 1 1 3 0 .0 6 7 6 0 .4 3 1 8 0 .4 2 6 8 0 .4 1 1 3 0 .3 4 1 3 0 .3 5 3 1c3 c1 c2 a3 a2 a1 b3 b2 b10 .40 .30 .20 .10 .0微基生物科技(上海)有限公司28 / 36 微基生物——解码微生物的奥秘8、样品 otu 分布比较-venn 图统计多个样品中所共有的 otu 数目可以反映环境样品的相似性及重叠情况。 统 计结果以 venn 图形式得出。在图中,如果两个不同颜色圆圈重叠的区域标注有 数字 100, 说明这两个样品均有序列被划分入相同的 otu 中, 且这样的 otu 有 100 个。通常情况下,分析时选用相似水平为 97%的 otu,此时 otu 的数目 也可以代表菌种的数目。 使用软件:mothur 本次分析使用的 otu 相似水平为 97%(0.03) venn 图绘制是一般分析样本数(或是样本组)为 2 到 5 组。 图 5 各样品 venn 图 比较组 1对于多个样本归于相同组别,我们首先对各组内 otu 的信息进行汇总,而后进项 venn 图的绘制。venn 文件说明: total.final.fn.0.03.sharedsobs.sharedotus 文件是各样品间共有或独有 out 的列表, 该文件可用 word 打开查看。 total.final.fn.0.03.sharedsobs.group1-group2-group3 文件是 venn 的原图,可用 firefox 浏览器打开查阅。微基生物科技(上海)有限公司29 / 36 微基生物——解码微生物的奥秘9、 heatmapheatmap 可以用颜色变化来反映二维矩阵或表格中的数据信息,它可以直观地 将数据值的大小以定义的颜色深浅表示出来。常根据需要将数据进行聚类,将聚 类后的数据表示在 heatmap 图上,通过颜色的梯度及相似程度来反映数据的相 似性和差异性。 如在属水平上对样品和 otu 类型 (样品所含菌属) 进行聚类 (依 据是不同样品中各 otu 所含序列数越相近, 即所含菌属数量越相近, 样品间相 似性越高) ,对聚类后各样品中不同 otu (不同菌属)所含序列的丰度作 heatmap 图,能够反映出在菌属水平上各样品菌落结构的相似性和差异性。 将指定种属水平上的分类信息(本次绘图是根据 genus 水平上 outsize 位于前 50 的信息进行绘制的)分别按照样品和分类进行聚类后作出 heatmap 图, 能够反映 出所有样品在各分类水平上表现的相似性或者差异性。 作图软件:r,heatmap(gplots) 距离算法:chao 聚类方法:complete 分类学水平:属(genus) 。 图 6 基于各样品 genus 分布及丰度的 heatmap 图微基生物科技(上海)有限公司30 / 36 微基生物——解码微生物的奥秘10、 pca 分析(principal component analysis)10.1 pca 简介pca 分析,即主成分分析,是一种对数据进行简化分析的技术,这种方法可以 有效的找出数据中最“主要”的元素和结构,去除噪音和冗余,将原有的复杂数据 降维,揭示隐藏在复杂数据背后的简单结构。它的优点是简单,而且无参数限制 ,可以方便的应用于各个场合。我们可以用 pca 来分析不同样品 otu 组成的 差异,通过方差分解,将多组数据的差异反映在二维坐标图上,坐标轴取能够最 大反映方差值的两个特征值。如样品组成越相似,反映在 pca 图中的距离越近。 不同环境间的样品可能表现出分散分布。 pca 分析可以用来反映不同样品中微生物群落组成的相似性以及影响微生物多 样性的主要因素,一般情况下是用来对假设进行验证。 如 pca 可以用来做以下分析: 确定环境中的样品是否具有显著不同的微生物群落。 将环境间的差异以图的形式表现出来等。 10.2 pca 分析结果 结果文件说明: .axes 文件:记录了样品在各个维度上的位置,其中 axis1 为 x 轴,axis2 为 y 轴,依此类推。 .loadings 文件: 记录了各维度解释结果的百分比。 如果 axis1 的 loading 值为 50% ,则表示 x 轴的差异可以解释全面分析结果的 50%。 pca 分析结果一般以二维或三维点图表示。通常情况下,二维点图方便观察分 析,但如果二维结果无法区分样品时,也可尝试利用三维点图。 计算软件:mothur 作图软件:pc-ord 图 7 pca 图图1图中仅显示丰度最高的前 40 个属的名称微基生物科技(上海)有限公司31 / 36 微基生物——解码微生物的奥秘图2基于 otu 分析11、 rda 分析(redundancy analysis)利用冗余分析(rda)反映在 otu 的水平或者某生物学分类水平上各样品中菌群与环境因 子之间关系。 图1图中仅显示丰度最高的前 25 个属的名称。微基生物科技(上海)有限公司32 / 36 微基生物——解码微生物的奥秘图2基于 otu 分析pca 和 rda 分析图中样本对应关系为 1-9 对应 a1 a2 a3 b1 b2 b3 c1 c2 c3微基生物科技(上海)有限公司33 / 36 微基生物——解码微生物的奥秘七、 高级数据分析及绘图服务1、微生物种类分级进化树分析以样本所得 genus 菌种信息为源数据,对其进行微生物的分级进化树分析,图中 不同的颜色对应不同的样本, 饼图的面积代表序列数目的多少,最后一个级别的 饼图代表每个 genus 水平的序列数目, 前一个级别饼图的大小为后面相应物种信 息序列数目的汇总,所以级别越高,饼图的面积就会越大。 客户可根据自己的需求,对不同级别的物种分布情况进行数据分析。微基生物科技(上海)有限公司34 / 36 微基生物——解码微生物的奥秘2、网络图分析方案采用网络图对所得数据进行数据分析, 可以形象的展示不同样本之间的相同物种 或是 otu 的相似情况。 其中:a、b、c、d 代表不同样本,中间的交叉节点代表不同的物种或是 otu ,节点的面积代表物种或是 otu 的数目,左上角的灰色注释是节点面积所代表 的标准序列数。3、进化树分析挑选各样品丰度≥0.1%的 otu 的代表序列,构建系统发育树,不同颜色代 表不同 phylum。微基生物科技(上海)有限公司35 / 36 微基生物——解码微生物的奥秘联系方式:微基生物科技(上海)有限公司 技术咨询热线: 400-660-9270 tinygene 微基生物,解码微生物的奥秘 微生物多样性分析(高通量测序、16s / 18s / its 及 功能基因建库分析等)技术顾问:丁博士 技术支持:侯美玲021--e-mail: 办公电话:021-1- 传真:021- 地址:上海浦东川沙路 159 弄 88 号 1 栋 3 楼微基生物科技(上海)有限公司36 / 36 &&&&
15:29:20 14:40:01 14:28:53 14:28:52 14:28:50 14:15:25 14:15:24 14:15:21 14:07:23 14:01:00

我要回帖

更多关于 引物设计 的文章

 

随机推荐