理想情况下,每个微生物组研究将使用以上三种方法来分析样本,然而在大多数情况下,没有足够的样品信息或足够的项目资金来完成全部三种分析,并且在一些情况下,样品可能并不适用于其中的一种测序方法。因此需要研究人员根据科学问题来选择那种方法是最有效的。如果没有预算限制,我们推荐使用宏基因组学测序,不要使用标记基因测序。然而通常情况下通过标记基因测序可低成本快速获得对微生物群落组成的最基本信息。接下来就取决于研究的重点,研究人员可以继续进行宏基因组学和转录组学测序,但是有可能需要二次研究,进行更合理的样品采集和处理。
一个关键的分析步骤是为微生物序列进行物种分类注释。物种分类常用机器学习的方法,如,RDP分类器,它使用的是传统的贝叶斯模型,在属的水平上,对核苷酸的出现频率进行训练,然后在属的水平上进行分配,准确度可达~80%。另外,较为常见的微生物组分析软件流程还有QIIME以及Mothur,包括物种分类的功能模块。原则上,与三大参考数据库(三个最具特色且经常使用的是Greengenes,RDP和Silva)精确匹配应当提供更好的分类学依据,或指定特异性,但是鉴于大量未知的分类群,这种方法的敏感性较差。此外,由片段较短的标记基因构建的系统发育树通常结果较差,将标记基因序列插入到基于全长序列的参考序列系统发育树中是一种更好的做法。另外,应当对未分类的微生物进行核糖核酸序列分析是否为细胞器的序列,如叶绿体、线粒体。在很多研究中,这些细胞器序列是应该在分析前过滤去除的(肠道样品研究中,这些序列可以用来鉴定食用的食物种类,不应当完全忽略)。
大多数可应用于微生物组标记基因测序的统计方法,也同样适合于在接下来高级分析中提到的其它组学数据分析。
微生物组数据经过处理,可以获得特征(features,如物种不同分类级或基因)与样本的丰度矩阵。但这一结果是存在迷惑性(deceptively)的,因为微生物组数据通常是高维数据,包括几千个不同物种,矩阵数据(表格)稀疏存在许多零值;因此需要注意的统计处理方法,以挖掘有意义的结果。
了解微生物群落的组成并不是研究的终点,我们更想知道群体的功能。多组学数据整合,扩增子测序,宏基因组,宏转录组,宏蛋白组,宏代谢组和其它技术都可用于特定微生物群体功能和组成的深入理解研究。例如,改变的代谢组成反应生物合成的活性,mRNA和蛋白表达,以及蛋白活性。多组学分析将化学和生物学知识结合,提供研究对象更完整的生物学系统的新方法,是一个活跃的研究领域(图3)。
分子生物学的中心法则
以细菌细胞为例:从DNA——RNA——蛋白——代谢物的过程的概述,正好对应多组学研究的6个层面。
d.代谢活性网络
依赖特定物种分子机制的数学模型,代谢活性网络帮助预测微生物群体结构和功能
GSSG,氧化型谷胱甘肽
e.普氏分析法
普氏分析法可以在同一主坐标轴内可视化数据的趋势,直接比较具有相同内部结构的不同组学数据,
f.多重共惯性分析
MCIA可以通过图形代表不同类型,多维比较不同组学数据,相似的组学数据可以更容易理解。
RNA-Seq,转录组测序或RNA测序
本领域的趋势是向前所末有大数据集、理解流行病学家长期熟知的混杂因子、更重视纵向研究设计等将成为重点。尤其是人、动物模型、体外实验在系统层面和大尺度基础上,从观察研究向干预研究是值得考虑的。标准化方法应用的增长,可以降低噪音和偏好,对微生物领域研究从实验室范围向临床、田间和自然环境的深入提供广泛前景。
一文读懂:RobKnight手把手指导菌群研究(必读综述)
花开06-18热心肠日报
原标题:菌群分析的规范
①菌群研究和分析方法正高速发展,研究方法标准化、数据共享平台的推广为联合独立项目、完善已有成果提供可能;
②实验设计需合理设置空白和对照组,并考虑实验动物的习性;
③可参考对已知菌群的分析效果,决定采用标志基因组、宏基因组还是宏转录组研究手段和分析方法;