纽约(GenomeWeb)——利用众包样本,地球微生物组项目联盟进行了一项元分析,以表明其资源可以用于检测微生物多样性。
地球微生物组计划2010年推出目的是最终确定来自世界各地的20万个微生物样本的特征,从而创建一个目录。作为财团今日报道自然在美国,它已经从全球科学界收集了2.7万多个样本和元数据。在这些样本中,该联盟已经确定了大约30万个独特的微生物16S rRNA序列,其中绝大多数在现有的数据库中无法找到。
研究作者Rob Knight是加州大学圣地亚哥分校微生物组创新中心的教授和主任,他在一封电子邮件中说,当项目启动时,他和他的同事们曾希望它能像现在这样大,“但这是一个尝试做大规模项目的全新模式,我们的许多资深同事都非常悲观。”
他和他的同事们还使用了地球微生物组项目数据库来调查样品中微生物物种的丰富度和巢性,以说明如何利用他们的开放资源。
来自KU Leuven-Rega研究所的Jeroen Raes写道:“该项目提供了一种资源,将使微生物生态学家和进化生物学家忙碌多年。相关评论.
其他大型微生物组项目,比如人类微生物组计划和极端微生物组项目寻找与人类相关的微生物和那些能承受恶劣环境的微生物的特征。
在这项研究中,研究人员专注于他们的前27751个样本及其元数据中的细菌和古菌含量。
相关的元数据必须符合基因组标准联盟的MIxS和环境本体标准,研究人员在此基础上构建了一个轻量级的本体应用程序,以捕获样本是自由生活的还是与宿主有关,如果与宿主有关,则该宿主是植物还是动物。它还捕捉到了样本是来自生理盐水还是非生理盐水环境。
研究人员在Illumina平台上对样本的16S rRNA基因进行了扩增和测序,产生了22亿个序列。奈特说,该联盟在2008年至2012年期间对许多协议进行了基准测试和测试。
在他的评论中,Raes指出,研究人员在他们的方案中选择了泛化而不是敏感性。虽然单一协议有助于控制变化,但他指出,所有协议在一系列样本类型上都能很好地工作。
奈特和他的同事没有像许多其他宏基因组研究那样,将他们生成的序列分配到操作分类单元,而是使用了最近开发的一种名为Deblur的无参考方法来获得精确的序列,而不是聚集在一起的OTUs。经过质量控制,研究人员生成了307572个独特的序列。这些序列中只有大约10%与现有的数据库匹配。
这种方法使研究人员能够跟踪样本中的rRNA基因序列,并检查与环境相关的多样性。
奈特和他的同事们报告说,无论是哪个研究小组收集的微生物档案,都是根据环境类型聚集在一起的
他们还证实了之前的发现,与宿主相关也与丰富度降低有关,来自盐水和非盐水环境的微生物群落有不同的组成。此外,仅基于群落组成,有监督的机器学习方法可以将样本与植物或动物相关,以及与生理盐水或非生理盐水环境相区分,准确率达到91%。研究人员指出,这可能会对法医和其他应用产生影响。
此外,研究人员报告说,正如预期的那样,在中性pH值和相对较低的温度下,微生物群落的丰富度最高。他们还发现,巢性似乎在这些群落中占主导地位,这意味着低多样性的群落可能是高多样性群落的子集,而不是包含一组完全不同的微生物。
奈特说,其他研究人员有无数种方法可以使用EMP资源,包括“发现新的大规模生态模式,更多地了解EMP中每个单独的系统,在不同的环境中查找他们最喜欢的微生物,以及使用数据集作为源跟踪的基础。”