由维康信托基金资助的英国公共卫生部和桑格研究所之间的一项合作,已经基本实现了对从国家类型培养库中挑选出来的3000株细菌进行测序的目标。国家培养库是一个由phi运营的非营利性生物仓库。
在对来自NCTC的2700多个不同菌株进行了测序之后,项目背后的科学家们目前正忙于组装基因组,并通过将它们上传到公共数据库来确保其科学质量和可访问性,从而填补了这些生物参考基因组方面的重要空白。
周末在这里举行的欧洲临床微生物学和传染病会议上,公共卫生部门的临床科学家萨拉·亚历山大(Sarah Alexander)介绍了该项目的最新进展开始于2013年测序服务由桑格研究所提供,由太平洋生物科学公司提供支持。
亚历山大说:“我们认为这是世界上最大的为原核生物生成全基因组序列的项目。”
国家细菌中心是一个建立于1920年的细菌菌株收集中心,现已发展成为一个包含约5200种细菌菌株的多样化和动态的收集中心。她指出,NCTC 3000项目的目标是为3000个这样的菌株生成参考基因组,并将数据嵌入可访问的资源中,以“提高收集的价值”。
Alexander指出,这项工作的关键挑战之一是从NCTC菌株中提取高分子量DNA用于全基因组测序,通过在安捷伦技术公司的用于NGS质量控制的TapeStation平台上生成DNA质量概况,这一任务变得更容易。
亚历山大说,到目前为止,这一过程中非常重要的一步已经导致了3200多个菌株的DNA提取,代表852个不同的细菌种类和82个科。
在迄今测序的2700多个菌株中,超过56%的菌株由一个contig组装,超过92%的菌株由少于5个contig组装。
到目前为止,该项目的主要科学影响之一是在NCTC中生成了852个(约95%)的“型菌株”序列。亚历山大解释说,这些类型菌株是所有其他菌株的“参照点”,用来比较“是否属于该物种”。她说,由于这些菌株在科学上的重要性,该组织特别关注它们的管理。
为了强调该项目在这方面的重要性,Alexander指出了美国国家生物技术信息中心数据库中目前可用的序列,其中108个(12%)类型菌株根本没有该物种的全基因组序列,而298个(30%)类型菌株没有这些特定菌株的WGS。vwin德赢ac米兰合作在NCBI列出的852种菌株中,约有44%只有基因组序列草稿。
Alexander说,型菌株是“描述新细菌物种的基本要求”,并指出NCTC 3000填补了可用参考基因组的重要空白。
产生的NCTC 3000数据也已经被科学界应用,并在多个外部同行评审研究中得到利用。此外,科学家们能够在肠杆菌科中鉴定出耐药基因,并与这些菌株被分离的日期进行比较,这为该生物的耐药性提供了有价值的见解。
最后,该小组为许多对人类健康有高度兴趣的物种生成了多个基因组数据集——例如,他们为大肠杆菌生成了250多个参考基因组,为金黄色葡萄球菌生成了167个参考基因组。
在过去几年的努力中取得了巨大的进展,国家病毒中心3000的科学家们现在相信,他们将能够对大约3300个菌株进行测序,代表大约852个物种,并鼓励世界各地的科学家使用这些数据由桑格研究所网站主办.他们还鼓励科学家将临床相关菌株存入国家病毒控制中心,以纳入测序项目。