数据库管理巨头甲骨文公司最近宣布将与基因组分析领域的重量级公司竞争与牛津大学合作创建一个技术系统,以加速vwin德赢ac米兰合作识别SARS-CoV-2变种。
牛津大学的这项技术被称为全球病原体分析系统(GPAS),它结合了英国大学的可扩展病原体管道平台(SP)vwin德赢ac米兰合作3.通过Oracle云基础设施,对SARS-CoV-2测序数据进行标准化、分析、比较和注释,以寻找可能破坏疫苗效力并延长COVID-19大流行的新变体。
该伙伴关系建立在早期工作的基础上,由威康信托基金会资助,涉及威尔士公共卫生、卡迪夫大学和英格兰公共卫生,并发现了SP的新用途3.这是一种用来追踪肺结核疫情的软件。Oracle Cloud的加入增强了SP3.处理能力、安全性以及全球协作。
大概三个月前英格兰公共卫生部门将其名称改为英国卫生安全局牛津大学纳菲尔德医学系微生物学教授、GPAS项目负责人德里克·克鲁克表示,这是新冠肺炎大流行的直接结果,要求牛津大学帮助扩大该机构的SARS-CoV-2基因检测规模。
克鲁克说:“(英国公共卫生部)希望利用我们能够通过这个平台访问的这些云服务,作为实现这种规模的一种手段,从而提高他们满足国家需求所需的吞吐量。”“我们很高兴我们的服务……可以被重新用于COVID。”
SP的3.Crook说,/GPAS平台可以适用于任何传染病的基因组。
在宣布与牛津大学的合作时,甲骨文董事长兼首席技术官拉里•埃里森(Larry Ellison)表示,希望重新利用SPvwin德赢ac米兰合作3.制定“病原体数据收集和分析的全球标准”,以提高对导致COVID-19的病毒以及威胁公共健康的其他微生物的了解。
“它专注于开发全基因组测序,”克鲁克说。“我们的目标是将基因组测序转化为一种诊断工具,甚至可能取代大量人工流程”,这些流程可以追溯到20世纪初。
克鲁克和他在世界各地的同事们正在寻找方法来取代“传统的”微生物学,用包括细菌、病毒和真菌在内的微生物的基因组测序来进行诊断。他在牛津大学的研究小组并没有直接研究寄生虫,而是研究其他SP3.参与者。
克鲁克说:“在过去的10到15年里,我们已经对处理数据所需的信息学工具有了了解。”“同样重要的是,你如何分析数据,解释它,并恢复你希望用于诊断目的的所有特征。”
在此期间开发的专业知识有助于改进用于检测微生物的基因组测序分析。
甲骨文在支持生命科学大数据方面并不是一个家喻户晓的名字,而甲骨文云基础设施(OCI)在主要的云服务提供商中很少被提及,通常包括“三大”的亚马逊网络服务、谷歌云平台和微软Azure。事实上,骗子他说,直到几个月前甲骨文公司联系他,他才意识到甲骨文在生物信息学领域有很深的涉足。
克鲁克说,甲骨文公司决定为COVID-19应对工作和传染病的未来做出重大慈善贡献时,找到了他。根据克鲁克的说法,甲骨文为GPAS提供了10年的云访问权限,没有使用限制。
克鲁克说:“他们希望牛津大学成为创始企业,然后创造一个环境,让全球患有传染病的人们希望使用这些服务,从COVID开始。”
全球的研究人员和非营利组织都可以免费使用gpa。牛津大学和甲骨文公司表示,他们最终计划将该平台扩展到所有病原体。
迈克·西西里亚,集团副总裁甲骨文是该公司应对COVID-19疫情的负责人牛津合作伙伴,指出牛津大学并不是该公司在用于基因组和分子诊断应用的高性能计算方面的第一个主要合作伙伴,但该公司表示,这笔交易无疑提高了该公司在生物信息学方面的地位,包括在基因组序列处理方面。“我预计,随着我们向前发展,这将成为我们更大的关注领域,”他说。
甲骨文上周宣布,其云平台一直在支持澳大利亚初创公司GMDx Genomics开发的精准肿瘤分析系统。
GMDx使用OCI平台来承载其技术,该技术基于对从全基因组序列中提取的4万个指vwin德赢ac米兰合作标的分析,测量癌症患者的“先天免疫适应度”。该分析然后指导临床医生选择靶向治疗。
甲骨文公司与英国布里斯托尔大学建立了成像合作伙伴关系,帮助生产了一种纸在科学去年秋天,他详细介绍了SARS-CoV-2刺突蛋白与亚油酸结合的工作。威克森林再生医学研究所与威克森林再生医学研究所合作,支持类器官的3D打印,以测试药物对COVID-19、癌症和心脏病等疾病的疗效。
这家科技公司还与南加州大学埃里森转型医学研究所(Ellison Institute for Transformative Medicine)合作,这是甲骨文创始人的一项重大慈善活动,与甲骨文没有直接关系。在埃里森研究所的众多努力中,它使用甲骨文云将基因组数据与数字成像集成,然后将人工智能应用于癌症诊断和治疗。
人工智能和预测分析需要大量的高性能计算能力,特别是在云中处理大型数据集时。与任何高性能云平台一样,OCI为客户提供了随需求变化而增加或减少使用的灵活性。
西西里亚说,在学术研究环vwin德赢ac米兰合作境中支持测序的大部分技术历史上“都是本土发展的,实际上是由研究团队自己拼凑和组装的。”“显然,他们需要一些强大的马力来进行这些(实验)。”
机构不希望必须支持高性能计算中心,特别是如果他们希望在序列之间有大量的停机时间,或者他们希望允许研究人员与其他地方的同事合作。Sicilia指出,在大学的防火墙下,自主开发的系统可能很难进行跨机构合作,而甲骨文希望在基因组学方面提供支持。
在迁移到Oracle云之前,SP3.来自英国、美国、印度和中国等地的合作伙伴依赖于世界各地大学和研究机构的各种不同的计算基础设施,从本地服务器到服务器集群。
克鲁克说:“你可用的计算规模(仅仅)和你的数据中心一样大,它起源于研究数据中心。”“它很大,但与大型商业云供应商相比,它很小,因此它的扩展范围有限。”
另外,本地托管的数据中心需要人工来运行。
克鲁克说:“拥有一家大型商业供应商所带来的规模经济,意味着你可以做出非常了不起的事情。”“这是一个完全不同的场景。”
Oracle在其云上创建了一个高性能的数据库计算平台,称为Oracle Exadata数据库机。西西里说这家科技巨头已经能够将其可扩展的计算基础设施与生命科学和医疗保健业务以及其他一些特定行业的知识产权结合起来。
西西里亚说:“我们在高性能计算方面拥有合适的横向IP,(即)Exadata云服务,一般来说是Oracle云,在我们的业务内部也有合适的纵向专家,他们专注于临床。”
他说,该公司支持“世界上大多数主要制药公司”在云端进行临床试验。这些客户倾向于使用Oracle云基础设施进行临床测量和药物发现随机化。
Sicilia说,这是甲骨文云支持测序分析的一个“新方向”。他说:“虽然我们目前出于明显的原因专注于COVID,但我们相信,这也将成为通用测序云,具有巨大的实用价值。”
他说,甲骨文专注于使其云服务成为生命科学公司的“交钥匙服务”,包括运营、维护和安全。
甲骨文现在正与牛津合作部署SP3.这样该平台就可以处理来自大量SARS-CoV-2样本的测序数据。
“这里的想法是,一旦你有了一个序列,你就可以非常迅速地扭转结果,”理想情况是在一个小时内,克鲁克说。他指出,处理SARS-CoV-2样本的延迟在很大程度上不是由于计算速度或可用性,而是由于样本运输和测序准备。
“我们希望将测序后的分析时间压缩到一个小时以内。如果有需要,我们想对成千上万的[SARS-CoV-2]样本这样做,”克鲁克说。
Crook说,他的团队正在与欧洲分子生物学实验室-欧洲生物信息学研究所的计算基因组学研究员Zamin Iqbal合作。克鲁克说,伊克巴尔改进了一种工具,可以在不到10分钟的时间内完成对SARS-CoV-2基因组的初步处理,这样研究人员至少可以确定基因组的谱系。
该项目可用的其他生物信息学工具是用于注释和系统发育。Crook指出,构建一棵系统进化树“在计算上要求非常高,当你得到数十万个基因组时,它就达到了设计的极限。”
Crook说,迁移的一部分包括预先定义生物信息学结果解释的标准,这样用户就有信心,例如,正在调用正确的变体。他补充说,仅仅测试这些过程的质量就是一项重大工作。
克鲁克说,GPAS的目标受众是公共卫生机构,用于病毒和变异监测,用于研究对COVID-19的长期免疫,以及研究下一代疫苗的公司。
他说:“了解基因组的细节和颗粒状特征,并挖掘这些信息,特别是对目前的冠状病毒有一些非常实际的好处。”
Crook指出,变异不仅改变了传播性和可能的疫苗设计,而且还可能通过改变PCR引物来潜在地影响测试。
“所有这些变化都很麻烦,跟踪、识别它们并对它们做出反应非常有帮助,”克鲁克说。
GPAS项目的未来方向将取决于全球需求,但Crook说,一个可能的应用将是跟踪A型流感突变,因为流感疫苗在某些年份是出了名的无效。
他补充说:“它还可以帮助你发现对抗病毒药物产生抗药性的病毒。”
他说,基因组实验室已经很好地追踪了一些赋予抗结核药物耐药性的基因变化,但很难找到所有这些突变。克鲁克说:“我们的终极目标是,有一天我们能够大规模地利用全基因组序列来实现这一目标。”“我们希望为此做出贡献。”