纽约(GenomeWeb)——分析引擎公司和Almac诊断公司获得了英国创新基金(Innovate UK)的一笔未披露金额的资金,用于联合开发一个计算平台,该平台可自动化生物标志物发现、药物回收和重新定位以及伴发诊断的管道和工作流程。
补助金是共同财产的一部分创新英国生物技术和生物科学研究vwin德赢ac米兰合作委员会的倡议该公司将投资250万英镑(380万美元)用于可行性研究,旨在开发组学、系统生物学和其他类型数据的商业机会。
对于他们的特定项目,Analytics Engines和Almac将结合各自的技术和专业领域,设计一个适用于分析大型复杂数据集的可扩展平台。Analytics Engines开发存储和处理基础设施,用于从生命科学和其他环境中的数据中挖掘和提取信息。Almac,就其本身而言,正在贡献其在发现、开发和商业化生物标志物以及开发生物信息学管道方面的专长。
所谓的Analytics Engines大数据堆栈平台利用Hadoop HDFS和MongoDB等技术,为用户提供有效和可扩展的解决方案,用于组合和运行来自公共和私有存储库的各种类型数据的自动化管道。该系统使用数据虚拟化技术,让用户“将[来自不同来源的]数据视为位于单一位vwin德赢ac米兰合作置,并使用多种数据类型和工具进行交叉比较,”该公司生命科学主管奥斯汀·坦尼(Austin Tanney)向GenomeWeb解释道。“处理和数据保持在一起,这样就不是将数据转移到处理中,而是将计算转移到数据中。”该公司向来自生命科学以外的一系列行业的客户销售系统的内部部署和云上选项。该公司没有披露定价。
Almac之所以选择与Analytics在英国创新基金上合作,是因为两家公司几年前就已经建立了合作关系。“(Analytics Engines)正在做一些工作……Almac生物信息学和生物统计学副总裁蒂姆·戴维森在接受GenomeWeb采访时表示:“我们正在加速软件和大数据分析,由于我们在处理大数据诊断方面的工作,他们来找我们寻求潜在的帮助是一件很自然的事情。”
作为最初合作伙伴关系的一部分,两家公司努力找出Almac内部流程中的瓶颈,如果这些瓶颈实现自动化,将加快公司的分析速度。戴维森说,具体来说,他们研究了Almac用于对高通量分子数据进行细分的过程,这是其开发卵巢癌和乳腺癌等疾病测试的努力的一部分。他告诉GenomeWeb,从历史上看,子类型任务可能需要40到80个小时的计算时间,但在分析引擎的帮助下,Almac能够将时间缩短到大约4个小时。“他们极大地改善了我们扭转业绩的方式,改变了我们的决策周期,(这)是两家公司建立合作关系的重要组成部分。”
在成功的鼓舞下,合作伙伴们开始寻找他们可以尝试改进的Almac其他工艺。Almac的部分业务包括识别在某些情况下涉及多种疾病的生物标志物,例如,影响多种癌症亚型的生物标志物。该公司需要一种方法来更有效地根据公共和专有数据集查询其感兴趣的生物标记物,以识别这些标记物可能涉及的不同疾病或潜在地识别不同的预后组。他们希望既能进行前瞻性研究——例如,确定在表型和基因型水平上发生的潜在失调——也能进行回顾性研究,例如,查看失败的药物试验,并评估是否应该选择不同的患者组进行研究。
在英国创新基金的帮助下,“我们将真正扩大我们用于发现和……基本上是用它来生成数据驱动的假设,然后你可以用它来指导和集中你的研究,并启动与公司的潜在合作,或与其他公司回收资产,”戴维森说。他说,他们还将致力于自动化Almac的流程,“直到数据来到我们身边,告诉我们诊断、药物、伴随诊断和药物发现的潜在机会在哪里,而不是我们必须向前走,看看这些机会可能在哪里。”
目前在Almac的生物标志物发现项目中,除了其他任务外,研究人员可能必须从不同来源收集数据,执行分子分型,根据数据查询生物标志物测试,并寻找一组中个体之间的关系,如特征、表型、结果和临床信息的相似性。戴维森表示,完成这些任务可能需要研究人员长达一周的时间。这一伙伴关系旨在减少这些时间。基本上,“它采取了很多我们会做的事情,取消了手动步骤,只是引入了规模和一致性,(对于)一些将有审计跟踪的东西,(和)一些可以以有效的方式保存的东西,以便在以后的日期查询而无需重新运行。”此外,公司内部不同的生物信息学家可能有不同的做事方式,因此为了确保结果的一致性,部分重点将放在将执行任务和运行分析的标准化方法放在一起,他补充道。
在接下来的18个月里,研究人员将致力于在分析引擎的基础设施上实施Almac内部开发的管道和工作流。Davison说,这包括数据质量控制的管道,以及探索技术因素和端点的管道。他们还将实现Almac的数据清理管道,这是一种分子分型工作流,使用无监督方法或半监督方法来探索关于样本或患者分组、表型、本体和目标的数据结构。此外,合作伙伴将实施一个工具,让研究人员发现和开发具有临床效用、统计有效性、生物学相关性和分析稳定性的生物标志物。
Davison表示,该平台将用于支持Almac的内部研发工作,以及该公司与制药和生物技术公司合作的生物标志物发现和验证的收费服务工作。vwin德赢ac米兰合作
Tanney表示,Analytics Engines还计划提供通过合作伙伴关系开发的商业功能,作为其现有产品组合的一部分,专门用于生命科学。“目前,我们可以为人们实现管道,或者如果他们自己有经验和专业知识,他们可以使用堆栈并实现管道. ...这样做的结果是,我们将使客户能够更容易地建立自己的管道。”