芝加哥-英伟达周二表示,它正在与布罗德研究所合作,使其克拉拉Parabricks用于二次分析测序数据的gpu加速软件可供布罗德的25,000名用户使用Terra数据平台.英伟达是图形处理单元(gpu)和其他高性能计算技术的制造商,该公司还表示,将为布罗德基因组分析工具包(GATK)贡献一个新的基于parabbricks的深度学习模型,用于基因vwin德赢ac米兰合作变异分析。
此外,远大的研究人员将在新发布的名为Nvidia BioNeMo的人工智能应用框架上为DNA和RNA开发基于语言的基础深度学习模型。该技术基于vwin德赢ac米兰合作英伟达的自然语言处理平台NeMo威震天。
该公司在加州圣克拉拉举行的Nvidia GTC活动上发布了这一消息,该活动的前身是GPU技术会议。vwin德赢ac米兰合作
由Broad、微软和Alphabet的Verily共同开发的Terra为研究人员提供了一种通过云计算连接数据集、生物信息学工具以及彼此的方法。
英伟达医疗保健副总裁金伯利·鲍威尔(Kimberly Powell)在记者招待会上表示,Parabricks将在下月发布的GATK的下一个更新中使用,以帮助提高变量调用的准确性。
鲍威尔说:“随着(每个基因组)测序成本从几百美元下降到100美元,我们需要确保这些基因组数据的分析尽可能地高效和高效,而gpu将为基因组学的下一波浪潮提供动力。”
“我们的根基其实是基因组数据,但随着时间的推移,我们向(Terra)平台添加了许多不同的数据类型,”布罗德的数据科学平台高级总监克莱尔·伯纳德(Clare Bernard)在GTC上展示的一段预先录制的消息中说。“与英伟达的合作将创造更多不同类型的分析,并将其带给更广泛的人群,他们不一定有机会获得这些复杂的技术服务。vwin德赢ac米兰合作
通过BioNeMo,英伟达将一种名为大型语言模型(LLMs)的深度学习策略引入生物学,在这种策略中,算法是在大量基于文本的数据集上进行训练的。
鲍威尔解释说:“BioNeMo框架是为那些想要开发新的、预先训练过的大型语言模型的研究人员和开发人员准备的,这些模型可用于任何规模和任何类型的生物序列,无论是化学、蛋白质、DNA还是RNA。”她说BioNeMo是专门为生命科学建立的,以帮助研究人员更好地理解分子数据。
鲍威尔说:“在DNA领域,我们才刚刚开始。
她补充说:“我们正在进入人工智能的下一波浪潮,大型语言模型可以理解化学和生物学的语言,在未来,将作为药物发现管道端到端运行,将药物发现转变为信息和计算机科学。”llm为我们探索生物分子和化学的无限世界提供了新的工具。”
Broad的首席数据官安东尼·菲利帕基斯(Anthony Philippakis)说,llm帮助研究人员和临床医生理解医疗记录中的人类语言。“同样,在生物学中,有另一套语言,DNA、RNA和蛋白质的语言,”他说。“就像我们训练大型语言模型来分析人类文本一样,我们也可以训练这些模型来分析生活语言。
BioNeMo是英伟达Clara Discovery系列计算框架的一部分,它已经有了一个名为MegaMolBART的生成化学预训练模型,该模型是英伟达和阿斯利康在Cambridge-1超级计算机.英伟达将发布两个蛋白质模型,ESM-1nv用于预测氨基酸序列的性质,ProtT5用于序列生成。该公司表示,未来,研究人员将能够定制LLM模型。
鲍威尔说:“BioNeMo的输出可用于下游任务,如生成新的蛋白质和化学物质,或预测结构、功能或反应性质。”
周二还标志着基于人工智能的医疗成像软件Monai的1.0版本正式发布。过去两年,英伟达一直与伦敦国王学院(King’s College London)合作开发该软件,并计划将其加入Broad的Terra云。
鲍威尔说,Monai是专门为放射学、病理学和外科数据、图像和视频而设计的。她说:“成像的下一个前沿是为微创手术和机器人手术的创新做出贡献。”