Annai Systems正准备面向市场发布一款名为二级和三级分析报告平台(STARPlatform)的新产品,这是一种数据管理解决方案,用于处理、分析和管理下一代原始序列数据,以及调用、注释和报告基因组变体。
Annai首席执行官Michael Penley告诉GenomeWeb,该公司已经完成了平台的软发布,并与两家客户签署了协议,其中包括胶质瘤纵向分析(GLASS)联盟,这是一个国际肿瘤研究计划,由德克萨斯大学MD安德森癌症中心、加州大学旧金山分校和三星医疗中心的研究人员领导。该公司计划在今年秋季全面推出该平台。
STARPlatform由四个解决方案组成。STARBox设备提供了用于对齐原始序列读取和调用变量的工具。它还具有原始序列文件无损压缩的工具,使它们更容易存储。彭利说,例如,它可以将大约1tb的数据减少到初始大小的60%到70%,使其更容易传输,并帮助研究人员节省存储成本。
该平台还包括STARInsight,允许研究人员将他们的变体呼叫文件与管理的公共参考数据和注释结合起来。研究人员可以在系统内设置私人工作区,在那里他们可以上传和存储私人数据集,也可以上传和运行他们选择的任何算法。他们还可以通过该平台与经过批准的合作者共享数据。STARInsight还包括用于生成研究和临床报告的工具。
此外,该平台还包括STARVault,用于存储压缩数据和捕获围绕这些文件的元数据,使它们更容易在存储资源中定位。还可以使用STARClient,用于从STARPlatform下载和解压文件,以及通过应用程序编程接口访问平台。
根据Penley的说法,STARPlatform包含了Annai之前的两个产品的元素,即ShareSeq平台和Annai GNOS系统,但这是一个完全不同的产品。例如,STARBox使用同样的文件传输技术,这也是在ShareSeq中。vwin德赢ac米兰合作所谓的GeneTorrent技术使研究人员能够可靠安vwin德赢ac米兰合作全地传输数据。此外,新命名的STARVault解决方案之前是Annai的基因组网络操作系统(GNOS),这是一种用于存储数据文件和捕获与这些文件相关的元数据的工具。
合作开发日立数据系统, Annai推出2014年的ShareSeq为学术和商业研究人员提供基于云的基因组数据访问、生物信息学管道和工作流,以及计算能力和存储。ShareSeq和Annai的GNOS都支持了诸如癌症基因组学中心美国加州大学圣克鲁兹分校的研究人员开发了一个由国家癌症研究所资助的pb级数据存储库,用于访问nci资助的癌症基因组研究项目的基因组和临床数据。总的来说,CGHub拥有超过一个pb级的数据来自癌症基因组图谱和产生有效治疗的治疗应用研究项目。
Annai还被任命为国际癌症基因组联盟的技术合作伙伴之一vwin德赢ac米兰合作泛癌症计划.它的GNOS软件被选定的六个中心用来存放为这项工作收集的数据。ICGC还利用ShareSeq托管来自多个国家的数据1万个癌症基因组但它现在使用亚马逊为泛癌症项目提供的计算资源,并将其数据集保存在诸如NCI的癌症基因组云和癌症基因组图谱等存储库中。随着这些项目转移到其他资源上,“继续提供ShareSeq作为平台的需求真的不大了,”Penley说,Annai在今年2月正式让该产品退役。
该公司现在正专注于将STARPlatform推向市场。与DNAnexus、WuXi NextCode和Seven Bridges Genomics等公司现有的解决方案相比,“我认为我们的独特之处在于分析的灵活性,”彭利说。“我们有一种解决方案,研究人员和临床医生可以真正生成他们想要生成的任何类型的报告,并快速进行任何类型的下游分析,而不必通过大量的预处理数据过滤器。”该公司目前没有透露其定价结构的细节,但彭利表示,具体的成本将根据客户使用软件的方式而有所不同。他还表示,公司希望与愿意使用该平台为客户提供基因组分析服务的大型研究机构建立合作关系。
到目前为止,Annai已经与一个未透露姓名的客户以及GLASS联盟签署了协议,该联盟正在使用star平台作为努力了解三种胶质瘤亚型的耐药机制的一部分,着眼于开发更有效的肿瘤治疗方法。他们目前正在收集纵向基因组数据集,该数据集代表了三种特定弥漫性胶质瘤基因组亚型的患者:idh野生型、idh突变型和idh突变型1p/19q共缺失。
随着癌症基因组图谱项目的完成,“我们现在知道了癌症的分子基础是什么,而且我认为,对癌症的样子有了更好的理解,”GLASS首席研究员、MD安德森癌症中心生物信息学和计算生物学助理教授Roel Verhaak在接受GenomeWeb采访时说。他说,研究人员接下来要探索的一系列问题是这些肿瘤随时间变化的机制。他解释说,这是至关重要的,特别是对于高度肿瘤,这种肿瘤“众所周知”有弹性,能够抵抗各种疗法。
最初,Verhaak和同事们专注于分析他们储存在MD Anderson组织库中的组织样本。然而,他们很快意识到他们没有足够的样本来进行他们想要进行的那种纵向分析。他说:“我们一直打算在数百名患者的样本上进行这项工作,但随着我们在这个项目中进行下去,我们很快意识到,在我们的MD Anderson组织库中,我们最多只能识别几十个组织样本。”
随后,MD安德森的研究人员联系了其他机构正在进行类似项目的同事,发现他们也没有足够数量的样本用于他们的项目。Verhaak说:“为了追求纵向分子表征的目标,讨论广泛的合作是合乎逻辑的下一步……[并]使其成为一项国际努力。”
这导致了大约一年半前GLASS联盟的成立。迄今为止,来自10个国家的大约20个机构已经签署了提供胶质瘤样本和数据的协议。Verhaak说:“我们在这个联盟的早期阶段,这意味着我们正试图聚集现有的数据集,并在这些机构的所有组织库中识别组织样本。”总的来说,研究人员希望分析来自大约1500名弥漫性胶质瘤患者的数据,包括来自大约250名胶质瘤患者的现有外显子组序列,以及来自参与机构生物库中至少450个组织样本的新数据。
该联盟的数据基础设施和处理工作组还开发了一个计算管道的早期迭代,其中包括布罗德研究所的MuTecT和VarScan等工具,参与研究的人员将使用这些工具来处理原始序列和调用变量。Verhaak说:“之所以与Annai合作,是因为我们正在寻找一个[平台],在这个平台上,我们可以对我们拥有的数据集进行计算,我们将生成的数据集向前发展,每个机构都可以使用GLASS联盟开发的计算管道处理自己的原始数据,而不需要交换我们的数据集。”
例如,德国的一个合作机构可以将他们的原始序列加载到选定的平台上,处理数据和调用变量,取下原始序列文件,然后与联盟的其他成员共享变量调用。这样,该联盟就不会与不同国家制定的管理患者数据共享和使用方式的监管和道德框架相冲突。“这就是为什么Annai对我们来说是一个很好的解决方案,”他说。“它允许我们使用标准化的管道处理数据,而无需交换数据。”
除了收集数据和患者样本外,该联盟还在为其努力寻求更多的资金。Verhaak说,今年早些时候,该财团从国家脑肿瘤协会获得了25万美元的拨款,用于支付行政费用以及支持与监管相关的活动,如建立国际数据交换协议。该联盟还受益于向内部项目的个人研究人员提供的现有研究补助金。目前,该财团在不同的国家有两份待批准的申请,其中一份是由荷兰的一个合作机构提交的