跳到主要内容
溢价试验:

索取年度报价

癌症基因组学云试点开发人员提供更新,为早期测试开放平台

溢价

美国国家癌症研究所为癌症基因组学云试点项目选择的三个方案的开发者已经开始了不同阶段的测试,该方案旨在为分析来自癌症基因组图谱和其他nci资助项目的组学数据建立可持续的计算基础设施,该计划将在2016年1月开始评估阶段,届时所有三个平台的第一个版本都将可用。

入选NCI计划的提案包括Seven Bridges Genomics的一份;一个来自系统生物学研究所,与谷歌和SRA国际合作;另一项是布罗德研究所与加州大学伯克利分校和加州大学圣克鲁斯分校合作的研究。

七座桥梁基因组学打开登上它的平台本周,癌症研究团体将广泛早期访问使用,目的是在评估之前进一步测试和完善它。“我们的首要目标是加速癌症研究、发现和治疗患者,”该公司的高级科学家、试点项目的主要研究人员之一布兰迪·戴维斯·杜森贝里(Brandi Davis Dusenbery)在解释提前发布的理由时说。“我们认为最好的方法是尽快将我们的系统交到研究人员手中,获得他们的反馈,并继续为他们提供更好的服务。”

Dusenbery告诉GenomeWeb,该版本包含了公司在向NCI提交的最初提案中详细描述的所有功能,还包含了基于网站建议开发的额外工具,该公司建立网站是为了收集来自研究界的输入,作为其开发工作的一部分。此外,该公司还上传了除最初计划中列出的数据外的其他数据集,她说。

Dusenbery说,具体来说,初始系统的新添加包括一个案例探索工具,可以让用户根据基因组、表达和拷贝数变化数据识别有趣的研究案例。该公司还建立了一个新的基于三重存储的浏览器,允许用户查询100多种不同的临床和生物标本元数据属性。此外,该公司还构建了许多功能,允许被批准使用dbGAP中包含的受控访问数据的研究人员以兼容的方式相互协作,她说。

此外,Seven Bridges还将开放和封闭的TCGA数据集上传到其平台上。这包括所需的核心数据集和亚硫酸氢盐测序数据集(Seven Bridges选择的正交数据集),还包括mRNA测序数据和临床元数据。根据该公司在一篇博客文章中宣布的EAP的开放,该公司与AWS合作,通过亚马逊的公共数据集计划提供TCGA数据,该计划涵盖了存储TCGA数据的成本。该帖子称,这使得更多的项目资金可用作社区的计算和存储信贷。她说,CGC还为变体调用等分析任务提供了标准的生物信息学管道,研究人员也可以在该平台上实现他们自己的管道。系统支持通用工作流语言因此,使用该语言描述的管道可以很容易地在CGC上实现,也可以转移到支持该语言的其他平台上。

Seven Bridges希望为EAP签约约200名研究人员。作为EAP的一部分,该公司将在每周办公时间回答用户的问题并收集反馈。Dusenbery表示,该公司目前提供了超过100万美元的计算和存储积分,并计划以公平分享的模式将这些积分分配给平台用户,研究人员使用该系统的次数越多,他们获得的积分就越多。

她说,每个注册CGC的人都将获得至少价值100美元的计算和存储积分,用于该系统,这应该足以分析40到100个RNA测序实验的数据。此外,参加CGC早期采用计划的研究人员将获得价值500美元的AWS积分,用于系统中使用。将自己的工具或私人数据带入该系统的研究小组将能够申请最高7500美元的额外学分。除此之外,该公司还将在增量基础上分配积分。

与此同时,google的平台系统生物学研究所ISB教授、NCI合同的首席研究员Ilya Shmulevich在一封电子邮件中告诉GenomeWeb,与谷歌和SRA International合作的平台已经开放进行alpha测试,合作伙伴正在为一月份的评估做好准备。

具体来说,ISB癌症基因组试点项目的项目负责人Sheila Reynolds告诉GenomeWeb,研究人员目前正在与一组选定的合作者测试该平台,其中包括德克萨斯大学MD安德森癌症中心、俄勒冈州立大学和美国科学院英属哥伦比亚癌症机构的基因组科学中心她说。

在当前的迭代中,ISB云包含组织在谷歌BigQuery表中的所有三级TCGA数据集和正交数据集。上传的TCGA数据集列表包括临床和生物标本数据;基因表达、mRNA、蛋白质、DNA甲基化、拷贝数数据;还有一些癌症细胞系数据集来自癌症基因组学中心雷诺兹说。研究人员还将受控访问TCGA数据上传到谷歌存储中,但他们没有将其作为alpha运行的一部分。此外,开发人员还发布了一系列iPython笔记本教程,解释如何使用这些数据,她说。

雷诺兹说,目前数据可以通过一个基于web的交互式应用程序的早期版本访问,开发人员还实现了一些以编程方式访问数据的基本功能。在1月份的评估阶段之前,他们将继续开发和改进这些数据接口。

“从一开始……我们不仅希望托管非常大的文件,[即]低级的BAM和FastQ文件,并允许研究人员在云中对这类数据运行管道,而且还允许不太精通计算的用户探索开放访问数据并深入挖掘……如果他们能访问受控数据。这在很大程度上仍然是我们的愿景,”她说。

雷诺兹说,在云计算方面,开发人员计划吸收使用基于网络的应用程序探索数据的成本。然而,想要运行计算量大的分析的用户必须提交请求,在平台内建立所谓的谷歌云项目。一旦项目被批准,开发商将为分析提供资金,直到“合理”的资金被用完为止。她说:“我们将积极监控使用情况,如果人们有非常大的项目想要做,我们和他们之间就会反复讨论他们想做什么,以及在计算和存储方面需要多少成本。”“这在很大程度上将是一场试验,看看人们想做什么,以及成本是多少,所以我们将看看事情会如何发展。”

基因组网联系了布罗德研究所为了获得第三平台的更新-被称为FireCloud-这是为nci资助的倡议开发的,但截至发稿时尚未得到回应。布罗德的研究人员正在与加州大学伯克利分校和加州大学圣克鲁斯分校的研究人员合作,该平台将在谷歌云上提供布罗德的Firehose分析基础设施版本。

扫描

肥大性心肌病突变逆转人类细胞系,小鼠模型与基因编辑

《自然医学》的研究人员转向腺嘌呤碱基编辑器和精确的单导RNA方法来纠正MYH7基因中的致病性肥厚性心肌病突变。

研究小组跟踪了美国国立卫生研究院拨款的变化

通过分析过去20多年的研究项目资助,eLife的研究人员发现,在1998年至2003年期间,资助成本迅速上升,随后是稳定和下降。

研究发现胰岛细胞microrna与糖尿病的潜在联系

通过数十个基因分型个体的基因和小RNA表达谱,PNAS的研究人员检测出2型糖尿病相关的miRNAs和相关的调控特征。

研究发现,遗传疾病是婴儿死亡的未知原因

在JAMA Network Open上,Rady儿童医院的研究人员进行的一项测序分析发现,遗传疾病会导致婴儿死亡率。
Baidu
map