跳到主要内容
溢价试验:

索取年度报价

“我们所有人研究计划”的第一个基因组数据发布帮助推动了数百项研究

溢价

纽约——上周,美国国立卫生研究院“我们所有人研究项目”公布了近10万个全基因组序列,研究人员现在可以开始利用这种新资源进行研究了。

近一半的数据来自自认为属于研究中代表性不足的种族或民族群体的个人。以前的大规模基因组研究严重依赖于欧洲血统的人群,一些估计表明,90%以上的大型基因组研究都聚焦于欧洲人,这让人怀疑,这些研究的结果是否可以推广到其他人群。这个新的数据集——不仅包括测序,还包括阵列数据以及关联的电子健康和调查数据——旨在更能代表美国人口。

随着数据的发布,我们所有人现在都是一个精选的大规模基因组研究团队的一部分,包括英国生物银行、百万老兵计划和美国国立卫生研究院的精确医学跨组学(TOPMed)计划。

据All of Us项目的首席数据官安德里亚·拉米雷斯(Andrea Ramirez)说,研究人员可以通过一个名为All of Us研究员工作台(All of Us research Workbench)的云平台注册访问测序和其他数据,平台目录中已经有数百个活跃的项目。

拉米雷斯说:“我们希望很多人加入进来,并真正利用我们数据集的多样性。”

这个项目开始招募参与者2018年5月,目标是登记100万人。基因组测序得到了一个合作伙伴联盟的帮助,包括贝勒医学院、布罗德研究所和华盛顿大学西北基因组学中心。目前,已有超过32.6万人同意参加该项目,回答了三次调查,提供了物理测量,并提供了至少一个生物标本。

新发布的数据包括近10万人的全基因组测序数据,以及16.5万参与者的基因分型阵列数据,其中约一半的参与者属于研究中代表性不足的种族或民族。

该数据集还包括身高、体重、血压等身体测量数据,以及调查数据,如参与者的人口统计数据、生活方式和总体健康状况。它还包含了一些参与者的Fitbit数据,并与美国人口普查局(US Census Bureau)进行的美国社区调查(American Community Survey)的数据相关联,以提供有关参与者社区的更多信息。

美国的研究人员可以通过工作台的受控访问层访问这些数据。此外,还有其他保护措施来保护参与者的隐私。例如,All of Us已经删除了某些参与者标识符的数据,以降低他们被重新识别的风险。

要注册访问权限,研究人员所在的大学或机构必须首先有数据使用注册协议,目前已有300多家机构这样做。拉米雷斯说,如果研究人员所在的机构已经签署了一份协议,他们可以在大约两小时内访问“我们所有人”的数据,然后进行一个关于负责任的数据使用的简短培训。

Ramirez说,All of Us research Workbench提供了基于云的访问,因此研究人员不需要拥有自己的集群才能使用数据,而带回家的数据集是必须的。她补充说,该项目使用观察医疗结果伙伴关系的基础设施来标准化不同的数据类型。

访问工作台是免费的,但通过谷歌云平台可能会产生数据存储和计算费用。注册后,研究人员可以获得300美元的积分。

拉米雷斯指出,数据发布才几天,但已经有数百项注册研究。这些研究包括研究与血管疾病相关的基因、败血症的遗传风险和对COVID-19的遗传易感性。

她指出,在这个数据集发布之前,项目研究人员对该数据集进行了“深入研究”,以测试其实用性并验证其有效性。例如,他们确保它可以复制已知的发现,比如先前发现的全基因组脂质信号的基因特征,以及应用于新的问题。

这也使他们能够为其他使用工作台的研究人员提供代码,这些代码可以很容易地适应他们自己的研究问题,这样他们就可以专注于回答那些问题,她说。

拉米雷斯说,该项目预计每年发布两次新数据。“我们所有人的研究项目”预计也将在2026年底全部注册。

扫描

还能用吗

据《纽约时报》报道,一项新的研究通过植入前非整倍体基因检测检测异常胚胎的结果。

就涉嫌伪造COVID-19结果达成和解

据《洛杉矶时报》报道,Sameday Technologies因涉嫌伪造COVID-19检测结果达成了超过2000万美元的和解协议。

非营利组织推动资助机构的有效性

据《Stat News》报道,一个新的非营利组织旨在推动美国联邦研究机构提高效率。

关于癌症突变特征的科学论文,传递CRISRP-Cas9机制跨越血脑屏障的系统

本周的《科学》杂志:数千对肿瘤-正常配对的突变特征分析,以及更多。
Baidu
map