芝加哥(基因组网)——本月,精准医疗计划宣布已经开始招募测试人员我们所有人的研究项目
以前被称为PMI队列计划,我们所有人都寻求收集、存储和传播至少100万美国居民的健康、遗传、生活方式和环境数据,作为启动和推进个性化医疗研究的一种方式。
招募参与者的工作正在三个城市进行,最终将包括100多个地点,包括学术医疗中心、卫生系统、社区医院、联邦合格的卫生中心和其他地点。范德堡大学(Vanderbilt University)生物医学信息学和医学副教授约书亚·丹尼(Joshua Denny)表示,没有隶属于参与该计划的医疗系统的人将能够在Quest Diagnostics实验室和沃尔格林药房等地方捐献DNA样本。
“我们肯定专注于招募多元化的员工。这是核心原则,”丹尼说。
Denny负责All of Us数据和研究中心;范德比尔特是该项目数据方面的牵头机构,并得到了Alphabet生命科学子公司Verily和Broad研究所的大力帮助。Denny说:“我们拥有所有的数据,并连接到前端应用程序。”
一切都存储在谷歌云,由许多其他技术支持。Denny解释说,例如,Vanderbilt正在开发计算工具、云工作台和一组队列浏览器,这是一个供其他人输入数据的前端。
在由7家供应商组织和其他fqhc组成的试点组织中,其他机构正在构建面向参与者的应用程序,从DNA样本、患者访谈和电子健康记录中收集患者数据,然后将信息转发给研究和数据中心。丹尼说:“他们通过所有这些不同的招聘网站向我们发送他们的电子病历数据。
目前,范德比尔特大学只是储存样本,因为它从5月31日才开始招募参与者。丹尼说:“我们稍后会进行基因检测。”其他网站也有自己的时间表。
Denny和GenomeWeb关于管理来自全国各地的大量信息的一些挑战,包括长期困扰许多其他医疗IT项目的互操作性问题。
以下是对话的文字记录,为清晰起见,经过了编辑。
你是如何设计数据和研究中心的?
范德比尔特大学已经建立了一个拥有大约24万人的大型DNA生物库。这就是表现型的全部力量。你可以做遗传学研究的唯一方法是使用我们资源中的电子病历。这成为了我们所有人的模型,使用电子病历数据作为一种方式来被动地收集一系列不同疾病的丰富表型。
正如你所知道的,互操作性一直是电子病历的一个问题。你是如何解决这个问题的?
每个来就诊的人都要做一定的测量,他们还会捐献血液和尿液。对于这些人,我们将进行自己的基因检测。我们并不依赖电子病历获取基因组信息。但出于研究目的,我们必须处理电子病历,而且存在互操作性问题。
我们解决这个问题的方法之一是使用公共数据模型。我们已经采用了公共数据模型[来自观察医疗结果伙伴关系]。我们之所以选择OMOP,是因为它比国家以患者为中心的临床研究网络等新模型更具包容性。PCORnet)]我们与它有很多联系。它有更多的软件。从一开始,它就试图包括所有的实验室。它有一个关于如何恢复NLP派生概念的NLP扩展。我们和OMOP有很深的联系。
网站正在将他们的数据标准化到OMOP并发送出去。我们正在集中对数据进行(质量控制),并寻找看起来不太到位的东西,可能是网站之间的不一致。
对于直接的志愿者,我们也在推广科学同步标准。这是一项符合[联邦电子病历激励计划]的vwin德赢ac米兰合作新兴技术“有意义的使用”第三阶段,即访问信息的API。这些数据基本上是杠杆作用FHIR[快速医疗保健互操作性资源标准]。这是我们正在试点的新兴事物,所以也可能有一些基于fhir的数据。
FHIR中的许多标准与你在OMOP中看到的相似。可以说,OMOP是可以通过FHIR传输和共享的数据的数据库表示。这是你在收到数据后如何组织数据。
您是否要求所有参与的组织使用这些标准?
参与组织正在通过OMOP向我们发送数据。在我们招募第一批参与者之前,我们做了一些我们称之为“数据冲刺”的工作,并发送了一些数据。这很顺利,对每个人来说都是一次很好的学习经历。
我们不会从完整的电子病历开始,但我们希望朝着这个方向努力。正如你强调的那样,互操作性很有挑战性,从电子病历中获取这些数据也很有挑战性,特别是在我们正在谈论的全国范围内的规模上。这是我们从某些步骤开始的事情,我们正在向前扩展到其他方面。我们从账单代码、访问数据、药物和实验室开始,然后转移到更多的实验室,构建它们,并随着时间的推移进行记录。
你的时间表是什么?什么时候开始对一些样本进行测序,什么时候传播信息?
数据将主要通过我们正在构建的研究工具集中访问。我们的期望是,随着我们招募参与者,将会有渐进式的发布。可能在2018年的某个时候,你会看到一些数据可以用于研究。这取决于很多因素:开发工具,获取数据,我们招募人员的速度。
你会提供什么样的信息?
在某一时刻会有个体的基因数据。我们还没有弄清楚所有这些事情,关于协议将是什么,但当然我们的首要任务是获得遗传数据。
我们有血液、尿液和EHR数据,还有参与者调查,我们也会有移动和数字健康设备。记住,我们也会亲自上门检查,测量身高、体重、身体质量指数、腰围、臀围和血压。这些协议也可能随着时间的推移而扩展。这是他们实际提供给我们的数据和我们可以被动收集的数据的组合。随着时间的推移,我们真的有能力跨越所有这些模式。但是很多协议还没有制定出来。
还有一些事情我们正在研究,比如基因数据,以及我们可能收集什么样的传感器数据。其中一些将通过试点来完成,我们将看到它是如何工作的。我们可能会发现某个设备听起来很棒,但当我们尝试使用它时,它的效果并不好,所以我们就不这么做了。
我们的愿望是获得一个健壮的多维数据集,用于真正广泛的使用。我们需要在该批处理中有足够的参与者,以使该资源成为对人们有用的资源。
我们的期望是,我们不会等到每个人都注册了。我们会持续做一些事情。将需要四到五年的时间让100万人注册,但在此之前我们会有有用的数据,以确保其他人也能获得这些数据。
你还有什么其他的目标和技术问题要解决?
围绕所有这些类型的数据存在一个协调问题。我不知道是否曾经有过这样一个分散的项目。有一些网络在较小的规模上做了这个实验并取得了成功,其中之一就是出现网络.但我们希望在这里有很多事情能有所突破。
另一件让我们与众不同的事情是参与者可以访问他们的信息。他们也可以登录,因为他们得到了基因测试结果。这不是一个临床试验,但人们可以用它来进行临床试验。
我希望这能推动基因医学的发展,不仅仅是研究,更多的人会了解他们的基因型,这可以推动医疗。这可能会改变社区医生开始思考这个问题的方式,因为它变得越来越普遍。