芝加哥——迈克尔·j·福克斯帕金森病研究基金会的一个新的以rna为中心的大型数据集有望指导研究人员发现神经疾病进展的新的生物标志物。
8月底发布的帕金森病进展标志物计划(PPMI) RNA测序项目数据集包含108tb的纵向信息,来自1589个个体的4750多个生物样本。尽管PPMI RNA-seq比癌症基因组图谱等多疾病、多pb的数据库要小,但迈克尔·j·福克斯基金会表示,PPMI RNA-seq是迄今为止创建的最大的疾病特定数据集。
被识别的队列包括帕金森患者和其他符合帕金森病临床和遗传危险因素的人,有特发性指征的人,以及对照志愿者。
该基金会于2010年在迈克尔·j·福克斯基金会的资助下成立PPMI是一个合作项目旨在验证帕金森病的进展标记物。
该项目包括多种形式的数据收集,包括临床和成像数据以及来自血液、血浆、血清、尿液、组织和脑脊液样本的全外显子组、全基因组和转录组测序数据。临床信息可能包括医疗记录以及认知评估、睡眠问卷和抑郁评估,而影像学数据包括DaTscan(碘氟烷I123)放射药物测试、结构MRI,以及(如果有的话)弥散张量成像。
Casey说:“我们已经研究了各种其他成分,我们积极分发剩余的生物样本,继续支持生物标记物的发现和生物标记物的验证。”
PPMI RNA-seq收集将继续扩大,对原始样本和未来收集的任何样本进行全基因组和转录组测序。迈克尔·j·福克斯基金会(Michael J. Fox Foundation)研究项目副主任布拉德福德·凯西(Bradford Casey)说,“只要我们继续进行测序,在可预见的未来,我们确实有发布计划。”
下一个大的发布,可能会在未来几周内发生,将添加非编码RNA数据到集合中。
“在那里,你学到了很多关于帕金森病基因调控的知识。我们仍然发现了新的非编码rna……这让我们对生物学有了新的见解,”凯西说。
下个月,根据Casey的说法,PPMI将把这个庞大的RNA-seq数据集贡献给美国国立卫生研究院加速药物伙伴关系-帕金森病该平台也寻求验证PD生物标志物。这种公私合作伙伴关系包括美国国立卫生研究院基金会、谷歌姐妹公司Verily和许多制药公司。
“我们的目标是让人们把他们的想法带到数据中,”凯西说。“对于我们生物信息学家来说,拥有这个数据集是一笔财富。我认为这将使我的团队和许多其他人忙碌数年,以了解这些数据中的内容,”他补充道。
作为一个纵向数据集,PPMI对每个主题进行多个样本,在三年时间内多达五次。南加州大学凯克医学院转化基因组学研究所联合主任大卫·克雷格说:“我们的研究非常深入和广泛,每个样本有2亿次读取,在某些情况下,仅rna测序就有10亿次读取。”Craig专注于基因组学、生物信息学和神经基因组学,与凤凰城转化基因组学研究所的Kendall Van Keuren-Jensen共同领导PPMI的RNA-seq部分。
克雷格说:“你把它与全基因组测序联系起来,再加上数百个临床变量,再加上成像,这真是一个令人难以置信的组合。”
通过一个门户网站,研究人员可以注册免费下载数据,从而获得原始测序数据、完整数据集的可定制表,以及一个可视化工具,帮助他们跟踪人类基因组中每个转录本的基因表达变化。
Casey说,数据共享和开放获取是RNA-seq项目和整个PPMI的核心原则。
“我们不仅在项目结束时共享数据,实际上我们在项目中期也共享原始数据。实际上,只要它从测序仪上拿下来,经过质量控制,我们就尽可能地让任何PPMI研究人员都能获得它。”Casey说。
德国萨尔大学(Saarland University)生物信息学中心主任、斯坦福大学(Stanford University)今年的神经学和神经生物学客座教授安德烈亚斯·凯勒(Andreas Keller)就是其中一名研究人员。
凯勒目前正在测试随着帕金森病的发展,基因和非编码RNA的变化是否会加速。凯勒说,从PPMI数据集中,他和大西洋两岸的同事们都注意到了这种迹象。
他说:“我们发现,随着疾病的发展,这种失调会变得越来越严重,所以这给了我们很大的希望”,让我们能够通过研究找到更有效的治疗方法。
凯勒还在测试一个假设,PD可能比之前假设的更依赖于年龄,早发性PD的生物标记物与表明疾病晚发性PD的生物标记物不同。
他说:“这可能会改变我们对生物标志物是静态事物的看法。”
凯勒补充说,他的实验室目前正试图验证早期结果,表明基因表达在遗传性和非遗传性帕金森症中有所不同。
Keller期望计算生物学家对这个基因组和转录组数据集感到“兴奋”。他指出,原始数据也可以提供给想要建立自己处理管道的计算生物学家。
“我们认为这是我们的旗舰生物标志物观察研究,”Casey补充说。“同样,我们的目标是以任何方式增强该领域的能力,因为临床可部署的生物标志物仍然是一个迫切的、未满足的需求。”