芝加哥——费城儿童医院(CHOP)的神经遗传学家和生物信息学家开发了一种技术,可以自动对儿童癫痫患者进行表型分析,从而在电子医疗记录中创建基因特异性“脚印”。他们希望这种计算技术将帮助研究人员扩大结果研究,并最终在护理点提供更好的临床决策支持。
他们在一份报告中描述了他们的工作纸发表在医学遗传学上周。
这项研究涉及了658名确诊或推测为遗传性癫痫的患者。研究人员很容易把这组人组合在一起,因为他们的基因测试清楚地显示出了突变。当他们试图将这些基因信息与每个患者的临床记录相匹配时,情况变得混乱起来。
作者指出,超过30%的发育性脑病和癫痫性脑病与基因突变有关,但很难识别致病基因,因为所有患者中通常只有不到1%的人存在特定的变异。拥有一个完整的表现型可以提高准确性,并允许医生为家庭提供更好的估计,如何以及何时他们的孩子可能出现癫痫症状。
像CHOP这样的组织可以一次分析数千个外显子体,仅受计算能力的限制,但在研究研究中包含临床数据通常需要缓慢、劳动密集型的手工图表审查。首席研究员Ingo Helbig是CHOP癫痫神经遗传学计划(ENGIN)基因组和数据科学核心的主任,他将这描述为过去10年左右发展起来的“表型差距”。
“这意味着我们对临床数据的理解和处理临床数据的能力远远落后于我们对遗传学的理解,”他说。
Helbig说:“我们使用这项技术的目标vwin德赢ac米兰合作是找到观察自然史、药物反应和结果的互补方法”,这是许多罕见疾病所缺少的。“我们只是没有能力手动检查一千名患者的病历,重建患者的病史或每一种罕见疾病。”
他指出,表型数据分析不像基因组分析那样可扩展。“我们在过去十年中看到的是,我们对表型的理解越来越落后,特别是当我们观察有关结果的信息和纵向疾病历史时。我们在基因发现方面远远落后,”赫尔比格说。
赫尔比格的实验室在过去四年里一直致力于解决这一问题。
这篇新文章建立在对表型的早期研究的基础上,在该研究中,赫尔比格领导的一个团队建立了计算机算法,发现了一种表型新创可能导致发育性和癫痫性脑病的基因变异。这项研究,在2019年出版在美国人类遗传学杂志描述了一系列功能分析,显示了AP2M1基因的改变如何影响网格蛋白介导的内吞作用和突触囊泡循环,通过这些变异可以影响疾病。
赫尔比格在CHOP的实验室一直专注于癫痫的基因发现。的美国人类遗传学杂志这篇文章是赫尔比格第一次将基因发现与临床数据结合起来。这项新工作是第一批随着时间推移“重建”儿童癫痫患者历史的研究之一,以在纵向记录中寻找新的表型见解。
“EMR基因组学的时代已经开始,”赫尔比格宣布。
纵向数据集的658个人医学遗传学这篇论文包含了62,104例患者接触记录,代表了3251例患者观察年,涵盖了包括SCN1A、SCN2A和STXBP1等基因突变。“这是一个相对较大的数据集,我们现在可以使用它来得出关于某些癫痫是如何随着时间推移而实际出现的结论,”赫尔比格说。
他说,这几乎是一项全基因组关联研究,因为研究人员寻找已知遗传模式和表型之间的显著相关性,如Dravet综合征的临床表达,这是一种罕见的严重儿童癫痫,与SCN1A基因的变体有关。在一个两岁儿童的死亡中对这种变异的所谓错误分类是一个对Quest Diagnostics的长期诉讼.
赫尔比格指出:“许多这种情况都有已知的模式。”“我们问的第一个问题是:当我们将表型数据转换成这种计算格式时,我们是否看到了我们预期的模式?”
研究人员观察了患者的表现和病史,希望能发现疾病的“足迹”,或关于罕见癫痫进展的知识。CHOP生物信息学团队必须通过将每个突变映射到人类表型本体论术语来标准化和协调表型。
赫尔比格解释说:“我们花了两年的时间,如何将表型转化为一种标准化的格式,即人类表型本体论,然后将其映射到一定的时间增量上,这样我们就可以在任何时间点比较两个患者。”
这项研究是那种劳动的成果。例如,现在研究人员可以深入研究队列中与SCN2A基因相关的爆发抑制的个体,SCN2A基因是癫痫性脑病的一种严重表达。海尔比格说:“我们实际上是通过这种自动分析来复制这些条件下的自然历史或相关特征。”这一过程几乎不可能通过人工图表审查实现。
“这种方法的美妙之处在于它是可扩展的,”赫尔比格说。“我们在一个非常大的队列中研究自然史,我们已经表明,我们可以复制我们通常预期这些条件具有的模式。”
CHOP有Epic Systems的电子医疗记录,但还没有使用基因组学模块这是Epic在2019年上半年向其客户提供的。赫尔比格说,CHOP将从Epic公司导出的已识别的患者数据合并到其基因组学管道中。
医院做出这一决定有几个原因,包括表型匹配早于Epic基因组模块,EMR附加组件更多是为临床实践而不是研究设计的。
“病历本身分析数据的功能是相当有限的,”赫尔比格说。“由于我们是一个生物信息学小组,我们使用自己的数据处理管道来处理基因组数据。”
CHOP确实有一个长期目标,就是让这种预测能力为护理点的临床决策支持提供信息。目前,这项技术纯粹用于研究,但赫尔比格vwin德赢ac米兰合作的实验室正开始研究基因型-表型模式,这可能能够预测诊断,导致罕见疾病的早期发现。
赫尔比格解释说:“我们正在将临床数据转换成一种格式,可以用于计算,可以用于信息学方法,也可以用于未来的机器学习方法。”
“最终,我们希望这样做可以改善病人的护理。我们希望使用同样的规则来应用于药物反应,并将其作为一个框架,慢慢但肯定地将其整合到一个深思熟虑的方法论框架中,以改善对癫痫患儿的护理。”他继续说道。
赫尔比格认为,这项技术可以转移到其他机构,因为它依赖vwin德赢ac米兰合作于公开的HPO。他说:“这是一个可推广的概念,说明了在任何机构或任何类型的全球框架下,如何使用医疗记录数据来重建以前的历史。”
“我们不想创造任何只适用于我们机构的东西。我们想创建一个关于如何使用这些信息的通用框架,”赫尔比格说。“我们在这里所做的是向EMR基因组学时代迈出的第一步,在这个时代,我们可以有意义地将我们知道如何处理的遗传信息与电子病历数据结合起来,这对我们来说是新的。”