纽约 - 服用疾病发病年龄的新方法,考虑到各种各样的家族历史可以提高基因组关联研究的力量,发现了一个新的分析。
大多数GWA都依赖于案例控制数据,这可能不考虑个人在疾病疾病的情况下达到年龄范围,或者是否控制疾病的家族史。
丹麦研究人员现已制定了一种多元责任阈值模型,该概率延伸了一个有关家庭历史的现有的责任阈值模型,也可以占发育和性别的年龄。他们提出这些变化可以提高GWA的权力。
正如他们所报道的那样在里面美国人遗传学杂志周二,研究人员将它们的方法称为LT-FH ++,将模拟数据以及来自英国BioBank和IPSYC数据集的数据。与典型病例对照方法相比,它们估计LT-FH ++可以将GWA的统计力提高至多61%。
"As more genetic datasets with linked health records and family information become available, e.g., in large national biobank projects, we expect the value of statistical methods that can efficiently distill family history and individual health information into biological insight will only increase," senior author Bjarni Vilhjálmsson from Aarhus University and his colleagues wrote in their paper.
LT-FH ++方法构建了每个人对疾病具有一定责任的想法,并且一旦通过样品或人口普遍决定的一定的阈值,它们被认为是一种情况。在前面的LT-FH模型中,该责任被分解为遗传和环境部件,其中遗传成分可以包括家族史。新的LT-FH ++方法是基于该人的年龄,诞生年度的责任阈值来个性化,以考虑群组效应 - 和性别。
研究人员使用模拟数据对LT-FH和案例控制方法进行基准测试。他们发现,超过10种模拟,LT-FH ++在标准GWA的34%和61%之间具有功率改善。相比之下,LT-FH的功率提高了14%和54%。但是,这些功率增益估计,因家庭的样本大小和完整性而变化,或者终止的信息。
他们进一步将LT-FH ++应用于英国BIOBANK和丹麦IPSYCR寄存器的真实数据。具体而言,它们使用LT-FH ++,LT-FH和案例控制方法与英国生物安数据进行了GWA的死亡率。通过标准案例控制方法,研究人员无法找到任何重要的SNP,但LT-FH方法揭示了两种具有基因组显着意义的SNP,一个在Apoe中,它与死亡率有关,并且在Hykk处有一个,与吸烟行为有关。LT-FH ++确定了这两个SNP以及八个额外的SNP,包括HLA-B,MYCBP2和ZBBX附近。
同时,使用IPSYC数据集,LT-FH ++方法确定了比检查障碍的其他人的基因组显着的重要关联。
然而,研究人员注意到,对于ADHD,使用LT-FH或LT-FH ++几乎没有功率改进,而不是一个案例控制方法,它们表示可能是由于多变量责任阈值模型的潜在假设,例如由于家庭成员之间没有环境协方差,或者通过诊断年龄遗传架构没有差异。
vilhjálmsson和他的同事补充说,当案件通过下采样和患病率高达时,他们的方法提供了最大的电力收益。他们补充说,它也受到进入详细健康寄存器数据的限制,尽管他们指出,该方法可以应用于具有缺失或部分数据的个人,并且可以从国家统计数据获得流行率。