纽约——通过结合两大人群队列的基因组数据,研究人员发现了与人类疾病相关的蛋白质编码基因的新变体。
一个国际研究团队将超过39万英国生物银行参与者的全外显子组测序数据与超过26万FinnGen参与者的归因基因型相结合,使他们能够更好地检查罕见和低频变异对疾病的贡献。他们指出,全基因组关联研究在检测这些类型的变异方面往往能力不足。
当他们日报道在自然,研究人员发现了这些队列中蛋白质编码变异与744个疾病终点之间的近1000个关联,并能够开始描述可能的疾病机制。
Biogen公司人类遗传学负责人、资深作者Heiko Runz及其同事在论文中写道:“我们的研究结果展示了将大人群队列结合起来发现和复制新的联系的好处,解释了一系列常见和罕见疾病的疾病机制,并阐明了基因分型和测序研究之前都无法解决的等位基因谱的巨大差距。”
Runz和他的同事们对不同疾病终点进行了一项编码范围的关联研究,梳理出975个符合全基因组显著性的关联和717个符合更保守的多重测试显著性阈值的关联。研究人员估计,在975个关联中,如果分别分析这两个数据集,将不会检测到387个关联。
他们特别指出,与非芬兰裔欧洲人相比,他们的分析得益于芬兰人罕见等位基因的富集,因为芬兰人代表着一个独特的基因库。这提高了它们发现关联的能力。
研究人员将他们的发现与之前的全基因组关联研究和ClinVar条目进行了交叉参照,发现约三分之一的关联从未被报道过,其中177个不同的位点位于之前未被映射到该疾病的基因中。
此外,482个基因与148个不同的疾病集群相关。大多数基因与一个疾病集群相关,但约有12个基因与至少5个集群相关。例如,CHEK2的变异不仅与乳腺癌有关,还与结直肠癌、甲状腺癌、卵巢囊肿和良性脑膜肿瘤的风险有关。
有了这些发现,研究人员也可以开始关注与疾病相关的途径。例如,他们发现了两种与肺栓塞风险相关的罕见变异,它们都存在于编码凝血级联蛋白的基因中,并影响这些因素的循环水平。
同时,SLC34A1中的一个删除,它为NPT2a钠转运蛋白与肾结石和尿路结石的风险增加有关,也与血清钙增加和磷酸盐减少有关。这些和其他发现表明,针对NPT2A基因通路的治疗可能有利于缺失携带者。
研究人员还关注了与心房纤颤风险相关的变异。例如,甲基化酶基因METTL11B的一个低频错义变体与心房颤动风险增加有关。该变异落在配体结合位点上,预计会影响其他疾病风险基因的甲基化。同样,研究人员注意到SCN5A-SCN10A位点内的其他变异与降低房颤风险、降低脉搏和增加房室传导阻滞风险相关,表明SCN10A编码的钠通道功能的丧失可能会影响心房的迷走神经活动。
总之,研究人员指出,他们的方法使他们能够发现与疾病相关的其他罕见和低频变异。他们补充说:“我们的结果预示着在更大的样本量下,从跨生物库分析中发现了许多额外的编码和非编码联系。”