解码遗传学(安进公司的子公司)、冰岛大学和雷克雅未克大学的研究人员进行了一项针对血浆蛋白质、基因组学和转录组学数据的人口规模研究,以创建一种新的资源,可用于进一步阐明疾病的发病机制。
在一项发表在自然遗传学周四研究人员描述了用近5,000个适体测量的逾35,000名冰岛人血浆蛋白质水平的全基因组关联研究。他们发现序列变异和血浆蛋白水平之间有18000多个关联,其中19%与罕见的变异有关。总的来说,93%的关联是新奇的。他们还测试了与373种疾病和其他性状相关的血浆蛋白水平,并确定了257,490种这样的联系。
解码的研究人员6月份进行了一项类似的蛋白质组学研究在该研究中,他们使用蛋白质组学测量方法来开发全因死亡短期和长期风险的预测因子。预测器能够识别60到80岁之间的高危人群,其中88%的人在10年内死亡,以及低风险人群,其中1%的人在10年内死亡。
在他们的新论文中,他们整合了蛋白质数量性状位点(pQTL)和与疾病和其他性状的遗传关联,发现GWAS目录中45334个先导关联中的12%与pQTL高度连锁不平衡的变体有关。他们进一步确定了938个编码潜在药物靶点的基因,这些基因的变异会影响可能的生物标志物水平。
“蛋白质组学可以帮助解决基因研究中的一个主要挑战:确定是什么基因对一种疾病的序列变异的影响负责,”Decode的首席执行官Kari Stefansson在一份声明中说,他是这篇论文的共同高级作者。“此外,蛋白质组提供了一些时间的测量,因为血液中的蛋白质水平随着时间的变化而上升和下降。”
作者指出,这些数据也可以用于协助药物的发现和开发。
研究人员使用SomaLogic的SomaScan多重适体分析法对35559名具有基因型和表型信息的冰岛人的血浆蛋白质水平进行了测量,并分析了4907个适体,测量了4719个蛋白质。他们发现,考虑到多次测试,63%的蛋白质水平与年龄呈正相关,18%的蛋白质水平与年龄负相关。此外,33%的蛋白质含量在男性中高于女性,在女性中高于23%。
随后,研究人员在冰岛队列中测试了2720万个基因组变异与血浆蛋白质水平的关系。他们发现了18084个主要的或前哨的pQTL关联,每一个都代表着与一个区域的蛋白质水平最显著的关联。根据条件分析,在18,084个前哨pQTL关联中,21%与与前哨变异相同区域的次生变异相关,且与相同的蛋白质相关。研究小组总共发现了28,191个前哨和次要pQTL关联。
研究人员还使用血浆中pQTL和不同组织中表达数量性状位点(eQTL)之间的共定位,作为评估血浆蛋白水平如何反映不同组织中的生物过程的一种手段。他们发现了一种很强的正相关独联体组织中的eQTL以及在血浆中与该组织中的eQTL存在高度连锁不平衡的pQTL的概率。总的来说,他们指出,这表明很大一部分蛋白质最终进入了血液。
然后,研究人员测试了蛋白质水平与一系列373种疾病和其他特征之间的联系,并确定了257490种这样的联系。研究人员说,这些结果表明,改变的蛋白质水平可能是疾病的原因,疾病的后果,或与疾病的风险因素有关,但不是原因或结果。在本例中,研究人员评估了与蛋白质血浆水平相关的序列变异与疾病的关系,反之亦然,研究人员在GWAS目录中确定了45334个先导变异-性状关联,其中5458个与至少一个pQTL的前哨变异存在高度连锁不平衡。他们补充说,PQTL数据结合疾病和其他性状的联系可以帮助确定致病基因。
作者总结道:“当同一序列中的变异与一种疾病的风险和一种蛋白质水平相关时,就可以在基因位点上识别出致病基因。”“此外,如果影响该蛋白质水平的基因组中的其他变异也影响疾病的风险,那么该蛋白质水平很可能在疾病的发病机制中发挥作用,而不是疾病的后果。”这是非常重要的,因为大量疾病位点的致病基因是未知的。”
他们进一步补充说,pQTL数据可以提供有关作用方向的信息,当结合因果基因鉴定时,这对药物靶点和生物标志物的发现很重要。