纽约——通过依赖英国生物银行队列内的单倍型共享,布罗德研究所的研究人员将外显子范围的变异归为整个队列。通过这个和其他的分析,研究人员发现了几个非常罕见的变异,可能是一系列数量特征的因果关系。
英国生物银行包含大约50万人的数据,包括遗传和表型信息。研究人员指出,来自英国生物银行约10%的外显子组测序数据不允许他们对超罕见变异的影响进行分析;然而,依靠生物银行参与者之间的单倍型共享,可以使他们在整个队列中归因变异,并增强他们的分析。
当他们报道自然遗传学周一,布罗德的Po-Ru Loh和他的同事们利用他们生成的数据分析了54个量化特征,发现了超过1000个显著的特征变异关联,包括影响身高的大效应罕见变异。
Loh在一封电子邮件中说:“总的来说,归因的主要思想是利用参考数据来分析没有在队列中直接测量的遗传变异,从而扩大现有数据集的效用,而不产生额外的成本。”“在过去,这种方法主要应用于在人群中普遍观察到的变异,但在这项工作中,我们将其应用于非常罕见的编码变异,传统上被认为只有通过直接测序才能获得。”
特别是,研究人员使用了来自49,960名英国生物银行参与者的全外显子组测序数据和整个队列的snp -阵列基因分型数据,以高精度地归因罕见变体——包括那些等位基因频率约为0.00005的小变体。他们进一步测试了这些归因变量是否与人体测量特征、血压和肺功能等54个量化特征相关,使用了超过459000名欧洲血统的英国生物银行参与者的线性混合模型关联。这确定了数以万计的关联。
经过严格的筛选,研究人员锁定了一组1189个与675个独特的蛋白质改变变异可能是因果关系的关联。他们估计,其中30%的关联只能通过使用英国生物银行的外显子组测序数据进行归咎来确定。对于血细胞特征和身高——研究人员将分析重点放在这两个特征上——他们还计算出,他们发现的约四分之一与血细胞特征相关的变异和45%与身高相关的变异没有被最近的大型关联研究捕获。
在发现的可能的因果变异-性状关联中,大约有一半发生在同一性状的多个可能的因果罕见编码变异的基因中,这强调了长等位基因序列的作用。研究人员进一步梳理出影响众多性状核心基因的长等位基因序列,其中一个包含45个不同的可能的因果变异。
研究人员还发现了新的大影响变量,比如影响身高的变量。其中一些基因以前曾与孟德尔疾病有关,如NPR2、COL2A1和HERC1,但变异本身是新的。
根据研究人员的说法,他们的研究预示了未来的研究将能够做什么,随着外显子组关联研究变得更大,因为非常大的外显子组测序数据集代表自然遗传扰动实验。他们补充说,将整个外显子组归责到更大的队列中,可以帮助衡量人类基因组中编码变异的影响。Loh指出,他们的方法可以应用于其他大型基因数据集。
他补充说,他和他的团队现在正在“研究几个相关的研究方向,检查致病变异的外显性,并确定罕见的基因改变拷贝数变异。”