纽约——通过对一系列不同的人类基因组的检测,研究人员发现了超过125000个结构变异,其中包括一些可能具有重要的医学意义的变异。
来自威康桑格研究所的研究人员检查了人类基因组多样性小组的结构变异报道细胞周四,发现了一些特定人群的结构变异,以及一些似乎是通过与远古人类群体的基因渗入而出现在人类基因组中的结构变异。其中一些变异似乎影响免疫相关基因,并可能影响疾病易感性。
威康桑格研究所的第一作者穆罕默德·阿尔马里在一份声明中说:“通过分析未得到充分研究的人群的基因组,我们已经能够发现之前大规模测序项目没有发现的高频结构变异。”“其中一些基因在医学上很重要,它们告诉我们一个群体是如何进化来抵抗某种疾病的,或者为什么他们可能容易受到其他疾病的影响。”
Almarri和他的同事们对从54个人类群体中收集的911份样本的全部基因组进行了测序,平均深度为36倍。在将reads映射到人类参考基因组后,研究人员确定了126018个结构变异。
其中,约78%的数据在以前的研究中没有出现过。研究人员指出,这突显了人类多样性尚未得到承认的程度,以及研究代表性不足人群的必要性。
他们进一步探索了这些结构变化在全球人口中的普遍程度,发现有些结构变化更普遍,甚至只针对特定群体。在低地/塞皮克巴布亚人中,与疟疾相关的HBA2缺失几乎固定了——影响了86%,但在巴布亚高地人中没有发现。研究人员指出,疟疾存在于巴布亚新几内亚的低地,而不是高地。
同时,影响MGAM的14千碱基缺失只在南美Karitiana种群中发现,频率为40%。MGAM编码一种参与消化膳食淀粉的酶,这种缺失很可能使该基因失活。卡里蒂亚纳的种群经历了一次严重的种群崩溃,研究人员说,这可能使这种不利的等位基因变得普遍。
其他结构变异似乎起源于远古人类群体,如丹尼索瓦人,他们与现代人杂交。在大洋洲人中,他们注意到16p12染色体的重复,这被认为是由于丹尼索瓦人的基因渗透和AQR基因的缺失,而AQR基因只在大洋洲人和阿尔泰丹尼索瓦人中发现。该基因编码一种RNA解旋酶,它通常参与检测病毒RNA和介导免疫反应。
另一种仅在美洲苏瑞人和皮马人和尼安德特人中发现的缺失消除了MS4A1基因中的一个外显子,该基因编码CD20, CD20是一种B细胞分化抗原,参与T细胞独立抗体反应。它也是B细胞相关白血病、淋巴瘤和自身免疫疾病的许多治疗方法的靶点,这表明在一个人群中开发的这些疾病的治疗方法可能并不适用于其他人群。
研究人员还发现了一些失控复制的例子,包括在非洲人群中出现的高水平复制,以及在中东人群中出现的较低程度复制,这些复制增加了抗昏睡病的HPR基因的拷贝数量。
“结构变异很复杂,但在功能、进化和医学上都非常重要,”最近从威康桑格研究所退休的资深作者薛雅丽在一份声明中说。“这些新的结构变异的发现为这种变异提供了迄今为止最丰富的资源之一,这不仅为人口历史提供了独特的见解,改进了目前使用的人类参考基因组,而且也将大大有利于未来的医学研究。”