来自美国各地的一组研究人员开发了一套更新的恒河猴参考基因组(解剖)——生物医学研究中使用最广泛的非人类灵长类动物(NHP)模型——发现新的谱系特异性基因和扩展的基因家族,这可能为进化和人类疾病的研究提供信息。
在周四发表的一项研究科学研究人员说,他们更新后的猕猴基因组组装将序列的连续性提高了120倍。他们还使用650万份全长转录本对其进行注释,以提高对其基因内容、亚型多样性和重复组织的理解。
研究人员还对853只恒河猴进行了全基因组测序,确定了近8600万个单核苷酸变异和1050万个indel变异,包括与人类自闭症和发育迟缓相关的潜在破坏性基因变异。这些额外的数据可以为开发人类疾病的非侵入性NHP模型提供一个框架。
“恒河猴是灵长类动物比较研究和生物医学研究的关键物种。这项工作是朝着完整基因组迈出的重要一步,它将提高我们对进化和物种研究效用的理解,”华盛顿大学基因组科学教授Evan Eichler在一封电子邮件中说。“特别是,我们现在终于可以处理基因组中一些更复杂的区域,并开始了解新基因是如何进化的,包括塑造它们的过程。”
事实上,研究人员在他们的论文中写道,对NHP基因组进化的详细了解可以使我们更好地理解人类特征和假定的疾病基因。对几种NHP基因组的进化分析和对不同物种的比较之前已经揭示了追溯元素、复制基因和人类疾病相关基因的功能相关突变的谱系特异性变化。
根据通讯作者杰弗里·罗杰斯的说法,猕猴对进化研究的重要性在于它在进化树中的确切位置,与人类和黑猩猩、大猩猩等类人猿相比。贝勒医学院(Baylor College of Medicine)分子与人类遗传学副教授罗杰斯说,遗传学家经常思考是什么让人类如此独特。虽然比较人类和黑猩猩或大猩猩的基因组会发现差异,但很难判断这些差异是人类基因组变化的结果还是猿基因组变化的结果。
“为了决定这些新奇事物是人类的还是黑猩猩的,你需要一个外部群体。恒河猴是一个非常好的外群,因为它们在进化树中处于正确的位置,”他说。“它们与人类、黑猩猩和大猩猩的关系非常密切,我们对它们的基本生物学也了解很多,因为它们被用作生物医学研究模型。”
Eichler还指出,作为一个更完整的参考序列,新的猕猴基因组组合不仅可以作为研究人员研究突变率和过程的资源,还可以建立更准确的人类疾病遗传模型。他说:“这与那些在更遥远的亲缘生物(如老鼠和大鼠)中失败或只部分重现的遗传模型尤其相关。”
此外,通讯作者、密苏里大学基因组学教授韦斯利·沃伦补充说,新数据使其他研究人员能够“比较与人类疾病有关的基因特异性变异,但在某些情况下,猕猴没有明显的健康后果”,并将用于研究灵长类动物的几个基因组过程,如多样性和功能约束。
他说:“我们只是在探索这一丰富数据源的开始阶段,只有少数几个神经发育基因的序列变异不能容忍人类的突变。”
研究人员首先从一只来自印度的雌性恒河猴身上生成长读序列数据,并组装其基因组。该参考染色体由20个常染色体和X染色体组成。为了完整起见,他们添加了先前基于细菌的Y染色体的人工染色体表示。在进行了各种分析后,他们发现,在先前的印度恒河猴基因组组装中,超过99.7%的缺口已经通过新的参考基因组的生成而被弥合。此外,错误导向基因的数量从之前基因组中的4.83%减少到新基因组中的0.13%。
然后,研究人员继续为850只来自美国研究殖民地的恒河猴和3只野生捕获的中国恒河猴生成WGS数据。大多数(810只)动物被指定为印度血统,其余个体为中国血统或疑似混合血统。根据对新的参考基因组的映射解读,研究人员确定了8570万个snv,其中包括2130万个单链基因和1050万个单链基因。
他们指出,值得注意的是,最近一项对来自54个不同全球人群的929个人类基因组的研究发现了6730万个snv。因此,研究猕猴的个体多样性是人类的两倍多,平均每只猕猴携带970万个snv。
为了阐明猕猴遗传多样性的生物学潜力,研究人员接着确定了与自闭症和发育迟缓有关的人类基因同源的自然发生的猕猴突变。在人类中,新创他们说,这些基因中的有害突变被认为是主要的,有很大的影响,但小鼠模型往往不能概括人类疾病的神经行为特征的复杂性。出乎意料的是,他们在猕猴身上发现了9个带有候选有害突变的基因,这些基因对人类的突变不耐受新创基因突变与神经发育障碍有关。
实际上,罗杰斯说,猕猴对从传染病(包括COVID-19)到神经科学、癌症和生殖生物学等疾病的研究都很重要,因此,高质量的参考基因组可以帮助研究人员了解各种疾病的原因或旨在开发治疗方法。
重要的是,猕猴遗传变异数据可以帮助研究人员发现和使用人类遗传疾病的自发或自然发生的模型。罗杰斯说,许多人类遗传疾病是由人群中低频率分离的突变引起的,特别是在父母体内杂合子的隐性突变,但如果将两个副本遗传给孩子,就可能是有害的。
罗杰斯解释说,恒河猴也隔离了大量的遗传变异,这对它们的基因是有害的,但大多数变异是隐性的。他说:“当我们随机抽样恒河猴时,我们发现在研究群体中有很多分离的突变——它们是已知会导致人类遗传疾病的基因中的破坏性突变,但它们的频率足够低,所以我们不经常在恒河猴中看到这种疾病。”“通过识别携带突变的个体,你可以跟踪他们的后代,或者在某些情况下,你实际上可以创建新的繁殖群体,产生具有表型的纯合子个体,然后创建一个自然发生的人类遗传疾病模型。”
这些自发的疾病模型不需要任何工程技术来创建,它们忠实地再现了人类遗传疾病。举例来说,罗杰斯指出,他和其他一些同事正在使用这种技术来研究导致先天性失明的视网膜退化表型,并已经确定了一个自发的猕猴模型,该模型具有锥体光受体特异性突变,可导致人类渐进式失明。
他说:“我们现在正在猕猴身上研究并实际测试基因疗法和干细胞疗法,而不必自己创建疾病模型。”“我们只是利用了一种自然发生的模式。”