纽约(基因组网新闻)-根据昨晚在网上发表的一项研究,自从我们的谱系从进化到黑猩猩以来,至少有60个新生基因突然出现在人类基因组中公共科学图书馆遗传学.
来自中国和加拿大的研究人员提出了一种比较灵长类基因和蛋白质序列的管道为了在人类基因组中找到已演变成蛋白质编码基因的非编码祖先序列。根据数据库搜索结果,这项研究发现了60个潜在的新生基因,这些基因似乎在信使rna和蛋白质水平上都有表达。
由于这些新生蛋白质编码序列似乎在睾丸和大脑皮层的组织中表达最多,研究小组推测这些基因可能参与了人类特异性性状的获得。
“我们在人类基因组中发现的从头起源基因的数量远远高于先前对从头起源率的估计,”中国科学院昆明动物研究所和云南大学的通讯作者张亚平(音译)及其合著者写道,“因此,我们建议需要对基因从头起源有更多的了解。”
张和他的同事们做了一系列的序列比较,试图追踪新生的蛋白质编码序列,包括BLAST搜索,将人类蛋白质序列与黑猩猩、猩猩、恒河猴和绒猴的蛋白质序列进行比较。
在剔除了缺少起始密码子或终止密码子的人类序列后,研究人员留下了350多个基因,他们随后用这些基因来搜索黑猩猩和猩猩的基因组序列。他们还手工检查了基因序列,以剔除那些似乎不是来自真正的祖先非编码序列的人类基因。
“要成为候选的从头起源基因,”该研究的作者解释说,“除了在人类基因组中具有潜在的可翻译的开放阅读框架外,该基因必须在黑猩猩和猩猩的基因组中都存在并被破坏(即不可翻译)。”
研究人员通过搜索得到了46个候选基因,然后用它们来搜索基因和蛋白质数据库。在最初的筛选中,他们发现了27个基因的mRNA和蛋白质表达的证据。与此同时,当研究人员对Ensembl数据库早期版本的基因进行额外筛选时,他们发现了另外33个似乎是在人类基因组中重新出现的基因。
该研究的作者写道:“这些新基因中的每一个都有转录和蛋白质组学证据支持它们的功能。”
通过仔细检查这些基因的表达数据——包括过去对11个人类组织的研究中53个基因的RNA测序数据——他们发现新生候选基因在大脑皮层和睾丸组织中表达最多,这加深了人们对这些基因在某些人类特有特征的发展中发挥作用的猜测。
在一个观点的文章在公共科学图书馆遗传学都柏林大学遗传学研究人员Daniele Guerzoni和Aoife McLysaght指出,这项新研究建立在先前的研究基础上,该研究表明,DNA序列的细微变化可以导致表型变化。
不过,这对研究人员提醒说,用于定义新生基因的标准是至关重要的。例如,他们写道,“还必须注意确保可以可靠地推断出祖先序列是非编码的……理想情况下,应该调查假定的非编码序列,以寻找转录和翻译的证据,以支持缺乏编码能力的推断。”
尽管Guerzoni和McLysaght指出,人类和灵长类基因组中更完整的新生基因目录将有助于理解这些基因如何影响表型等,但他们也认为,如果有的话,还需要更广泛的研究来确定新生基因的功能作用。
“一个主要的挑战仍然是证明新生基因的功能,”他们写道。“这对于人类特定基因来说尤其困难,这可能是最大的兴趣,但就可能的实验而言,也存在最大的限制。”