纽约——“基因组亚洲100K计划”的研究人员已经开始开发一个亚洲个体基因组的参考数据集,目的是提高亚洲人在基因组研究中的代表性。
目前,大约6%的测序人类基因组来自亚洲个体,尽管世界上大约一半的人口是亚洲人。基因组亚洲10万计划2016年成立由新加坡南洋理工大学及其行业合作伙伴Genentech、Macrogen和Medgenome组成,旨在最终对10万人的基因组进行测序住在亚洲来缩小差距.
迄今为止,该联盟已经对来自亚洲64个国家200多个种群的1739个个体进行了测序。在初步研究中,今日出版于自然,该联盟报告了来自亚洲人群的基因组数据如何使其深入了解了以前不受重视的人群结构,并阐明了某些遗传变异的影响。
“我们正在破译亚洲人的遗传结构,”Macrogen董事长、论文合著者徐廷善(Jeong-Sun Seo)在一份声明中说。
研究人员对1739个个体的基因组进行了测序,平均覆盖率为36倍。这些样本来自生活在亚洲各地的个人,不仅包括中国和印度,还包括马来西亚、韩国和菲律宾等几十个国家。研究人员专注于收集来自偏远和孤立社区的个体样本,以及来自不同种姓和语言群体的样本。
通过主成分、外加剂和其他分析的结合,研究人员发现他们的样本在很大程度上反映了以前的亚洲人口结构研究。例如,他们报告说,印度、印度尼西亚和马来西亚包括多个祖先种群和多个外族人。
但他们也发现,在印度、印度尼西亚和马来西亚,在人类学上被归类在一起的某些人群与地理上的邻居的基因关系比与该人类学群体中的其他人群的基因关系更密切,这表明这些群体成员普遍的深色皮肤可能是由于环境适应,而不是由于共同的祖先。
研究人员还发现了亚洲人群中不同程度的来自古代丹尼索瓦人的祖先,并估计梅拉尼西亚人和Aeta人的丹尼索瓦血统比例最高。
与此同时,研究人员报告说,这些额外的亚洲基因组序列可以帮助医学遗传学研究。在他们的数据集中,近四分之一的蛋白质改变变体没有出现在公共数据库中,如外显子组聚合联盟(ExAC)、gnomAD、1000基因组计划、NHLBI GO外显子组测序项目(ESP)和dbSNP。
研究人员指出,这些数据库通常用于筛选罕见遗传疾病的常见等位基因,这些等位基因可能不是致病原因。当他们将他们的数据集添加到gnomAD中,从印度成熟期发病糖尿病(MODY)项目中筛选一组外显子时,研究人员可以将候选变异的数量减少两倍。特别是,他们在NEUROD1中发现了一种常见的多态性,该多态性之前被报道与医学相关,但根据他们的数据集的添加,它可能是良性的。
此外,他们还指出,影响血液稀释剂华法林敏感性的变异似乎在韩国、中国、日本和蒙古的个体中更为常见。
该联盟计划继续收集和分析更多的样本。南洋理工大学教授斯蒂芬·舒斯特尔(Stephan Schuster)指出,了解人们的遗传背景是能够实施个性化医疗的重要组成部分。他在一份声明中说:“要想精准医疗,你需要准确地知道你是谁。”
Macrogen进一步宣布,计划基于这些数据开发直接面向消费者的基因检测服务,并为医疗专业人员提供“全球临床基因组超市”服务。