纽约——作为乌干达基因组资源(UGR)项目的一部分,来自英国、乌干达、尼日利亚和其他地方的一个团队对乌干达西南部农村社区数千人的基因组序列和SNP模式进行了分析,确定了人口结构及其背后的一些历史运动。
“UGR旨在帮助开发当地公共卫生和基因组研究资源,包括在该地区建设研究能力、培训和合作,”作者在他们的论文中写道研究,于今日在网上发表细胞.“我们设想,这些研究的数据将为研究人员提供全球资源,并促进非洲人群的遗传研究。”
为了开发这一资源,研究人员分别汇集了参与乌干达全基因组关联研究(UGWAS)的4778名乌干达个体和乌干达2000基因组(UG2G)项目的近2000名参与者的基因分型阵列和低覆盖率基因组测序数据。
总的来说,这些序列揭示了乌干达基因组中大约4150万个snp和450万个小的插入和删除。研究小组发现,其中许多变异都很罕见,在1000个基因组计划、非洲基因组变异计划或UK10K数据库中记录了950万个。同样,基因组聚合数据库gnomAD也丢失了乌干达新基因组中发现的近29%的snp。
研究小组分析了这些变异,以及以前在非洲其他地区和其他地区的个人资料,确定了他们研究的乌干达地区的52个人口集群,那里是9个主要的民族-语言群体的家园。
作者指出,自我认同的民族-语言群体“应该被视为代表一个广泛的结构,包括共同的文化遗产、祖先、历史、家园、语言或意识形态。”
研究人员报告说,在乌干达发现的复杂的混合和人口结构似乎反映了该国内部的已知变化,以及来自布隆迪、坦桑尼亚、南苏丹、刚果民主共和国的移民,以及来自卢旺达的多次移民。他们指出,参与者的祖先组成类似东非班图人、尼罗-撒哈拉人、非洲-亚洲人、雨林狩猎-采集者、欧亚人和其他人群,例如,尼安德特人的序列指向已检测到的欧亚血统的返回非洲来源。
与随后的亲子三人组基因组和罕见变异分析一起,深入研究东非人口和人口历史,该团队研究了可能从UG2G参与者拥有更竞争的序列变异集中获得的见解——从等位基因频率差异和序列imputation线索到不同的疾病风险模式。
特别是,当研究人员进行了一项涉及14100多名非洲人的心脏代谢组学特征的全基因组关联研究和荟萃分析时,他们发现了与非洲血脂、血细胞和其他特征相关的新位点,包括涉及在世界其他地区的人群中似乎很罕见的变异的关联。
他们写道:“总的来说,我们的发现强调了来自不同人群的遗传资源在新发现中的效用,特别是对于特定人群和低频关联信号。”“在这种情况下,功能等位基因频率的差异、等位基因异质性和[连锁不平衡]结构的差异为发现和解决因果位点以及更好地理解疾病的遗传结构提供了独特的机会。”