跳到主要内容
溢价试验:

索取年度报价

人类泛基因组参考草案显示了捕捉更多人类多样性的途径

溢价

纽约- - - - - -最近完成的一份人类泛基因组参考草案旨在迈出第一步,使参考基因组不仅更完整,而且更好地反映人类多样性。

目前的人类参考基因组GRCh38是来自不同个体的序列的大杂烩,尽管大约70%的序列来自于一个人。“显然,一个人不能代表人类的所有变异,”加州大学圣克鲁斯分校副教授、人类泛基因组参考联盟成员本尼迪克特·帕滕(Benedict Paten)说。

相反,该联盟计划从350个个体中生成700个参考质量的单倍型,最大限度地提高基因组和地理多样性。

贝勒医学院(Baylor College of Medicine)的副教授弗里茨·塞德拉扎克(Fritz Sedlazeck)是最近成立的端粒-端粒联盟(端粒-端粒联盟)的成员,他认为,包含更广泛的人类多样性的泛基因组参照的想法很有吸引力连续的单倍体人类基因组序列, T2T-CHM13。他补充说,多样化的泛基因组参考可以发现在GRCh38中没有代表的基因组区域甚至基因。

到目前为止,人类泛基因组参考联盟已经生成了一份94的参考文献草案新创47个个体的单倍型组合。作为研究人员报道在预印本BioRxiv7月,他们结合了太平洋生物科学公司的高保真度和牛津纳米孔长读测序、Bionano Genomics的光学图谱和高覆盖Hi-C Illumina短读测序,生成了这些组件。他们报告说,这些组合覆盖了超过99%的预期序列,在结构和碱基对水平上超过99%的准确性。

但在这份人类泛基因组草案中所代表的47个个体都指的是冰雹来自1000个基因组计划

首先关注项目中的个人- - - - - -哪个代表26个全球人口- - - - - -西奈山伊坎医学院(Icahn School of Medicine at Mount Sinai)教授、该联盟成员Eimear Kenny说,该联盟的目标是既改进他们的测序和组装方法,又丰富参考资料所代表的遗传多样性。

她补充说:“我们正在进行大量的工作,不仅是评估(和)比较技术,弄清楚如何将不同的技术结合在一起,以更好地代表基因组,而且还在研究这些(vwin德赢ac米兰合作技术)如何以满足质量标准的生产方式在管道中移动。”

这项工作是由1000个基因组计划的个体促成的,他们提供了允许开放获取其基因组的同意。研究人员还可以访问它们的亲代基因组,这有助于分期组装。

展望未来,该联盟计划从其他生物银行以及更多的人群和参与者那里引入测序数据。例如,研究人员一直在联系西奈山伊坎医学院BioMe生物银行项目的个人,邀请他们参与泛基因组研究。肯尼指出,生物群落的参与者不是从西奈山卫生系统中挑选出来的,反映了纽约市的多样性。

与此同时,该联盟还与其他研究人员合作,向世界各地的人们伸出援手,让他们参与进来。“我们真的,真的,真的想让它成为全人类的参考。我们希望这能代表尽可能多的人口,”Paten说。

但该领域并不总是得到代表性不足群体的信任。他说:“我们也认识到,遗传学在边缘化人群中并没有很好的历史。”

为了解决这些问题,该联盟设立了一个伦理、法律和社会影响工作组。在泛基因组项目的第一阶段,该小组一直在向其他财团和合作伙伴征求关于招募参与者的最佳框架和最佳同意模式的意见。Paten说,由于该项目要求参与者公开分享他们的数据,这种同意需要符合道德标准并尊重参与者。

肯尼说:“我们在第一阶段要做的是评估现有模型的类型。”“在第二阶段,我们真的希望有一种有原则的方式来收集证据,证明什么可行,什么不可行。”

不过,她指出,一些团体可能选择不参加,或者按照他们自己的条件参加。

与此同时,研究人员对1000名基因组计划参与者的数据进行了测试,用不同的图组装方法来呈现他们的泛基因组参考草案。Paten指出,尽管人类基因组包含数百万种变异,但它们实际上是非常相似的,而图表方法是描述它们之间关系的一种方法。

该小组使用了三种不同的图组装方法:Minigraph、Minigraph- cactus和Pangenome图生成器。Sedlazeck指出,其中每一个都有不同的细微差别,一个是全面的,另一个关注snv,第三个关注泛基因组的结构变异。

Sedlazeck说:“结构变异相当复杂,通常很难识别。”“包含这种种族独特或只是独特的地区真的有助于我们理解...这些在GCh38中没有体现的地区的多样性。”

例如,泛基因组研究人员能够注释和可视化5个多等位基因CNV位点的结构- - - - - -包括可变的HLA-A区域。此外,在HLA-A周围,他们注意到两个之前报道的缺失等位基因,但也锁定了一个之前没有报道的携带HLA-Y假基因的插入等位基因。他们指出,这种插入以28%的高频率发生,但在GRCh38中没有发现。

Sedlazeck指出:“如果它没有在GRCh38中表现出来,显然这阻碍了这方面的研究。”

该研究小组还将注释的基因列表从GRCh38映射到泛基因组组合,发现GRCh38中包含的所有基因也在那里得到了很好的表达。不过,Sedlazeck说,如果能知道在基因组合中有什么新的基因或异构体,比如在大量的插入中,也会很有趣。

Paten补充说,目前正在进行的工作是填补组装中的空白,以生成端粒到端粒的组装,以及改进对齐和工具。不过,他指出,在目前的组装中,已经有很多有趣的基因组生物学可以探索。

肯尼补充说:“这是整个领域的基础资源。”他指出,拥有一个现代和多样化的泛基因组可能会带来许多意想不到的好处。

扫描

家族史,PRSs是疾病风险的独立衡量标准

《美国人类遗传学杂志》的研究人员发现,家族史和多基因风险评分对疾病易感性的贡献几乎没有重叠。

计算方法量化整个基因组的选择特征

发表在《公共科学图书馆·遗传学》杂志上的一篇论文描述了一种生成与一系列性状相关的基因组进化特征图谱的方法。

毛发少的哺乳动物的毛发、皮肤相关基因组区域进化速度不同

在eLife中,研究人员在无毛哺乳动物和多毛哺乳动物中寻找进化速度不同的基因组区域。

代谢表型与双相情感障碍患者抗抑郁治疗后的躁狂发作相关

《药物基因组学杂志》上的一项研究使用了5000多个个体的数据,揭示了代谢表型和双相情感障碍患者抗抑郁治疗后的躁狂发作之间的联系。
Baidu
map