纽约——研究人员绘制了一幅对剂量变化敏感的人类基因组基因图谱。
罕见的拷贝数变异与孟德尔疾病和复杂疾病(特别是神经系统疾病)都有关,并且被认为通过删除或复制关键基因增加了疾病风险。为了更好地了解哪些基因对这种剂量变化敏感,马萨诸塞州总医院和其他地方的研究人员分析了近100万人的罕见CNV数据,并结合54种疾病表型。
正如他们在细胞周三,研究人员进一步将这些罕见的CNVs与基因组注释结合起来,生成了一个模型,以识别可能的剂量敏感基因,发现了近3000个对单倍性不足敏感的基因和超过1500个对三倍性敏感的基因。
MGH和broad研究所的资深作者Michael Talkowski及其同事在论文中写道:“我们将这项研究中获得的所有地图和指标作为开放资源提供给社区,并预计它们将对人类基因组研究和医学遗传学具有广泛的用途。”
他们首先通过协调来自17个不同来源(包括诊断实验室和国家生物库)的数据,生成了一份罕见的cnv目录。由此产生的950278个样本包括来自458326个个体的样本,这些个体也具有54种不同的疾病相关表型中的一种或多种,代表神经系统和非神经系统疾病。
通过将常染色体分成200千碱基滑动窗口,研究人员搜索了与54种表型中的每一种相关的罕见CNV片段,发现了163个与至少一种疾病表型相关的剂量敏感片段。研究人员指出,在本次分析中,文献报道的95个剂量敏感区域中,超过一半的区域也被检测到。
在对178个与疾病相关的罕见CNV片段(研究人员发现的163个剂量敏感片段加上在靶向分析中发现的15个其他片段)的联合分析中,研究人员开始梳理出剂量敏感片段之间的模式。总的来说,罕见的CNV片段倾向于基因密集,并包含一个剂量敏感的显性驱动基因。它们也比预期的更可能与表型匹配的疾病基因重叠,并包括更多受强突变约束的基因。
研究人员采用了一种在全基因组关联研究中普遍使用的精细映射方法,以优先考虑这些片段中可能的因果基因。他们锁定了31个高度自信的基因和90个自信的基因,这些基因被增强为可能的驱动基因,比如具有突变约束的基因。
研究人员进一步开发了一个计算模型,以预测超过18000个常染色体蛋白质编码基因对单倍体不足敏感或具有三倍体敏感性的概率。他们报告说,这个模型可以高精度地分离已知的剂量敏感基因和剂量不敏感基因,并识别出3635个高剂量敏感基因。其中包括2987个单倍不足基因和1559个三倍敏感基因。
研究人员注意到,对缺失更敏感的基因往往更大,位置离其他基因更远,并且有许多顺式增强子。同时,对复制更敏感的基因通常较短,且存在于gc丰富和基因密集的区域。
研究人员补充说:“虽然这些模式是初步的,但它们仍然为未来的剂量敏感性研究提供了重要的立足点,在序列分辨率和解耦整个人类基因组的单倍体不足和三倍体敏感性的原则。”