纽约(基因组网)——来自普林斯顿大学、洛克菲勒大学和其他地方的一个研究小组已经开发出一种计算方法来解开非编码变异在自闭症谱系障碍(ASD)中的作用。
作者写道:“我们的预测基因组学框架阐明了非编码突变在ASD中的作用,以及对进一步研究具有高影响的优先突变。”作者指出,他们的一般方法可能适用于其他复杂疾病。这项工作由Flatiron研究所计算生物学中心基因组学副主任、普林斯顿大学计算机科学教授Olga Troyanskaya和洛克菲勒大学癌症生物学教授Robert Darnell领导。
当他们报道昨天在网上自然遗传学研究人员使用了一种深度学习策略,利用来自近1800个ASD家庭的全基因组测序数据,评估了基因组中数千个位点的非编码变异。除了在某些组织类型中预测ASD的调节转变的途径外,他们还在包含转录调节剂或rna结合蛋白调节剂的基因组部分中看到了增强的非编码突变表示。
研究小组指出,尽管最近的研究发现了大量的新创与ASD有关的拷贝数变异和点突变,落在基因组蛋白质编码部分的变异似乎解释了单发ASD中观察到的不到三分之一的遗传力,留下了更多的工作来解开遗传或遗传的后果德与ASD相关的novo非编码变体。
为了提出一种考虑可变非编码变异效应大小和其他潜在混杂因素等因素的非编码变异分析方法,研究作者开发了一种“基于深度卷积神经网络”的策略,用于在1790个ASD单纯型家族成员的近7100个基因组序列中发现和预测非编码变异的潜在调控后果。
这种方法涉及比较自闭症谱系障碍患者和非自闭症谱系障碍患者的非编码突变谱,其方式“类似于使用基因密码子代码来区分蛋白质编码基因中的非同义突变和同义突变”。研究人员解释说,同时结合了相关组蛋白标记、染色质可及性特征、转录因子结合位点以及通过过去的努力(如ENCODE或路线图表观基因组学项目)确定的DNA或rna结合蛋白靶点的信息。
他们写道:“我们的框架估计,通过单核苷酸分辨率,每种变体对2002种特异性转录和232种特异性转录后调节特征的定量影响,包括组蛋白标记、转录因子和[rna结合蛋白]谱。”
使用这种策略,研究人员发现了显著的上升新创与未受影响的兄弟姐妹相比,ASD儿童中具有预测功能影响的非编码变异,包括预测在已知功能丧失不耐受的基因附近具有显著功能影响的变异。他们以组织为中心的分析——使用为基因型-组织表达项目评估的数十种组织或细胞类型的数据——指出了在脑组织中具有调节作用的变体的过度代表。
后续分析主要集中在与ASD有潜在联系的非编码变异的功能和特定的负担新创在ASD个体的非编码变异中,研究小组使用网络邻域差异富集分析来寻找经常受影响的途径或生物过程。
后一项分析强调,包含与疾病密切相关的基因、参与突触传递或神经发生的基因以及染色质调控相关基因的网络,在ASD儿童中比在他们的兄弟姐妹中更容易受到非编码改变的影响。
基于这些和其他发现,作者认为“编码和非编码突变影响重叠的过程和途径,这表明了一个收敛的遗传格局,并强调了发现编码和非编码突变结合的asd相关基因的潜力。”
除了发展互动网站对于那些对挖掘他们的数据感兴趣的人来说,作者建议类似的深度学习方法可能适用于其他具有非编码变量贡献的复杂情况。
“现在我们打开了一个领域,以了解可能涉及自闭症的所有因素,”共同第一作者钱德拉·西斯菲尔德(Chandra Theesfeld)在一份声明中说,他是普林斯顿特罗伊斯卡亚综合基因组学实验室的研究科学家。