纽约 - 一个行业为主导的团队从150,000多名英国Biobank参与者产生了超过150,000个的全基因组序列,生产了一个预期在疾病生物学,治疗发展和药物安全领域的应用的数据集,参加者听到了美国人遗传学学会年会,上周几乎持有。
在那里,来自英国Biobank和若干公司的调查人员概述了基因组测序项目的理由,以及用于询问数据的一些分析方法以及预期的分析类型,因为数据变得更广泛。
“这是一个雄心勃勃的序列产生项目,在过去几年的情况下,在艰难的情况下已经运行了一个,”英国Biobank副首席执行官Mark Effingham解释道。“随着11月初的第一次公开发布数据的第一次公开发布的项目结束,这提供了有机会在早期洞察到这些数据的提供。”
“这是非常激动人心的时期,因为这些全基因组测序数据开始可用,并由世界各地的研究人员使用,以提高我们对人类健康的理解,”他补充道。
基因组测序努力由Amgen,Astrazeneca,Glaxosmithkline和Johnson&Johnson的调查人员带来慈善和英国政府资金。预计基因组集团将补充现有的遗传,生化,生物标志物,代谢和健康记录/健康调查表/健康调查问卷数据,为大约有500,000名参与者组成。
“这些数据将是英国Biobank数据集的一个非常令人兴奋的补充,增加了半百万英国Biobank参与者的进一步遗传表征,超出了已经可用的基因分型和全面序列数据,”埃芬汉姆说。
作为AMGEN-解码遗传学的研究员Bjarni Halldorsson的一部分,呈现有关来自英国Biobank的150,119个全基因组序列的变异信息,序列为约30倍的平均覆盖物。其中,他解释了,90,667个基因组在解码时测序,并且剩余的59,452个基因组在Wellce Sanger研究所测序,使用两个更明显的分析管道。
该团队使用四个变体呼叫方法看了一下2.7个矮子的数据,其中四种变体呼叫方法共同指出数亿个SNP和诱导 - 其中大多数罕见 - 以及约1250万微卫星和约895,000种结构变体在基因组序列中,他解释说明。
来自英国Biobank项目的外壳和基因分型数据,基因组序列(包括超过三十名亲子儿童三重组)还提供了不同突变类型,归纳模式,假发现率,真正的正呼叫的比例,批量效应,变体调用偏见,等等。
该数据还揭示了英国Biobank发现的参与者群体,包括英国/爱尔兰,非洲/加勒比或南亚祖先的大型个人群,以及他们之间的一些遗传变异和地理区别。
对于他们的部分,Astrazeneca的Katherine Smith,Glaxosmithkline VP的目标科学John Whittaker和J&J的Janssen Pharmaceutical的玛丽海伦黑人分别讨论了英国BioBanmes的短串联重复,药物发现和药物安全分析。
史密斯致力于对基因组的编码或非编码部分中的STR扩张的作用可以在亨廷顿疾病到Friedreich Ataxia和脆弱的X综合征的条件下发挥,并且呈现来自预测的致病性STR分析和苯胺宽的STR关联分析的结果完成超过136,800英国Biobanc基因组。
她和她的团队已经已经确定了三十种具有表观的表型,包括似乎涉及涉及染色体6个主要组织相容性复杂地区外部的strs的10个条件。
史密斯警告说,初始Phewas“没有识别短串联重复比[150碱基对]读取长度和二进制表型之间的短串联重复之间的任何新效果的新关联。”同样,她指出,一些已知的表型-ST-STR关联仍未被遗留,可能是由于电力,技术和招聘考虑因素。
尽管如此,她仍然认为新序列的英国Biobances“是学习短串联重复变化的宝贵资源”,并建议“这张照片可能会随着50,000名参与者的其余部分发生变化,并且随着参与者表型记录更新时间。”
GSK的Whittaker通过影响全基因组测序的基于遗传协会来努力解除药物发现计划中的新治疗目标的影响来播放会议与会者。
特别是,他和他的同事们专注于罕见的变体关联,而不仅是基因组的预测蛋白编码部分,而且在非分量区域中发现的那些,相对于英国Biobank的大约100个定量或二元特征或病症。在欧洲祖先的近125,400名参与者的基因组序列中,搜索确认了几个已知的罕见变体关联和一些潜在的新信号。
“可能是最有用的是,告诉我们更多关于生物学的更多信息以及推动我们已经用[基因组 - 范围协会研究]的信号,”惠特克推测。“但本身就是非常有用的。”
他指出,未来的基因组分析和协会研究将依赖于对特定地区的背景的准确理解,这反过来又需要清除基因组中的监管贡献者并对彼此的变异相互作用进行清晰的诠释。寻找以前未检测到的二进制特征联想的权力将继续增长,因为仍然更多的基因组被从更广泛的500,000英国Biobank参与者组测序。
“清楚我们需要做的是整合所有变化,包括结构或SNV变异,”Whittaker表示,解释说“这是关键,真的很好地利用这些数据。”
Black是人口分析,计算科学发现,产品开发和jansen的产品开发和供应研究人员,建议英国Biobances和类似的大型遗传数据集可能有助于未来的药物安全评估研究。
除了实验数据,靶表达分析,公布的研究和其他数据,她解释说,人类遗传资料用于在临床前临床前阶段建立所谓的“可操作目标责任评估计划”,她解释说明。“目标责任评估越来越巩固了人类遗传证据,以告知整体安全风险,并促进执行失败策略。”
在英国BioBank数据的情况下,引入全基因组序列应该在过去的研究参与者中描述的遗传,表型,生活方式和其他型材添加到遗传,表型,生活方式和其他型材中,包括努力提出新的治疗化合物和努力评估药物安全。
实际上,她的团队已经开发了一个目标责任评估工作流程,其含有全基因组序列,外壳序列,序列注释和等位基因频率,临床记录,生物标志物和其他线索,以找到信息丰富的菲尼族范围的关联和功能丧失突变。
然后可以将这些数据与几种数据类型一起进行评估 - 从表达定量性状基因座(QTL),甲基化QTL和蛋白质QTL型谱到差异基因表达,分层化,基因敲除和动物模型数据 - 寻找因果贡献者对不利的反应,黑色解释,使用针对帕金森病治疗的靶向抑制剂的情况作为一个例子。
“我们已经表明,利用大规模的分析工作流程,与临床信息相关的基于人口的基因组学数据,例如在英国Biobank中提供的,可用于为药物安全研究提供信息,”她表示,“英国”增加了“英国”Biobank全基因组测序联盟正在为所有500,000名(注册英国Biobank项目)的全部基因组数据产生,该数据与大型表型数据的广泛星座相结合,将于2022年提供。“