纽约(GenomeWeb) -系统生物学验证:研究过程验证的工业方法(SBV IMPROVER)的最新迭代强调了使用表观遗传学数据对生物样本进行分类和分类的挑战和复杂性。
由菲利普莫里斯国际公司研发部门领导和资助的IMPROVER挑战赛旨在为工业和学术研究背景下验证系统生物学方法和结果提供可靠的方法。
今年5月在以色列特拉维夫举行的一场多学科研讨会上达到了最后的结果,要求参与者根据戒烟的表观基因组影响和所谓的改良风险烟草产品或降低风险产品的气溶胶对不同系统毒理学研究的样本进行分类,这些产品对转向这些产品而不是继续吸烟的吸烟者造成的危害风险较小。
“我们想要使用表观遗传学数据来进行这项挑战的原因之一是……我们想要增加一层复杂性,”菲利普莫里斯国际公司基因组学经理、该挑战的创建者之一尼古拉斯·西罗(Nicolas Sierro)说。“我们之前只基于转录组数据进行了挑战,所以我们不想重复相同类型的挑战或过程。”此外,“表观遗传数据的解释更具挑战性,所以我们想让社区面对这类数据。”
此外,“有很多事情不是发生在RNA水平上,而是发生在表观遗传和遗传水平上,”默罕默德·阿明·Choukrallah补充道,他是PMI的基因组学科学家,也是表观遗传学挑战的联合创造者。“有时,在RNA表达变化之前就会出现表观遗传激活,如果只分析转录组数据,就无法看到这一点。”
菲利普莫里斯国际公司的高级计算生物学家Stéphanie Boué说,具体来说,这项挑战要求参与者从小鼠研究中收集的内部生成的DNA甲基化数据中提取签名。然后,他们不得不尝试使用这些特征来对其他研究中的新样本进行分类。参与者的一项任务是观察DNA甲基化数据中是否有足够的生物信号来区分两组。参与者还被要求识别不同甲基化位点的基因,然后使用这些基因的转录数据将样本分组。
虽然有几个小组下载了为挑战提供的数据,但最终只有两个小组提交了参赛作品。来自巴伊兰大学系统生物医学实验室教员Hagit Philip的作品被选为获胜者。
据Boué报道,总体而言,结果与组织者基于数据预期看到的结果相当,但并没有真正改善PMI内部生成的结果,这凸显了使用表观遗传学数据进行分类的复杂性。“表观基因组学真的很棘手,而且不幸的是,仅根据表观遗传学数据似乎不可能将暴露人群分开。根据转录组数据来区分群体要容易得多,”她说。“我们确实看到了不同程度的甲基化,但它更随机……所以很难评估真正的影响是什么。”
特拉维夫大学(Tel Aviv University)计算系统和合成生物学实验室负责人塔米尔·图勒(Tamir Tuller)是研讨会的主旨发言人,他指出,对一些小组来说,挑战的时间框架很短是一个因素。从挑战赛开始到4月10日截止日期,参赛者有大约一个月的时间来产生他们的结果。他说:“这个挑战有点复杂,而且耗时,所以一些(研究人员)决定不提交,因为他们觉得自己还没有准备好。”
Choukrallah表示,这些团队能够在如此短的时间内得出与PMI相当的结果,这一点值得注意。此外,一些参与者使用完全不同的方法来获得可比较的结果,为PMI从表观遗传数据中收集结果提供了新的计算方法。
这是一个比平时更小的IMPROVER挑战,是一个相对较新的IMPROVER挑战家族,它强调并鼓励本地参与,但可能不会产生计算问题的最优解决方案。Boué表示:“我们希望与科学家接触,但这也是我们提高人们对我们所从事的科学认识的一种方式。”然而,“我个人认为,如果你想解决计算问题,最好是尽可能广泛地进行,所以这可能就是表观遗传学不是最优的地方。”
最近结束的挑战主要针对以色列研究人员,这是IMPROVER组织者组织的第二次此类微型挑战。去年,他们进行了一个类似的挑战,呼吁新加坡的研究人员参与。与以色列的挑战一样,新加坡的努力也集中在表观遗传学数据,特别是DNA甲基化数据,但与以色列的挑战不同的是,新加坡团队没有得到具体的研究问题。
相反,他们收到了一系列原始数据集,并被要求使用不同的计算方法从数据中提取见解。在两天的时间里,参与者被要求分析数据,试图识别相关性,并对他们的方法给出反馈。“没有预期的答案,我们可以像在传统的挑战中那样对[反应]进行评估,”西罗说。这个项目的重点是“我们如何用新的想法来补充我们分析数据的方法。”
在以色列的挑战中,IMPROVER的组织者使用了大量来自新加坡活动的原始数据,尽管他们提供了额外的数据集,包括关于该主题的公开文献和资源,并添加了一个明确的研究问题。Choukrallah说:“我们问了他们一些我们感兴趣的问题,并且已经在PMI这里回答了,看看其他有着不同背景的人会如何回答同样的问题。”
尽管这并不意味着他们将停止计划更多面向全球的计算竞赛,但IMPROVER组织者计划继续举办更多的本地挑战。据Boué网站介绍,组织者选择哪种面试模式取决于他们想要回答的问题类型。
下一个迷你IMPROVER挑战赛计划在日本举行,重点是RNA和蛋白质数据。Boué说:“我们正在为下一个挑战对转录组学和蛋白质组学数据进行更普遍的解释。”她补充说:“我们(也)在不同生物过程的网络模型中集成了一些表观遗传学数据和机制。”与以色列的挑战一样,计划在日本开展的挑战将侧重于吸烟和降低风险的产品。
展望未来,未来的计算挑战将解决分析微生物组数据和疾病联系的计算方法,以及DNA甲基化在特定疾病背景下的应用,如癌症,Boué说。
IMPROVER的组织者也在探索与现有挑战的组织者的潜在合作伙伴关系。在此之前,IMPROVER的组织者与IBM合作组织了系统生物学挑战。合作伙伴一起发起了翻译挑战目的是更好地理解使用啮齿动物模型来理解人类生物事件的局限性。他们还组织了网络验证挑战该研究要求参与者构建并改进人类肺部疾病的生物网络模型。独立地,IMPROVER的组织者已经发起了挑战,比如系统毒理学挑战该研究的重点是识别血液基因表达特征,这些特征可以作为吸烟暴露的标志。
Boué说:“例如,有些社区围绕微生物组组织挑战,我们肯定会联系他们,这样我们就可以互补,然后进行一些挑战。”“但我们首先必须确立自己的地位。”
此外,她补充说,与吸烟和降低风险产品相关的问题可能不是全球受众感兴趣的,这可能会影响组织者追求和形成的合作关系。
参与微型IMPROVER计算挑战的动机相当有限。对于以色列的挑战,IMPROVER为获胜的团队提供了1500美元的现金奖励,第二名的团队为1000美元,第三名的团队为750美元。该集团规模较大的全球比赛通常奖金更高。
Boué表示,虽然数量不多,但“我们从参与者那里了解到,(这些挑战)让他们能够(访问)他们不一定要处理的新类型的数据”,因此这是激励他们参与的一个因素。此外,性能最佳工具的开发人员也被邀请为描述IMPROVER挑战的出版物投稿,为他们提供了一个与更广泛的观众分享他们的工作的出口。
Tuller希望,除了IMPROVER之外,更多的挑战开发组织将有兴趣与以色列机构合作应对未来的挑战。“我们有一个非常大的计算生物学家社区,[所以]我希望未来其他类型的挑战也会在以色列发生。”
IMPROVER的组织者已经在网站上公布了以色列挑战所使用的数据修改风险烟草产品吸入毒理学储存库(interval)平台.PMI开发了interval,以允许相关利益相关者共享他们提供的与mrtp和替代产品的毒性评估有关的带注释的数据集,以及他们所获得的结果的解释。
虽然这一挑战已经结束,但研究人员可以继续挖掘数据,以进一步了解表观遗传学在人类健康中发挥的作用,并使用这些数据来评估他们的计算技术的有效性。IMPROVER的研究人员还希望在不久的将来发表一篇讨论这项研究结果的论文。