跳到主要内容
溢价试验:

索取年度报价

自上而下蛋白质组学研究人员提出人类蛋白质形态计划

溢价

纽约——一群著名的自上而下蛋白质组学研究人员提出了一项新的计划,来绘制人类蛋白质组和个体蛋白质形式的水平。

中描述的一篇论文上周发表于科学的进步,所谓的人类Proteoform ProjecT将产生一系列不同的蛋白质形式,包括基因变异和翻译后修饰形式,存在于各种哺乳动物细胞系和人类细胞中。

作者提出了该项目的目标,即在每个细胞100万个蛋白质形态的深度上描述5000种细胞类型,这样总共可以测量约50亿种蛋白质形态,其中估计有5000万个是唯一的。

这样的项目将代表着对现有的人类蛋白质组编目项目的一个雄心勃勃的扩展,最著名的是人类蛋白质组组织(HUPO)的人类蛋白质组项目(HPP)和由卡罗林斯卡学院和斯德哥尔摩皇家理工学院生命科学实验室的研究人员领导的人类蛋白质图谱。vwin德赢ac米兰合作

这些努力主要集中在寻找由人类基因组中大约2万个蛋白质编码基因产生的蛋白质的证据上。例如,作为它2020年进展报告在美国,HPP自信地检测到了17874种蛋白质,占人类已知蛋白质编码基因的90%以上。然而,这17874个蛋白质中的大多数(如果不是全部的话)以各种形式存在,由于剪接变体而具有轻微不同的氨基酸序列,或由于截断而具有不同的长度,或翻译后修饰的不同组合。

这些不同的形态被称为蛋白质形态,细胞内不同蛋白质形态的存在和比例是所有生物过程的关键,影响着蛋白质定位、蛋白质-蛋白质相互作用或细胞信号等。为了充分理解蛋白质在生物学和疾病的不同方面所扮演的角色,很可能不仅需要了解哪些蛋白质在不同的条件下表达,而且还需要了解哪些特定的蛋白质形态。

然而,自信地在蛋白质组尺度上测量蛋白质形态是一项艰巨的挑战。经过二十多年的研究和技术发展,蛋白质组学刚刚达到实验能够检测到大多数蛋白质编码基因的蛋白质的水平。虽然人们对某些特定类型的蛋白质形态(例如磷酸化蛋白质)进行了广泛的研究,但对蛋白质形态的研究普遍滞后。

此外,该领域大多数研究人员使用的自下而上蛋白质组学工作流程不太适合蛋白质形态的表征。在自下而上的实验中,蛋白质在质谱分析之前被消化成更小的肽。然后将测量的多肽与它们来自的蛋白质连接起来,以便进行蛋白质识别和定量。然而,由于不同的修饰可能存在于跨蛋白质的不同肽段中,因此很难,在许多情况下,不可能将自下而上的肽级数据拼凑在一起,以提供样本中存在的蛋白质形态的精确图像。

与自下而上的工作流程相反,自上而下的蛋白质组学实验着眼于完整的蛋白质。因为在这些实验中,研究人员并没有消化小肽中的蛋白质,他们能够观察蛋白质的全部长度和所有的各种修饰,这使得它成为描述蛋白质形态的理想方法——这可能是人类蛋白质形态项目的提议来自一组自上而下的蛋白质组学研究人员的原因。

然而,自顶向下的蛋白质组学在技术上比自底向上的工作更具挑战性,实验通常最多可识别出大约几千种蛋白质形式,且吞吐量要低得多。因此,Proteoform项目不仅需要大量的资金和工作,而且需要科学的进步作者指出,实质性的技术发展,包括质谱法的改进以及“纳vwin德赢ac米兰合作米孔测序、冷冻电子显微镜和视觉蛋白质组学、单细胞蛋白质组学、单分子蛋白质阵列和其他有待构思的想法。”

尼尔·凯莱赫,西北大学生命过程化学研究所主任,也是科学的进步他承认他和他的同事为他们自己和该领域设定的任务的规模,但建议在蛋白质形态水平上更彻底地描述蛋白质组的主要努力将在整个生物医学领域带来巨大的红利。

他说:“如果事实上我们能够确定具有完全分子特异性的蛋白质,并设计一个参考图谱,并改进测量方法,那么它将提高所有生物医学研究的游戏。”

例如,Kelleher说,拥有一个细胞中所有蛋白质形态的目录将证明是一个福音,因为自下而上的研究人员试图通过肽水平的信息拼凑出蛋白质形态的概况,限制了他们在分析数据时必须考虑的潜在组合和修饰的空间。

Kelleher认为,一些新兴的蛋白质组学技术也将从这种资源中受益。例如,位于西雅图的Nautilus生物技术公司正在开vwin德赢ac米兰合作发一个蛋白质组学平台,该平台使用机器学习结合多个半特异性亲和试剂的迭代读取,根据观察到的不同亲和结合模式进行蛋白质识别。与自下而上的质谱仪一样,像Proteoform项目这样的资源可以通过更好地定义它正在识别的可能的Proteoform集合,来帮助鹦鹉螺这样的平台。

鹦鹉螺公司的创始人兼首席科学家Parag Mallick说:“尼尔说的是,我认为这是一个很好的思考方式,如果你试图从(蛋白质形式)的无限可能中选择每一个,这是一个非常大的搜索空间。”“我们知道有很多蛋白质形式。但说我们知道这种特定蛋白质有100种蛋白质形态,和说有1000亿种可能的蛋白质形态是不同的。”

鉴于存在的各种修饰和组合,理论上可能存在的蛋白质形态的数量基本上是无限的。但在实际操作中,这个数字似乎受到了很大的限制。例如,几年前,凯莱赫在接受《基因组网》采访时指出,他的团队在一项研究中发现,像乙酰化这样的翻译后修饰比文献显示的要罕见得多。

他当时说:“至少我们有一些数据,可以说,‘好吧,这些蛋白质并不都有数百种丰富的蛋白质形式,而且它非常复杂。’”“这并没有那么糟糕,所以我们实际上可以做整个蛋白质组项目,这是我的梦想。我们可以把它们都分类,因为它们的数量不是无限的。”

马利克补充说:“蛋白质形态图谱真的很有帮助,它可以帮助我们说,这种(修饰的)实际组合实际存在的可能性非常低。”马利克与凯莱赫共同撰写了一篇论文,探讨了人类蛋白质组中存在的蛋白质形态的可能估计。“所以我完全同意尼尔所说的。”

Thermo Fisher Scientific质谱仪解决方案全球营销总监Andreas Huhmer说,他在最近的美国质谱仪协会年会上看到了自上而下蛋白质组学演示的上升,指出他认为人们对自上而下进行了更深入的研究,“只是因为在实际的蛋白质形态本身中隐藏着太多的生物学知识。”

“蛋白质识别的挑战在很大程度上得到了解决,现在你可以很快地覆盖整个蛋白质组,但生物学要求你更详细地研究蛋白质形式,”他说。

“变形体非常重要,因为它们有不同的功能,”罗汉·塔库尔说,布鲁克生命科学质谱仪的执行副总裁。“相同的蛋白质具有不同的蛋白质形式,具有不同的功能。所以我认为绘制地图非常重要。”

不过,目前还不确定是否有资金来推动这一努力。在他们的科学的进步论文中,凯莱赫和他的同事们提出,该项目将需要数十亿美元的资金。这将远远超过提供给其他主要蛋白质组学项目的资金。例如,美国国家癌症研究所(National Cancer Institute)的临床蛋白质组学肿瘤分析联盟(Clinical Proteomic Tumor Analysis Consortium)最近启动了第四阶段的研究,每年的资金水平约为1100万美元。

塔库尔说:“它需要得到资助,这样学者们就可以追逐它,开始支持这种愿景。”“但如果你的资金仍然有限,为什么有人会放弃他们目前正在做的事情,转而开始这样一个项目呢?”

他说:“如果资助机构开始说,好吧,我们需要专门用于蛋白质形态分析的质谱仪,而且研究团体有一笔资金,这就是这个问题的解决方法。”

密歇根大学(University of Michigan)教授吉尔·奥门(Gil Omenn)多年来曾在HUPO担任多个领导职务,他说,考虑到蛋白质组学在获得资金方面面临的普遍挑战,“有点难以乐观。”

他说:“我们努力了很长一段时间,想让蛋白质组学在(美国国立卫生研究院)的议程上占据更高的位置。”

他表示,这一挑战的规模可能会让资助者和资助机构不愿接受。

当“我们指出所有的蛋白质形态时,我们谈论的是数十万、数百万种不同的分子物种,”他说。“人们听到这样的数字时都目瞪口呆。他们不知道如何处理。我们t我认为这是现代数据科学准备做的事情……[但是]对于大多数人和大多数资助者来说,其规模是令人生畏的。他们想要的是他们理解的项目,在那里他们看到了通往成功的清晰路径和成功的良好指标。”

凯莱赫建议,这项工作可能取得进展的一个途径是参与一些正在进行的单细胞生物学项目,如美国国家卫生研究院资助的人类生物分子图谱计划。

他说:“(围绕单细胞生物学)有很多活动,我相信,随着这些活动的继续,随着他们了解到蛋白质形式的机会,这代表了一个选择,可以加入这些模型和财团,无论它们是公共的还是慈善的。”

无论Kelleher和他的同事们设想的人类蛋白质形式项目是否会实现,Huhmer说他相信它对蛋白质形式的关注指向了蛋白质组学的未来方向。

他说:“我认为这是该领域真正的发展方向,我们将进一步了解这种蛋白质的功能。”“我认为你会看到这个领域的一个转折点,未来人们会花更多的时间做蛋白质形态分析。”

Omenn同意了。他说:“我认为这个领域已经准备好继续发展,并更加强调功能、生物学、系统生物学和系统医学。”“所以所有这些想法都是及时的。”

扫描

唐纳德Pinkel死

据《华盛顿邮报》报道,癌症研究员、圣裘德儿童研究医院创始主任唐纳德·平克尔去世。

缓慢的数据

《自然新闻》报道称,关于COVID-19大流行起源的数据发布缓慢让研究人员感到沮丧。

睡眠少,睡眠好

据《亚特兰大宪法日报》报道,睡眠基因也可能影响神经退行性疾病的风险。

PLOS论文:宏基因组抗生素耐药性管道,利什曼适应度,APC与癌症的关系

本周发表在《公共科学图书馆》杂志上:识别抗微生物药物耐药基因的生物信息学途径,利什曼适应度的多组学分析等。
Baidu
map