自从Sciex近十年前推出了Swath数据独立采集(DIA)质谱工作流程以来,随着许多实验室采用该技术,供应商为他们的仪器开发方法,DIA质谱的受欢迎程度稳步增长。
然而,这种吸收大部分集中在领先的研究实验室,这些实验室往往最先采用新技术。另一方面,像核心实验室这样的设施,都变慢了尝试该技术时,要考虑方法开发和实现的难易程度以及客户利益。
然而,软件方面的最新发展正在改变这些态度,简化了DIA的实施,并促使一些曾经犹豫不决的蛋白质组学核心主管在他们的实验室中提供这种方法。
在开发DIA方法之前,蛋白质组学实验使用数据依赖采集(DDA),其中质谱仪对进入仪器的前体离子进行初始扫描,并选择这些离子的采样进行碎片化和生成MS/MS光谱。由于仪器扫描速度不够快,无法获得在给定时刻进入的所有前体,许多离子——尤其是低丰度离子——从未被选择用于MS/MS破碎,因此没有被检测到。
另一方面,在DIA中,质谱仪选择宽的m/z窗口,并在该窗口中分解所有前体,使机器能够收集样品中所有离子的MS/MS光谱。这意味着,与DDA不同的是,在DDA中,一个样本中的蛋白质值可能存在,而另一个样本中的蛋白质值可能缺失,DIA数据集在许多样本中具有高度的可重复性,这提高了定量和能力,例如,在许多条件或样本中评估不同生物标志物的水平。
但是,尽管DIA的前景很诱人,但对于许多核心实验室来说,这项技术太笨拙了,无法实施。
其中一个主要的障碍是,为了在DIA运行中创建用于识别肽的光谱库,研究人员首先必须进行一系列的DDA运行,增加仪器和样品处理时间。
阿arkansas大学医学科学蛋白质组学核心助理教授Aaron Storey说:“我们一直在倾听DIA领域的声音,并听到它如何超越DDA,但它需要根据样本特异性光谱库搜索数据,而这通常是使用DDA获得的。”Aaron Storey一直领导DIA的工作。“因此,为了让DIA运作良好,有一个隐藏的DDA要求。”
Storey说,DIA方法的良好运作还需要一定程度的专业知识和对该领域最新研究的熟悉。它并不是一个特别简单的实现方法,至少如果你想从中得到好的结果的话。
他说,他对这种方法的调查使他确信,“改进方法和从DIA原始文件中提取信息所需的时间对在核心设施中工作来说,将是太多的时间和精力投资。”
Susan Weintraub是位于圣安东尼奥的德克萨斯大学健康科学中心的生物化学教授和质谱仪核心主任,她说,根据她的经验,建立一个高质量DDA库所需的大量工作并不适合核心实验室的工作流程。她说,虽然花几周时间对样本进行分馏和运行以建立一个长期项目的“深度”库是值得的,但核心实验室用户正在研究的物种、细胞类型和组织种类繁多,使得这种时间投资不现实。
加州大学戴维斯分校蛋白质组学核心经理布雷特·菲尼(Brett Phinney)说:“DIA对我来说从来都不是很有效。”他指出,多年来他一直在探索这种方法,但发现在他的核心设施中有效实施具有挑战性。
不过,最近的软件开发改变了这种局面。具体来说,有几个小组已经推出了可用于生成预测光谱库的深度学习工具,这意味着研究人员可以进行DIA实验,而不必先进行一轮又一轮的DDA质谱测试。此外,软件公司Proteome software开发了Scaffold DIA工具,许多科学家表示该工具显著简化了DIA工作流程。
深度学习工具是在一年多前面世的自然方法的两项研究其中一项由马克斯·普朗克生物化学研究所和Verily的研究人员领导的团队完成,另一项由慕尼黑工业大学(TUM)的研究人员领导的团队完成。
该软件包被Max Planck团队称为DeepMass:Prism, TUM团队称为Prosit,都使用了深度学习工具来预测基于质谱的蛋白质组学中的离子碎片模式,允许更自信地将光谱分配给肽,这使得研究人员可以从给定的数据集中识别更多的肽和蛋白质。这种预测能力还允许研究人员为DIA实验生成预测的光谱库。
“我认为用深度学习光谱预测工具取代[实验生成的]库是切实可行的,”马克斯·普朗克计算系统生物化学小组负责人、其中一篇论文的高级作者Jürgen考克斯当时表示。“从长远来看,我认为我们不会再生成图书馆了,这实际上是使DIA工作变得有点密集的部分,尤其是对较小的实验室来说。”
“长期研究”的到来可能比考克斯预期的要快,因为这些工具已经开始进入蛋白质组学核心,并推动了DIA的应用。
菲尼说:“这是所有人的目标。”“这是毫无疑问的。”
他指出,他的实验室已经开始使用Prosit来为DIA工作生成预测库,以及深度学习工具,如DIA-NN软件由弗朗西斯克里克研究所的研究人员开发,该研究所使用信号校正策略的组合来减少干扰,并使用神经网络来分配DIA工作流程中峰值识别的置信度。
菲尼说,在多年努力获得高质量的DIA数据后,他现在发现DIA的数据往往优于DDA方法。
“现在,我用DIA方法得到的数据比DDA方法好得多,”他说。
“我不认为以前的数据是糟糕的,”国家标准与技术研究所的研究化学家本·尼利(Ben Neely)说,他的工作包括优化和标准化DIA方法。vwin德赢ac米兰合作“我认为这与DDA的出色表现相当,但我认为有了Prosit的加入……现在你肯定比DDA更好。”
Storey说,Proteome Software公司发布的Scaffold DIA软件也是他的实验室决定进入DIA的关键。实验室已经在使用该公司的Scaffold软件进行蛋白质组学研究,Storey看到该公司正在宣传Scaffold DIA是一种万能的DIA分析工具。
“我想我们可以试一试,”他说。蛋白质组科学公司建议他们使用Prosit工作流软件。“当我们尝试时,我们对结果感到震惊,而且效果很好。好消息是,首先,我们看到数据的表现优于DDA,但同时也看到它是多么容易。”
Weintraub还强调了Scaffold DIA软件,特别是其中一个名为EncyclopeDIA的模块,该模块使用经验数据来优化预测的光谱库,她说这进一步改善了DIA工作流生成的数据。今年3月,由Proteome Software联合创始人、系统生物学研究所翻译研究员Brian Searle领导的团队,包括Prosit背后的TUM教授之一Bernhard Küster发表了论文一篇论文在自然通讯详细介绍方法。
她说:“使用一个预测的库,然后在经过经验校正后对其进行搜索,会得到惊人的结果。”她指出,虽然这需要一些额外的质谱仪时间来生成用于改进预测库的数据,但“这与为每个项目获得一个巨大的DDA库完全不同。”
Storey说:“一开始我们很怀疑,但似乎能够产生这些预测的光谱库真的解决了这个领域的问题,使我们更容易在一个核心中进行这些实验。”
Neely说,随着新的信息学工具的到位,DIA对于小型核或其他没有大型中心资源的设施来说可能是一个特别有吸引力的方法。
他指出,像TMT这样的等压标记方法可能很昂贵,许多小型实验室没有运行最新和最有效的TMT工作流程所需的顶级仪器。
Storey说,他的实验室决定采取哪条路线主要取决于研究人员想要运行的样本数量。
他说:“如果你有16个或更少的样本,我们建议使用TMT工作流程,因为我们可以执行离线分馏,并为该样本集应用足够的仪器时间,以实现多达10,000个蛋白质id。”“我们目前无法使用DIA实现单批TMT下入的深度。”
另一方面,“如果你有30个或更多的样品,你将进入多个批次的TMT标签,DIA是我们推荐的工作流程,”他说,并指出他的实验室采用DIA使它可以承担比过去通常看到的更大的项目。“自从我们开始更频繁地进行DIA研究以来,我们看到的项目有60个、70个、90个样本,有一个项目有168个样本。对于那些大型、高通量的实验,DIA的表现优于其他技术。”