纽约——研究人员已经生成了一份癌症细胞系的泛癌症蛋白质组图谱,这表明癌症蛋白质组可以被用来寻找弱点,包括药物敏感性。
使用数据独立的获取质谱(DIA-MS)方法,该团队生成了近950个癌细胞系的蛋白质组,代表40多种不同的癌症类型,他们将这种资源称为ProCan-DepMapSanger。通过将蛋白质组数据集与其他分子和表型数据相结合,研究人员发现了数千个与癌症脆弱性相关的蛋白质生物标记,包括在转录组水平上未发现的蛋白质。
悉尼大学的资深作者Roger Reddel和他的同事在他们的论文中写道:“这个蛋白质组数据集是一个高质量的资源,用于网络组织的机制研究和蛋白质组的调节原理,以及翻译发现。周四发表在癌症细胞.
研究人员使用6次重复为每个细胞系生成蛋白质组,总共进行6864次DIA-MS测试。他们指出,这种方法使蛋白质组的可复制生成成为可能。他们最终得到的ProCan-DepMapSanger数据集包括40多种癌症类型,代表28种不同的组织类型,包含近8500种蛋白质,并扩展了这些癌细胞系的分子特征。
通过分析数据集,研究人员可以进一步确定细胞系的单细胞起源,以及发现他们观察到的蛋白质表达模式的驱动因素。例如,使用多组学因子分析,他们将数据集与一系列其他组学数据(包括基因表达和启动子甲基化数据)结合起来,以发现跨细胞系的上皮-间质转变标记的富集。
此外,研究人员将他们的蛋白质组数据集与药物和CRISPR-Cas9基因本质筛选的数据相结合。通过这种方法,他们发现了几十种与目标蛋白含量相关的药物。例如,他们注意到EGFR丰度与其抑制剂吉非替尼呈负相关,MET丰度与其抑制剂呈负相关。对于其他药物,他们发现了与靶点功能相关的蛋白质的丰富性。
研究人员还开发了一种基于深度学习的计算管道,称为深度蛋白质组标记(deep Proteomic Marker,简称DeeProM),用于识别在转录组水平上无法捕获的蛋白质水平生物标志物关联。通过分析超过400万个药物蛋白和8600万个crispr - cas9蛋白关联,他们锁定了7698个药物蛋白和5823个crispr - cas9蛋白关联,这些关联表明可能的癌症脆弱性和蛋白质生物标志物。在组织水平的过滤后,他们发现108个药物蛋白和1538个crispr - cas9蛋白的关联,这些关联不能仅从基因表达数据预测。
其中包括FOXA1转录因子敲除和basigin (BSG)水平之间的联系,BSG是一种在乳腺癌细胞中表达的质膜蛋白。研究人员指出,BSG已被发现与乳腺癌进展有关,并与基底样和三阴性疾病患者的总生存率较低有关。
该管道进一步确定了超过100种组织类型水平的药物-蛋白关联,如对Aurora激酶抑制剂的敏感性和骨源性细胞系中肽酰脯氨酰顺-反式异构酶H蛋白水平之间的联系。
研究人员补充说,与全蛋白质组相比,对1500个蛋白质的随机下采样对预测药物反应的能力几乎没有影响,并指出这一发现强调了蛋白质网络的连通性和协同调节。
Reddel和他的同事写道:“他的数据集为科学界、生物标志物的发现和蛋白质调控的基础方面的研究提供了一个重要的资源,这些方面在现有的分子数据集中是不明显的。”“这将使目标(包括细胞表面蛋白)的识别和癌症组织队列验证的治疗成为可能,并应用于精确肿瘤学。”