纽约——根据一项新的研究,研究人员能够从个人的全血转录组中收集到组织特异性基因表达。
了解组织特异性基因表达可以帮助了解疾病,但许多受疾病影响的组织不容易进行采样和分析。相反,美国国家癌症研究所的研究人员试图确定是否可以从更容易获得的血液样本中测量组织特异性表达。
当他们报道称,科学的进步, NCI的Sridhar Hannenhalli和他的同事使用基因型-组织表达(GTEx)项目数据来测试预测全血样本中组织特异性基因表达的模型。对于超过30种不同的组织类型,他们发现他们的一个模型可以预测大约60%的基因的组织特异性基因表达水平,甚至可以预测骨骼肌基因的更高比例。研究人员说,这样的转录组标记可以用作预测疾病的标记,他们已经开发了一种软件管道,用于预测组织特异性基因表达,称为组织表达估计使用血液转录组,或TEEBoT。
研究人员在一封电子邮件中说:“原则上,TEEBoT可以用于各种复杂的疾病,目前正在努力构建基于组织的表达生物标志物,包括慢性衰老相关疾病和癌症。”
他们利用32个初级组织的GTEx数据开发了他们的模型,这些组织至少来自65个个体的样本,以及全血转录组和人口统计学数据。对于每个组织和基因,他们拟合了三个嵌套回归模型来预测组织特异性基因表达数据。主要模型被称为M2,包括全血基因表达和全血剪接数据,以及年龄、种族和性别等人口统计学因素。
研究人员对32个组织中的17031个基因进行了模型拟合,并估计了其准确性。对于包括全血基因表达和人口统计因素的基本模型M1,研究人员注意到它可以预测一部分表达的基因,但像M2一样添加全血剪接数据提高了对40%以上基因的预测。另一个包含SNP数据的模型也进行了测试,但研究人员发现,它只改善了对少量基因的预测,而且还需要全基因组测序。
平均而言,M2模型在预测肌肉骨骼组织中59%的基因和81%的基因的组织特异性基因表达方面做出了重大贡献。
研究人员还指出,组织特异性可预测基因具有特定的特征。也就是说,它们倾向于参与基本的细胞过程,并与其他基因有更强的连接,包括家务管理基因。
研究人员发现,在预测某些疾病状态方面,这个模型几乎和实际测量的特定组织的基因表达水平一样好。对于在GTEx中标注的有足够样本的疾病,他们比较了实际组织特异性基因表达、预测的组织特异性基因表达和全血基因表达预测疾病状态的能力。他们发现,预测的组织特异性基因表达比全血基因表达表现更好,与实际的组织特异性基因表达相当。
此外,研究人员还公开了TEEBoT管道的代码。他们正在进一步工作,通过折叠额外的蛋白质组学和代谢组学数据,并在最新可用的数据集上对其进行基准测试,以改进它。同时,他们正在探索它在从癌症患者的血液转录组中预测肿瘤转录组的适用性。