纽约来自诺华生物医学研究所(NIBR)的研究人员开发了一种方法,仅从无细胞DNA (cfDNA)中确定癌症患者的克隆造血,使用可以区分两者的计算模型来自不确定潜能克隆造血(CHIP)和肿瘤来源突变的血源性突变。
CfDNA测序在临床试验中得到广泛应用,作为一种非侵入性方法,用于确定癌症的基因组格局,监测微小残留疾病,并有可能早期发现癌症。
然而,到目前为止,如果不对匹配的白细胞和cfDNA进行DNA测序,就很难区分来自血细胞(可能来自CHIP)的突变和来自实体肿瘤的突变。
“不幸的是,WBC测序并不是常规的。其中一个原因是它很昂贵,”NIBR的数据科学家、通讯作者劳伦·费尔柴尔德(Lauren Fairchild)说。
她的团队的新计算方法,发表在科学转化医学周三,不需要WBC测序数据来确定cfDNA克隆造血的存在。作者写道:“我们的开源方法提供了一种从cfDNA标记CH变体的计算解决方案,减少了临床环境中昂贵的匹配WBC测序的需求。”
该方法是使用已发表的训练数据集开发的,其中包含124名转移性癌症患者和47名健康对照组的肿瘤、血浆和匹配的WBC测序数据。肿瘤数据是由纪念斯隆·凯特琳的MSK-IMPACT小组生成的,该小组针对410个癌症相关基因,而血浆和白细胞测序数据是由癌症早期检测公司Grail的508个基因小组生成的。
然后,研究人员从这个数据集中选择了1400个已知来自肿瘤或匹配的白细胞的单核苷酸变异,以便训练机器学习模型,仅使用无细胞血浆DNA对变异来源进行分类。
接下来,研究小组将该模型应用于4324份晚期糖尿病患者的血浆样本转移性癌症,包括ER+乳腺癌、皮肤黑色素瘤、非小细胞肺癌和结直肠癌,这些患者参加了诺华的临床试验。这些样本的数据是使用大约564个基因的两种版本的测序面板生成的。
他们发现30%的患者有与CHIP,某些肿瘤类型的克隆性造血发生率高于其他肿瘤类型,CH一般随年龄增加而增加。
而之前的研究将CHIP与这项新研究首次证明,癌症患者的总体生存期较差CHIP患者在全身和肿瘤微环境中也表现出较高的炎症标志物,特别是中性粒细胞的增加。
作者写道:“这些发现表明CH作为[肿瘤微环境]炎症的额外生物标志物及其对患者治疗反应的影响值得进一步研究。”
然而,Fairchild说,CHIP与肿瘤炎症信号增加之间的确切机制仍然是一个谜,这是这项研究的局限性之一。
同时,研究人员强调,他们需要在机器学习模型中包含更多的癌症类型,以提高其准确性。”例如,作为训练数据集的已发表研究中没有黑色素瘤患者。因此,黑色素瘤中一些已知的致癌变异,如BRAF在代表性癌症类型中,如EGFR和KRAS中,V600E不像常见的致癌变异那样被一致地归类为肿瘤来源,”作者写道。