昨天,在美国癌症研究协会的年会上,Grail公司分享了其开发早期癌症血液检测的第一批数据,主要集中在检测特异性上。
该公司报告了其正在进行的初步分析循环无细胞基因组图谱到目前为止,该研究已经招募了超过1.1万人,预计到今年年底,参与者人数将达到1.5万人。在大约1800名参与者的训练集中,Grail的研究人员能够识别出具有显著敏感性的癌症病例的预测特征,同时最大限度地减少那些不具有敏感性的癌症病例的假阳性。
更具体地说,该公司报告称,在500多名无癌症注册者中,只有5人检测到类似癌症的信号,其中两人很快被诊断出患有恶性肿瘤。
CCGA是一项纵向队列研究,在141个地点进行,目的是提供地理上不同的美国人口的注册代表。该队列被划分为70%的新兵患有癌症,30%是健康对照。
研究人员收集血液样本并进行四种不同的分析——靶向测序、全基因组测序、靶向和全基因组亚硫酸氢盐测序以及全转录组RNA测序。对于患有癌症的参与者,如果有组织样本,也会进行分析。Grail还使用机器学习来挖掘这些分析的数据,以便训练一个分类器,可以区分癌症和非癌症。
随着研究工作的进行,Grail将对该小组进行长达五年的跟踪,观察非癌症组的未来癌症诊断,以及癌症组的治疗、复发和死亡率数据。
在AACR上提出的新分析反映了CCGA在开发分类器方面的首次尝试,使用了一组2800名参与者,分为训练集(1792人)和测试集(1008人)。在会议上,Grail研发副总裁亚历山大·阿拉瓦尼斯(Alexander Aravanis)只报告了训练集的情况,训练集减少到1399人,其中841人患有癌症,558人没有癌症。他说,该公司计划在未来的会议上分享测试集的性能数据。
在癌症组中,有超过20种肿瘤类型,其中最常见的是乳腺癌、肺癌、前列腺癌和结直肠癌。
Aravanis说,在AACR报告的病例中,癌症类型和阶段的分布在很大程度上与已知的癌症发病率模式一致,包括通过当前筛查项目或协议发现的早期癌症,以及根据临床表现诊断的晚期癌症。
为了训练分类器,来自训练队列的样本要进行三种不同的分析。研究人员进行了全基因组亚硫酸氢盐测序,以及全基因组测序和无细胞DNA的靶向测序。在后两项分析中,将结果与白细胞DNA的匹配分析进行比较,以控制背景种系改变和克隆造血。
根据Aravanis的说法,匹配白细胞测序价值的证据可以从以下事实中看到:平均而言,在非癌症组中检测到的所有变异中,非肿瘤变异占78%,在癌症组中占66%。
他说:“这种来自白细胞的无细胞突变负担的高背景是一个非常强的混杂生物信号,必须在我们的分析和信息学中进行纠正,以保持高特异性,特别是在靶向测序分析中。”
Aravanis强调了全基因组和全基因组甲基化数据中的几个例子,这些例子说明了Grail方法旨在识别的癌症特异性特征类型。这些包括从全基因组测序数据获得的拷贝数谱和从亚硫酸氢盐测序方法收集的异常甲基化模式。
总的来说,该公司发现三种分类方法高度相关,整体表现受血液中肿瘤DNA比例的影响。但到目前为止,甲基化分析似乎是最强的区分方法。
在所有三次测试中,该小组只在5个人身上看到了“类似癌症”的信号——不到580名分析的无癌症受试者的1%。
再次强调了该公司生殖细胞匹配方法的价值,虽然来自非癌症组的8名参与者最初在cfDNA测序中显示出体细胞拷贝数改变,但其中4人被发现与白细胞匹配,因此能够被排除为具有癌症样信号。
随着Grail继续跟踪五名具有类似癌症信号的非癌症组患者,其中两人已被证实患有癌症——一名患有III期卵巢癌,另一名患有II期子宫内膜癌。
Aravanis说:“这些是非癌症组在登记时出现癌症信号的重要例子,似乎已经预料到他们的癌症诊断。”
Grail在昨天的一封电子邮件中澄清说,这项研究不会向参与者返回结果,所以这两种癌症诊断都不是由于发现了类似癌症的特征而导致的。
尽管特异性是圣杯演讲的主要焦点,而且在癌症筛查的背景下非常重要,但这项研究也提供了该公司可能能够达到何种敏感性的早期线索。
除了在不久被诊断出癌症的健康个体中检测到的两种信号外,阿拉瓦尼斯还报告说,该公司在几种没有被广泛筛查且存活率特别低的癌症类型中发现了强烈的基因组和宏基因组信号。
根据该公司的报告,Grail可以在队列中所有阶段的癌症中检测出一些病例,但随着阶段的增加,所有三种检测的敏感性都更好。Aravanis报告说,亚硫酸氢盐测序的特异性调整到95%后,可以检测出65%的I-III期癌症和95%的IV期癌症。全基因组ctDNA测序对早期癌症的敏感性为61%,对IV期癌症的检出率为89%。靶向测序方法的检出率为50%,在第四阶段高达80%。
Aravanis在会议上的演讲中还公布了结直肠癌的具体数据,报告称该公司的分析可以检测出69%的I期和II期CRC病例,并将III期和IV期肿瘤的检出率提高到85%。
在AACR的演讲中,一位观众提出了一个关于评估敏感性的重要问题,因为该试验的长期随访仍处于起步阶段——即该公司跟踪非癌症组的时间还不够长,还不能知道其非癌症诊断是真阴性还是假阴性。
Aravanis对此表示同意,他说,由于这项研究仍处于随访的早期阶段,这些问题还不能得到答案,尽管它们对跟踪非常重要。
Freenome也
另一家公司Freenome致力于早期癌症筛查工具的商业化也在AACR会议上用两张海报展示了数据。
其中一项研究重申了Freenome之前强调的一点——目前的测序成本和报销水平使得仅依赖于循环无细胞DNA的广泛和深度测序的测试即使不是不可行的,也是不切实际的。因此,正如Freenome所说的那样,整合DNA突变之外的标记并使用机器学习,应该有助于克服这些挑战。
Freenome一直在推广其采用人工智能支持的多管齐下的方法,以区别于Grail等潜在竞争对手,但根据Grail在AACR会议上提供的新数据,两家公司似乎都在一定程度上尊重这些警告以及组合算法开发。
在一封电子邮件中,Aravanis重申,尽管它没有在AACR上报告这一点,但Grail也在对循环RNA进行广泛测序,这可能会显示来自肿瘤和其他生物过程的其他癌症信号。
他还在会议上解释说,Grail广泛、深入的测序方法对其分析发展战略至关重要,适用于CCGA研究的发现阶段。他认为,现在进行这种全面的分析,有望让公司收集到更简单、更临床可行的结构,并将其推向市场。
在Freenome的第二篇帖子中,研究人员还分享了他们自己正在进行的一项结直肠癌患者研究的初步分析数据。
该公司报告称,它已经实施了一个用于多种分析物综合分析的系统,包括与Grail公司类似的无细胞DNA突变检测和亚硫酸氢盐测序,以及microRNA分析和循环蛋白质检测。
来自Freenome的研究人员研究了来自一个小队列的血液样本,其中包括26名健康个体,23名恶性前腺瘤个体,以及分布在I期至IV期的相似数量的结肠癌患者。与Grail公司非常相似,该公司发现全基因组拷贝数变异可以区分肿瘤比例高的患者——主要是晚期患者,但也包括一些早期癌症患者。
使用其他分析物也可以看到癌症的信号,包括全基因组甲基化变化,CEA和CYFRA 21-1蛋白升高,以及异常的miRNA谱。
有趣的是,根据Freenome作者的说法,游离miRNA、cfDNA甲基化和循环蛋白水平之间的异常与高肿瘤比例的相关性比与晚期疾病的相关性更强。
研究小组写道,这些发现表明,一些积极的“早期”检测结果可能更好地定义为“高肿瘤分数”检测结果,这意味着在检测早期癌症方面取得的成功可能仅限于那些肿瘤分数高的癌症。
但在Aravanis分享的Grail结直肠癌数据中,尽管较高的肿瘤分数与分类器的成功程度明显相关,但根据匹配肿瘤组织分析的分析估计,在I/II期和III/IV期组中,即使肿瘤分数较低,也有病例被检测到。
Aravanis在AACR上说,Grail计划在即将到来的医学会议上进一步展示其队列中特定肿瘤类型的细分。下一步,该公司将专注于将其分析转移到临床重要的I期和II期癌症的更大参与者群体中。
他还表示,Grail将本周分享的数据作为一个起点。该公司认为,随着样本量的增加,其机器学习方法可能只会在此基础上提高性能。