夏洛特,北卡罗来纳州(基因组网)-根据Invitae研究人员最近领导的一项实验室间研究,具有临床验证的次世代测序分析的实验室在检测某些复杂变异方面存在困难,这表明需要更好的标准来确保基于nns的基因检测的质量。
昨天,在美国医学遗传学和基因组学学院的年会上,Invitae公司的生物信息学家史蒂夫·林肯(Steve Lincoln)展示了这项研究的结果,该研究涉及7个实验室和10个工作流程,几乎所有都涉及Illumina公司的仪器。
除了Invitae,合作者还包括国家标准与技术研究所、雷迪儿童基因组医学研究所、梅奥诊所、生物计量联合倡议、加州大学旧金山分校、华盛顿大学、英国癌症研究所和澳大利亚Peter Mavwin德赢ac米兰合作cCallum癌症中心发表了他们的发现去年11月BioRxiv预印本。
据Lincoln说,在患者样本中发现的许多致病变异都很难用NGS检测,包括大的内嵌体、拷贝数变异、均聚物或结构变异。
许多实验室没有用足够数量的这类变异来验证他们的NGS检测,部分原因是很难获得含有这类变异并可作为阳性对照的患者样本。
作为一种替代方案,研究人员决定使用合成参考样本,代表不同种类的具有技术挑战性的变体。为了设计他们所谓的“弗兰肯对照”,他们在七个常见的癌症基因中选择了24个变体,其中许多是致病性的,这些基因分别是brca1、BRCA2、CDKN2A、MLH1、MSH2、MSH6和PMS2, Invitae此前在其实验室进行的临床试验中发现的。
它们包括17个具有技术挑战性的变体,其中包括小型、中型和大型的索引;短串联重复中的删除;串联重复展开;homopolymer-associated变异;删除/插入(利林)变异;分段复制中的变体;在富含gc的区域的变体;近内链的单核苷酸变异;基因组和转录参考文献不同的SNV;和良性SNVs。
SeraCare合成了含有这些变异的质粒,它们被从一个特征良好的细胞系中插入到基因组DNA中,其数量将使它们看起来是杂合的。
这个参考样本连同基因名称,随后被提供给参与的实验室。在他们使用的10个工作流中,有8个涉及到Illumina测序平台,并结合了各种目标捕获方法;一个使用了Illumina全基因组测序;一个使用Thermo Fisher离子激流平台和AmpliSeq目标放大。所有工作流程都使用不同的生物信息学管道,其中除两个外均已得到临床验证。
所有10个工作流程都能够检测到“简单的”snv和小的indel,除了一个小的indel被一个实验室遗漏。然而,只有10个具有挑战性的变异被所有的工作流程检测到,只有三个工作流程——包括Invitae的,最初在患者样本中检测到所有这些变异——检测到所有17个具有挑战性的变异。
林肯指出,在NGS的原始数据中实际上存在许多变体,但由于生物信息学的方法而被遗漏了,两个使用illumina提供的生物信息学管道的工作流比其他使用非供应商生物信息学的工作流表现更差。
此外,由于AmpliSeq方法无法放大几个等位基因,Ion Torrent工作流未能检测到许多变体。Lincoln解释说,AmpliSeq针对福尔马林固定样品进行了优化,并依赖于小型放大器,每个目标只被一个引物对覆盖,这导致了失败。此外,Ion Torrent平台遗漏了同聚物相关的变体,这是该平台的已知问题,尽管其中一个变体也被Illumina的三个工作流遗漏了。
林肯说,来自Rady儿童医院的Illumina全基因组测序工作流程表现得“出乎意料地好”,尽管它在所有测试中覆盖率最低,但只遗漏了三个变体。
林肯说,这一结果表明,临床实验室可能会忽视NGS试验验证中难以分析的变体的问题,研究人员呼吁实验室可以使用更好的标准材料。SeraCare现在提供的合成参考样本是在商业研究中使用的,但其他公司可能会开发额外的标准材料。
林肯说,下一步是扩大标准材料中“硬”变异的种类,例如,通过添加模拟镶嵌或代表其他类型的cnv的变异。