纽约——实验室使用的人类参考基因组的选择可能会影响所谓的变异,这是研究和临床实验室在选择参考基因组时需要牢记的一个问题。
GRCh38人类参考基因组诞生于7年多前,填补了空白,添加了替代支架,并进行了其他更新,新的补丁和更新仍在发布中。但并不是所有的实验室都完成了从GRCh37参考基因组(也被称为hg19)到GRCh38的转换。最近的一项调查表明,大多数临床实验室不愿意进行这种转变,因为他们不确定这种好处是否值得改变工作流程的成本。
一项新的研究发现,对于基因组的某些区域,哪些参考基因组被用来调用外显子组测序数据中的变体可能会产生不同。莫兹·达伍德,医学博士/博士。贝勒医学院的一名学生和他的同事们发现了一组超过200个基因,其中包括与孟德尔疾病有关的基因,这些基因在不一致的变异呼叫中得到了丰富。
达乌德说:“在整个研究领域,把年龄提高到38岁只会让事情变得更好的暗示并不完全是我们看到的。”他指出,在某些情况下,旧的参考值比新的好,但也有相反的情况。“你真的需要对你正在看的东西很有悟性。”
尽管如此,该领域正在缓慢地更新它的工具,以便与GRCh38合作,尽管这种转变可能会因为端粒到端粒的人类基因组组装的释放而变得复杂。
“我们很快就会到达这样一个地步,即使临床实验室迁移到38,他们也必须应对一个完整的其他前沿领域,”堪萨斯儿童慈善医院(Children’s Mercy Kansas City)儿童基因组医学中心(Center for Pediatric Genomic Medicine)分子肿瘤学主任米德哈特·法鲁克(Midhat Farooqi)说。
为他们的美国人类遗传学杂志研究, Dawood和他的同事使用GRCh37和GRCh38参考装配对贝勒-霍普金斯孟德尔基因组中心收集的1572个外显子组测序样本产生了不同的调用。虽然两种参考文献的结果基本相似,但达乌德和他的同事注意到,在不同的参考基因组之间,约1.5%的snv和2%的indels是不一致的。
研究人员发现的不一致变异也倾向于聚集在基因组组合的区域,他们称之为离散不一致参考斑块(discrete不一致参考斑块)。离散序列本身对于分段重复、交替单倍型、已知的装配问题和修复补丁都有丰富的经验。
研究人员发现,一组206个基因在不和谐的叫声中也得到了富集。这些基因还包括8个与已知孟德尔表型相关的基因。此外,三种已知致病或可能致病的变异根据所使用的组装被不同地命名,这表明所使用的参考基因组的选择可能会影响一些孟德尔疾病的分子诊断。
这些发现与美国食品和药物管理局(fda)的洪辉晓此前的研究结果基本一致。大约三年前,他和他的同事报道了他们对snv的比较通过将全基因组测序数据与两个参考基因组进行比对,并将两个参考基因组之间的snv进行转换。他们发现1.5%的snv在两者之间转换不一致。他和他的同事们还追踪了这些不一致的叫声出现在基因组组装“困难”部分的点,比如重复区。
FDA的Hong在一份电子邮件声明中说:“两项研究的结果表明,在科学研究和临床实验室中翻译不同版本的人类参考文献的识别变体时,需要谨慎。”
美国国家生物技术信息中心的瓦莱丽·施耐德(Valerie Svwin德赢ac米兰合作chneider)指出,尽管社区长期以来一直怀疑不同的呼叫方式可能存在差异,但研究中报告的相对较少的位点可能也提供了安慰。
达伍德补充说,这两种引用都受到不一致呼叫的影响。他建议研究人员,尤其是那些专注于他们识别出的206个基因的不和谐叫声的人,根据哪个基因能更好地识别他们专注基因的变异来做出参考选择,施耐德也赞同这个行动计划。
但是,他说,对临床实验室进行高通量外显子组检测是一个更棘手的要求。在那里,他建议注意涉及这206个基因的临床注释。
“这意味着不要盲目地提高到38岁。有很多事情需要考虑。有时候19号的表现比38号好。”
尽管如此,Hong在他的论文中建议将GRCh38用于基于测序的SNV分析。儿童慈善基金会的实验室遗传学和基因组学研究员丽莎·兰斯顿同样发现GRCh38是更好的选择。“基于我们的工作和一些正在发表的工作,比如[AJHG但越来越明显的是,38岁的身材更强壮,”兰斯登说。她警告说,“在38项调查中也存在差异。但现在越来越少了。”
然而,正如她、Farooqi和他们的同事今年早些时候报道的那样在分子诊断学杂志在美国,许多实验室还没有对更新的GRCh38人类参考基因组进行更改——它们也没有完全转换。当他们面临改变自己的挑战时,他们得到了这个调查的想法。
“这引发了一个问题:嗯,有多少实验室已经转换了,如果他们已经或没有转换——我们怀疑他们没有转换——是什么原因阻止了他们这样做?”Farooqi说。
根据他们对二十多个提供下一代测序检测的临床实验室的调查,只有7%的实验室已经转移到GRCh38, 54%的实验室没有计划改变。最常见的是,实验室表示,他们不认为改变带来的好处超过了成本,无论是在时间上还是在金钱上。Farooqi指出,临床实验室必须重新验证他们的管道,并将现有的临床数据重新调整到其内部变异数据库的GRCh38,这是一个耗时的过程。
不过,变化可能即将到来。Lansdon和Farooqi都注意到,更多实验室依赖于变异解释的工具——比如gnomAD和DECIPHER——现在也支持GRCh38坐标。Farooqi还指出,研究实验室更有可能做出转变,这也将导致文献转变,进而可能刺激临床实验室做出转变。
他说:“现在已经到了你无法再回避这个问题的地步。”
与此同时,由美国国家人类基因组研究所的亚当·菲利普斯领导的研究人员在一份报告中指出5月在BioRxiv上发布了预印本他们产生了第一个端粒到端粒的人类基因组序列。这个序列,他们说,是一个更好的表示比GRCh38更重要。
Lansdon说,如果没有工具,将这个序列作为参考也会很慢。她说:“我预计,你会看到研究实验室开始使用它,为临床实验室铺平道路。”“最终,当有足够的支持时,是的,当然,我认为一些临床实验室也会开始采用这种技术。”