来自阿尔伯特·爱因斯坦医学院的研究人员开发了一种新的方法,称为单分子突变测序(SMM-seq),用于检测细胞和组织中的超罕见突变,他们说这种方法与基于单细胞的方法不相上下。
这项技术发表在科学的进步这是一种双链测序的变体,在PCR扩增和测序之前,通过滚圈扩增对亲本DNA的每条链产生多个独立副本,进一步减少了错误。
双链测序通常包括分离每个链,独立测序,并比较顶部和底部链的序列,以发现错误。但是个别的DNA链有时会丢失,从而限制了能够准确评估序列变化的DNA片段的数量。
相比之下,SMM-seq将发夹状的适配器连接到双链DNA片段的两端,形成一个圆圈。每个适配器包含一个唯一的分子标识符和一个滚动圆引物结合位点。聚合酶可以在任意一个位点结合,并以圆形方式复制两条链,形成一条线性放大的链,每条链拷贝之间有一个共同的连接子序列。在生成序列文库时,可以在其链接处分离副本,进行单独的PCR扩增。
该研究的第一作者亚历山大·马斯洛夫(Alexander Maslov)解释说:“由于拷贝来自同一个模板,在滚动循环放大过程中产生的错误对每个拷贝来说都是唯一的。”然后,这些伪产物可以在下游分析中被过滤掉。
在建立了SMM-seq可以准确追踪暴露在低剂量诱变剂下的细胞的突变率后,Maslov和他的同事用它来识别从组织样本中提取的细胞中与年龄相关的体细胞变异。
“我一生都对衰老的过程以及它是如何由体细胞突变的积累引起的感兴趣,”与马斯洛夫共同通信作者、阿尔伯特·爱因斯坦实验室负责人扬·维吉(Jan Vijg)说,SMM-seq就是在那里开发的。
Vijg解释说,在单细胞和NGS技术出现之前,在全基因组水平上识别和理解这些突变“几乎是不可能的”,因为很多突变在单个细胞中随机发生。
他说:“(它们)在每个细胞中的积累会不同,每个突变在细胞之间也会不同。”
重新分析团队的全基因组数据最近发表的研究在人类肝脏中与年龄相关的突变负载方面,研究人员发现SMM-seq识别出的突变负载与通过金标准单细胞方法看到的相似。
SMM-seq的准确性是基于每个独立链副本中发生错误的概率。从本质上说,真正的突变应该出现在从亲本链复制的每一个拷贝上。
在估计SMM-seq的最佳分析参数时,Maslov和他的同事比较了与使用不同数量的滚动圆链副本过滤PCR和测序诱导突变相关的突变频率。Maslov说,SMM-seq的准确性在7份拷贝后停止显著提高,而只使用2份拷贝“重复了双工测序方法”。
虽然这应该会提高SMM-seq的准确性,比双工测序,直接的头对头比较仍有待完成。
这样的直接比较是有计划的,但Maslov认为,目前,该小组计算的突变频率如何随父链副本数量的变化提供了一个理论比较。
“这是一种简洁的双工测序,”TwinStrand生物科学公司的首席执行官兼联合创始人杰西·索尔克在电子邮件中说。他补充说,已经将双工测序商业化的TwinStrand公司也在研究这种技术本身,该公司持有的几项专利中都包含了这方面的内容。
他说:“使用这种连接链的特殊形式有一些实际的复杂性。”“从概念上讲,单链的一对一连接有助于减少放大‘分散’,其中一个放大效果比另一个好。但是链的连接也增加了与读取长度、混合捕获和(滚动圆扩增)所需的聚合酶类型等相关的某些效率低下。”
SMM-seq加入了其他双工测序变体,如编解码器该方法目前正在接受同行评审,它还将DNA双链的每条链物理连接起来,以创建一个更长“单双链”。与SMM-seq的滚圈放大相比,CODEC专注于提高双工测序的效率,否则将受到必须分别测序每个链的限制。它通过连接两条链并将它们作为一个单元进行测序来实现这一点,从而避免了从测序库中重新关联读取的计算需要。
Vijg, Maslov和他们的同事已经为SMM-seq申请了专利,并打算将其商业化,尽管他们表示现在讨论具体计划还为时过早。
为了实现这一目标,“我们需要对双工测序和其他分析方法进行广泛验证,我们需要测试许多已知的诱变原,”Vijg说。
与此同时,阿尔伯特·爱因斯坦小组正在与一些学术机构合作。例如,与罗切斯特大学研究人员的一项合作涉及使用SMM-seq来比较寿命非常不同的啮齿类动物(如老鼠和裸鼹鼠)的DNA修复机制,以及它们如何受到各种自发突变的影响。
该团队还计划试验使用SMM-seq来筛查人们对可能导致疾病的突变因素的易感性,比如为什么一些吸烟者会得肺癌,而另一些人不会。
马斯洛夫说:“我们(想要找到)那些或多或少容易受到诱变剂和突变积累影响的人,无论是随着年龄的增长,还是暴露在诱变因素之下。”“也许我们最终可以把它作为某些疾病发展的预后因素。”
“很高兴看到有能力的学术团体在研究双工测序的不同变体,”索尔克评论道,“这说明了该方法的实用性。”