纽约(GenomeWeb)——一种使用长寡核苷酸探针捕获和克隆大量千碱基大小的DNA片段的新方法有望实现蛋白质和基因组元素的高通量功能研究,为长读测序的目标准备和其他应用。
该方法使用长连接单链寡核苷酸(LASSO)探针发表本周早些时候自然生物医学工程马萨诸塞州总医院和其他地方的一组研究人员的研究。
在他们的研究中,他们克隆了超过3000个开放阅读框——大约4个碱基大小——从大肠杆菌并行基因组。他们还使用LASSO探针从cDNA中克隆人类orf,并生成一个大肠杆菌ORF库来自复杂的人类微生物组样本。
据约翰霍普金斯大学病理学助理教授、通讯作者之一Ben Larman说,他和共同资深作者Biju Parekkadan开发了这种方法,目的是为了制作用于功能筛选分析的细菌蛋白表达文库。最初,他们计划在噬菌体上编码蛋白质,“但我们意识到,我们无法真正编码足够长的蛋白质片段,以构建一个可能产生有趣蛋白质的文库,”他说。
相反,他们想到了使用改良的分子反转探针(MIPs)来处理更大的目标,这种探针已被广泛用于并行捕获和放大短DNA目标。传统的mip是短的单链寡核苷酸,大小约为150个碱基对,两端的目标序列与DNA靶端结合。当探针结合时,它形成一个圆圈,目标序列之间的空间被DNA聚合酶填充。挂锁探测与mip相关,但在目标序列中没有需要填充的空白。
荷兰内梅亨大学医学中心免疫基因组学助理教授Alexander Hoischen在一封电子邮件中说:“看到了基于锁或分子反转探针的检测的方便性,这篇论文展示了一种有趣的替代杂交检测的方法”,用于捕获更大的DNA目标。他的实验室已经使用mip定位较短的DNA区域进行测序。
先前的研究表明,通过使探针两端之间的适配器更长,可以增加MIPs的目标DNA大小,“但没有办法在高通量下制造这样的探针,”Larman解释说。“那时我们进行了一些头脑风暴和方法开发,想出了一种方法,在单锅反应中,将oligo库转换为具有非常长的适配器的捕获探针。”
从本质上说,研究人员通过重叠延伸PCR融合了两个DNA分子——一个包含两个目标序列,另一个作为长适配器。然后,他们将产生的分子循环起来,进行反向PCR反应,产生两端都有目标序列的线性DNA。去除PCR引物位点,使分子单链后,可作为DNA捕获探针。
最初,研究人员测试了针对四种不同大小的DNA的单个LASSO探针,其中包括M13噬菌体基因组中的一个4千碱基靶,并能够捕获所有的DNA。
然后,他们制作了一套超过3100个LASSO探头,有两种不同的适配器长度,以目标在大多数orf大肠杆菌并将结果与一组针对相同orf的传统MIPs进行比较。总的来说,约75%的目标orf被LASSO探针成功捕获,而MIPs捕获的全长orf较少。
他们还使用LASSO探针从人类cDNA文库中捕获了两个完整的orf,并使用了他们的大肠杆菌LASSO库捕获一千多个大肠杆菌从人类粪便样本中提取的DNA orf。
Larman说,与同样针对千碱基大小DNA片段的探针杂交方法不同,LASSO策略允许研究人员在正确的阅读框中克隆DNA,并将其直接插入到蛋白质表达载体中。
与现有的基于dna的方法相比,这种方法的优势在于通常只能产生少量表达蛋白质的克隆。他说:“我们能够建立表达库,其中很大一部分克隆是全长蛋白质,这比传统的基于dna的蛋白质库具有巨大的优势。”
虽然研究人员在他们的论文中使用的最大LASSO库有大约3000个探针,最大的目标是大约5个碱基,但它应该有可能并行生成数万个LASSO探针,并处理更长的目标。
帕雷卡丹是马萨诸塞州总医院和罗格斯大学外科的一名教员,他说该团队目前正在研究一个拥有8000多个LASSO探头的新图书馆。他说:“我们将观察探测器数量和可捕获长度的上限在哪里。”
他说,建造一个拥有数万个LASSO探测器的图书馆的材料成本约为2000至3000美元,而且建造更大的图书馆具有“巨大的规模经济”。他说,在开发这种方法时,“成本问题一直在我们的脑海中”,该团队希望它能足够便宜,供学术研究人员采用。
研究人员已经为这项技术提交了专利申请,但尚未获得使用许可。vwin德赢ac米兰合作“我们正在探索所有的选择,”Parekkadan说,并指出与潜在许可方的谈判正在进行中。
改进该方法的一个方法是增加捕获目标的一致性,帕雷卡丹说他的团队对如何做到这一点有一些想法。他们还计划修改该方法,使其不仅能捕获DNA,还能捕获RNA目标。
此外,他们还希望改进LASSO探测器的设计,以便成功捕获更多的目标。为大肠杆菌库,例如,他们有一些设计限制,所以他们不能为所有orf生成探测,并且在捕获期间,不是所有探测都能工作。
Larman说,在他们发表的研究中,研究人员在探针设计中使用了保守的截止点,例如,为了避免小目标的放大偏差,排除了小于400碱基对的orf。他说:“未来的工作将包括描述这些影响,这样我们就知道我们在阈值方面可以不那么保守。”另外,避免放大偏差的一种方法可能是将目标库细分为多个分数,每个分数覆盖一定的目标大小范围。
Larman说他计划使用新方法来识别免疫反应的蛋白质靶点,而Parekkadan说他主要计划将其作为测试和发现新药的平台。
Larman解释说:“我们对在自身免疫性疾病领域使用这一技术非常感兴趣,通过进入目标组织并克隆所有表达的蛋白质,然后针对自身免疫性患者的免疫系统对它们进行筛选,以确定驱动疾病的分子目标是什么。”“我们现在使用基于噬菌体的系统来显示肽,但肽并不总是包含全长蛋白质中存在的表位信息。”
他说,这种方法也可以用于研究开放式阅读框架尚未克隆出来的模型生物的研究人员。
除了制作蛋白质表达库,LASSO探针的一个潜在应用是捕获大的DNA目标进行长读测序,例如,使用太平洋生物科学公司或牛津纳米孔公司的平台。Hoischen说:“随着新的长读测序技术的出现,对新的目标富集方法的需求越来越大,这种方法允许千碱基大小的DNA高度多重富集。”
Hoischen说,其他人已经探索了使用基于杂交的方法,例如,从罗氏NimbleGen或集成DNA技术公司捕获探针,以定位大小达8千碱基的DNA,用PacBio的系统进行测序,“还有待观察这些方法与LASSO方法的比较。”他的实验室使用的标准MIP工作流程很简单,允许许多样品并行处理,“所以我可以想象,基于MIP的长读数分析是很有吸引力的,”他说。
Hoischen说:“最终,LASSO能否允许更长时间的捕捉将是非常有趣的。”他指出,大型DNA片段已经使用CRISPR/Cas9进行了富集,但目前这种方法的吞吐量很低,还没有实现高度多路复用。
另一个潜在的应用,是研究人员在他们的论文中没有探索的,是针对真核生物基因组中的非蛋白质编码DNA。Hoischen说:“看看这是否也适用于人类基因组DNA,并将使更大的靶点得到富集,这将是很有趣的。”“以高度多路复用的方式对基因的整个基因组区域,或包括增强子和启动子在内的整个调控区域进行测序,有巨大的需求。”
Larman同意克隆大片段的人类DNA是一个有趣的应用,但他的团队还没有对此进行探索。“我看不出这有什么不好,”他说。