跳到主要内容
溢价试验:

索取年度报价

随着长读技术的改进,单细胞RNA异构体测序获得了动力

溢价

随着长读测序技术的发展,单细胞RNA异构体分析不仅变得可行,而且如滚雪球般发展成为一个蓬勃发展的领域。

这种方法基于长读平台捕获全长转录组的能力,使科学家能够在单细胞水平上更仔细地观察mRNA异构体,这在短读测序中基本上是不可能的。通过这样做,研究人员希望更好地掌握细胞类型特异性异构体多样性以及异构体在疾病和生物学中的作用。

约翰斯·霍普金斯大学生物医学工程教授温斯顿·蒂姆普说:“考虑到牛津纳米孔和PacBio的生产力提高,我认为我们正在进入一个阶段,我们将能够从单细胞或空间测序中获得大量的异构体数据,这将改变游戏。”他的实验室一直在使用长读取来研究神经元中的单细胞异构体。

来源于同一基因,但序列不同,mRNA异构体通常是基因多样化其蛋白质编码能力的一种方式,利用替代剪接和内含子保留等机制。

“几乎每个基因都能产生多种异构体,”威尔康奈尔医学院(Weill Cornell Medicine)教授哈根·蒂格纳(Hagen Tilgner)说,他是单细胞异构体分析领域的先驱。

借用烹饪的类比,Tilgner说,mRNA亚型可以被认为是制备不同蛋白质的食谱的变体。他解释说,虽然有些调整可能是很小的,比如多放一小撮盐,但其他改变可能更大,比如用豆腐代替牛肉。

他补充说,因为目前“在这个领域有一个很大的争论,即这些不同的异构体中有多少实际上是功能不同的”,所以首先深入研究有多少异构体,并找出哪些与癌症或阿尔茨海默病等疾病有关是很重要的。

先前开发的工具允许研究人员从短读数据中推断异构体信息。然而,这些方法通常依赖于计算算法,往往存在局限性。例如,由于短读取通常不能穿越多个拼接边界,因此很难自信地说特定的读取来自哪个异构体。

蒂姆普说:“如果你能直接看到它,那就更容易了。”“如果你能对整个文本进行排序,那总是比必须从短读数据中进行复杂的推断和建模要好得多。”

他指出,10x Genomics平台已经生成了用于单细胞转录组分析的全长cDNA分子,然后将其切割成短读测序文库。因此,部署太平洋生物科学公司或牛津纳米孔技术公司的平台来研究10倍单细胞文库是一个自然的选择,他说。

推动PacBio的吞吐量边界

尽管PacBio多年来一直提供Iso-Seq工作流,能够捕获全长RNA异构体,但该公司平台的吞吐量一直是推动应用程序进入单细胞的瓶颈。

Timp说:“以前PacBio的产量太低了。“即使是续作,你最多也能获得几百万次阅读量。”

然而,Timp指出PacBio克服这个问题的一种方法是采用一个名为多路阵列测序(MAS-Seq)这是一种基于cDNA连接的方法,最初是由哈佛大学和麻省理工学院布罗德研究所的Aziz Al'Khafaji团队开发的。

“对于像RNA测序这样的事情,你需要相当多的读取,”Al'Khafaji说,他帮助领导Broad研究所的基因组学技术开发。vwin德赢ac米兰合作“随着时间的推移,(PacBio的)读吞吐量开始增加,但仍远远没有达到它需要的水平。”

Al'Khafaji说,即便如此,与短读测序在实现全长异构体分析方面的“相当陡峭的障碍”相比,他认为“在长读测序仪上解决吞吐量问题要容易得多,特别是PacBio。”

他的团队开发了MAS-Seq,它将来自单细胞平台的cDNA分子连接起来进行长读测序,产生的数据可以从生物信息上转化为原始分子。该方法有效地提高了通量,同时减少了所需的测序量。

Al'Khafaji说,MAS-Seq利用了PacBio“对15- 20kb [DNA]分子进行测序的最佳点”。他解释说:“事实证明,大部分异构体都在3 kB和4 kB以下。”他说,通过将dna连接成大小为15 kB到20 kB的分子阵列,“你基本上可以通过将dna拼接到阵列中来提高测序的输出”。

PacBio已经从Broad研究所获得了MAS-Seq技术的许可vwin德赢ac米兰合作,并将其商业化为一个试剂盒,该试剂盒与使用10x Chromium平台生成的3'单细胞cDNA文库兼容。根据PacBio公司的说法,pas - seq试剂盒可以将测序通量提高16倍,并可用于其Sequel II系统以及新的Revio平台。此外,MAS-Seq单细胞数据可以使用该公司的SMRT Link分析软件进行分析。

Al'Khafaji指出,pas - seq还与PacBio公司最近推出的Revio测序仪兼容,后者有望将HiFi读取吞吐量提高一个数量级以上。他说:“Revio并没有降低MAS-Seq的效用,它只是打开了更多的门。”“人们将使用更多以前从未有过的样本。”

提高牛津纳米孔技术公司的测序精度

虽然PacBio测序一直受到吞吐量问题的阻碍,但当涉及到scRNA-seq数据时,测序的准确性一直是牛津纳米孔技术公司的一个障碍。

Timp指出:“到目前为止,纳米孔和10倍数据的问题在于,条形码和[唯一的分子标识符]是为Illumina测序设计的。”“它们是为非常精确的读取而设计的”,因此纳米孔数据的解复用一直很困难。

然而,牛津纳米孔公司推出了最新的Q20 +化学蒂姆普说,“纳米孔的最新精度现在已经足够好了,你可以使用合适的工具来做事情”。

加州大学圣克鲁兹分校(University of California, Santa Cruz)生物分子工程教授克里斯托弗·沃尔默斯(Christopher Vollmers)表示同意:“ONT一直在研究准确性。”他的实验室一直在开发单细胞亚型分析工具。“他们现在销售的新型R10流式电池实际上非常好。”

作为牛津纳米孔的早期客户,Vollmers表示,尽管该公司的最新产品在他的实验室中“没有达到99%的中位数准确度”,但它“已经接近了”。

他说,在他的实验室中,准确率的中位数为98.7%,“肯定比R9流式细胞更准确,而且吞吐量似乎没有受到影响。”

此前,为了弥补牛津纳米孔平台单读取精度的不足,Vollmers的团队开发了一种称为滚动圈放大至串联一致(R2C2)

R2C2利用Gibson组装使cDNA分子环状,并通过滚圈扩增,这是科学界公认的一种方法。然后利用纳米孔测序的长读取能力对所得到的文库进行测序,以产生具有更高碱基精度的一致读取。这反过来又使研究人员能够使用牛津纳米孔平台准确而经济地进行单细胞异构体分析。

Vollmers指出,随着牛津纳米孔技术的vwin德赢ac米兰合作不断改进,R2C2读取的质量也越来越好。他说:“随着纳米孔原材料精度的逐年提高,我们的R2C2精度也在不断提高。”“这意味着,这些天来,我们的R2C2方法实际上与Iso-Seq的读数一样或更准确。”

此外,虽然纳米孔测序的准确性“可能足以进行很好的异构体分析,”Vollmers说,但该平台仍然“严重偏向于较短的分子”。因此,测序仪分析的分子不一定代表样本,他指出,但R2C2可以通过“对纳米孔测序仪隐藏cDNA的实际长度”来帮助缓解这一缺陷。

尽管R2C2能够有效地将牛津纳米孔平台转化为用于cDNA分析的共识式测序仪(类似于PacBio), Vollmers说,该方法得到了他的学术实验室的支持,但到目前为止还没有转化为工具包,与完全商业化的产品(如马斯- seq)相比,仍然“有点粗糙”。

他说:“我主要还是想支持人们采用(R2C2)。”“有公司支持(产品)和客户支持,如果不适合你,还可以退货,我认为这很有价值。”

下游数据分析

虽然新兴的单细胞异构体测序工作流程揭示了新的见解,但科学家们也面临着开发能够准确解释这些数据的分析管道的任务。

为此,Vollmers的团队开发了一种名为曼达洛它能够处理由纳米孔测序仪生成的R2C2方法和PacBio生成的Iso-Seq数据产生的单细胞RNA-seq数据。

不过,随着该领域的不断扩大,Vollmers说,数据分析可能会成为一项计算挑战,特别是考虑到研究人员现在正在处理一种新型数据。

威尔康奈尔大学的Tilgner说:“在某种意义上,长读测序的前景是,我们真的只是直接对分子进行测序……所以每个人都认为(分析)会很容易。”“但事实证明,事实并非如此。”

“最根本的问题是,我们从来没有真正知道算法应该达到什么目标,”他补充说。

今年1月,Tilgner的团队在自然生物技术vwin德赢ac米兰合作被称为等产量曲线这是一种利用内含子图的长读RNA-seq数据来帮助确定异构体的方法。

该论文的第一作者、Tilgner在芬兰赫尔辛基大学的合作者安德烈·普吉贝尔斯基(Andrey Prjibelski)说,这种方法“结果证明非常有效”,并且已经证明它可以在单细胞水平上处理数据。

对于新的转录本发现,研究人员在他们的研究中表明,当与参考基因组注释配对时,IsoQuant可以将牛津纳米孔数据的假阳性率降低5倍,在无参考模式下降低2.5倍。作者观察到,类似地,该算法提高了PacBio数据的性能。

IsoQuant方法是建立在该团队的知识基础上的之前的研究,该研究探索了PacBio和Oxford Nanopore仪器在测序单个cDNA分子时的平台特异性错误模式。

“如果你有绝对的随机误差,也许你可以在统计学上避免它,”Prjibelski指出。“但如果你在基因组的某些位置有某种偏向,而你有某种基序,这会使校准变得复杂,那么它就会变得更加棘手。”

Tilgner说:“我的看法是,我们真的需要一些强调精度的东西。”“所谓精确,我的意思是确保你不会把每一个测序错误都报告为一种新的亚型。”

找出潜在的陷阱

除了平台特异性的测序错误,还需要系统地研究单细胞亚型分析的其他潜在缺陷。

Timp说:“我们必须回答有关在对单细胞使用单分子测序工具时可能会出现偏差的严重问题。”“我认为人们还没有做过彻底的对照研究,看看我们可能遗漏了什么,或者可能发生了什么其他偏见。”

沃尔默斯说:“这是我们一直在处理的问题。“如果PacBio或ONT长读测序是测序全长转录本的唯一方法,你如何验证该转录本是真实的?”

然而,社区正在努力弥合这一知识鸿沟。例如,包括Vollmers在内的一组研究人员组成了长读RNA-Seq基因组注释评估项目(LRGASP)联盟。

LRGASP由加州大学圣克鲁兹分校教授Angela Brooks领导,希望通过研究工作流程的不同部分,如文库准备、测序平台和计算分析工具,来克服转录组学分析的长读测序的挑战。初步结果目前在自然方法服务器已登记的报告

通过谨慎和有条不紊地进行,单细胞RNA异构体分析的早期采用者希望为更广泛的社区的吸收奠定基础,因为该领域将继续蓬勃发展。

Vollmers说:“我们已经证实这是可行的。”“一旦技术足够稳定,vwin德赢ac米兰合作然后实验室就可以把它捡起来——那才是真正令人兴奋的时候。”

扫描

与白尾大野兔冬季皮毛颜色变化有关的基因

研究人员在《科学》杂志上指出,气候变化可能会导致伪装不匹配,增加白尾长耳大野兔的捕食量。

腺嘌呤碱基编辑器靶向SCID突变的新研究

来自加州大学洛杉矶分校的研究人员在《细胞》杂志上报道,腺嘌呤碱基编辑能够在严重联合免疫缺陷模型中产生功能性T淋巴细胞。

研究人员发现影响植物碱性敏感性的基因

中国科学院的研究人员在《科学》杂志上报告称,他们发现了一个影响碱盐敏感性的基因座,这可能有助于提高作物产量。

国际团队提出返回基因组研究结果的检查清单

《欧洲人类遗传学杂志》的研究人员提出了一份清单,以指导将基因组研究结果返回给研究参与者。
Baidu
map