来自哈佛医学院和艾伦脑科学研究所开发了一种基于DNA纳米球的RNA测序方案原位在单个细胞中。
研究人员将这种方法称为荧光法原位RNA测序,简称FISSEQ上周在网上发布在科学.在那里,他们展示了使用人类成纤维细胞的原理证明实验,证明了该方法的可行性,以及它们提取符合已知成纤维细胞功能的表达模式的能力。
哈佛医学院研究员、联合第一作者Je Hyuk Lee告诉记者,这种测序方法类似于Complete Genomics公司使用的DNA纳米球测序策略按顺序.李在哈佛大学遗传学家、通讯作者乔治·丘奇(George Church)的实验室工作,丘奇目前是完整基因组公司(Complete Genomics)的顾问委员会成员。
在目前的形式下,测序方法——产生大约30个碱基的长度——是直接在显微镜上完成的,可能需要长达几周的时间。这项研究的作者已经开始与未公开的测序公司合作,并希望在未来几年开发一种自动化版本的方法。
Lee说:“我们的重点是培养细胞或将组织切片放在玻片上,这些玻片可以转化为流式细胞,然后插入下一代测序机。”
他指出,FISSEQ有望与广泛的测序化学物质兼容。研究人员已经尝试将其与Church实验室开发的合成测序(Polonator)方法结合使用,并开始探索其与杂交测序方法的兼容性。
“看起来所有的(测序)化学成分都是兼容的,”李说。“只要测序化学使用荧光团和成像,我们的期望是它将是兼容的。”
而基于探针的方法如荧光原位Lee说,杂交(FISH)已经广泛用于评估细胞或组织切片内的特定转录本,以无偏倚和非靶向的方式询问所有转录本,同时解开它们的序列被证明要困难得多。
他说:“挑战在于检测,因为每个细胞可能有多达一百万个RNA分子。”“即使使用分辨率最高的显微镜,你也无法量化和成像单个细胞内的所有分子,并将它们区分开来。”
他认为新方法的成功很大程度上要归功于已经完成的优化,即从每个RNA分子逆转录的互补DNA链中产生异常明亮和稳定的DNA纳米球。
在这个方向上的第一个进展是在几年前,团队成员发现了一种在逆转录和cDNA生成过程中合并修饰过的尿嘧啶核苷酸的方法——这一进展有助于将得到的DNA纳米球交联到稳定的基质或“水凝胶”中。
每个纳米球都由单链cDNA组成,上面点缀着修饰过的核苷酸,这些核苷酸与一种叫做BS(PEG)9的生物惰性分子交联。Lee说,这一步骤或多或少地将cDNA扩增子“石化”在它们的细胞环境中,同时减少了背景作用。
他解释说,这导致了“令人难以置信的明亮和稳定”的纳米球,并指出纳米球基质可以承受数百次冷热洗涤循环而不会分解或移位。
他补充说,由于交联的纳米球集合也可渗透到制备和测序分子所需的溶液中,整个RNA测序反应可以在显微镜载玻片上完成。
有了交联方法,研究人员又花了几年时间寻找延长序列读取长度的方法原位从赛默飞世尔(Thermo Fisher)品牌Life Technologies的SOLiD仪器中采用的结扎测序策略中获得灵感。
根据目前的方法,该团队可以使用任何显微镜生成长达30个碱基的RNA序列,并能够区分与每个核苷酸相一致的四种彩色探针。
李说:“就我们的方法而言,拥有所有这些显微镜的灵活性,以许多不同的方式观察样本,实际上有巨大的好处,尽管它比较慢。”
“但我们当然希望利用下一代测序机的速度和吞吐量,”他说。“我们希望最终会有下一代测序机,也可以定制不同的放大倍数,不同的成像方式,等等。”
在他们发表的实验中,研究人员在每个周期后拍摄细胞的共聚焦显微镜图像,以确定每个荧光像素及其对应的核苷酸的位置。
这些实验表明,由RNA产生的DNA分子在整个实验测序周期中保持完整——目前这个过程可能需要两周时间。
他们使用FISSEQ对单个人类原代成纤维细胞中的RNA进行测序,生成了近15,000个长度超过5个像素的序列。这些扩增子与大约4171个基因重合,90%以上的明显转录本可以映射回注释的DNA链。
研究人员报告说,在检测到的最高表达的100个转录本中,那些来自已知成纤维细胞相关功能的基因,如纤维连接蛋白和胶原蛋白。
当他们对纤维母细胞进行FISSEQ时,他们在划破涂层载玻片的表面以诱导伤口愈合反应,研究人员检测到数千个转录本,包括已知的细胞子集中损伤修复的贡献者。
Lee说,在大约40个成纤维细胞中,该小组发现了超过8700个基因的转录本,尽管他们故意降低了扩增子密度以加快测序过程。“尽管我们每个细胞只有几百个,但在40个细胞中,我们有足够的信息来得出所有这些生物学发现。”
这种方法还有另一个意想不到的优势:家政基因转录本的表达减少,导致与测序细胞功能相关的转录本的表达相对稳健。
Lee说:“在正常的RNA测序中,人们必须做大量的分析,并将他们的数据集与其他细胞类型或其他数据集进行比较。”“但在我们的案例中,我们的方法只允许放大与细胞功能非常相关的基因。”
他解释说,这在某些方面简化了信息学,因为研究人员可以专注于给定细胞内的一组高表达和生物相关的基因,而不必剔除这些家务rna。
与现有的软件(如用于调用和对齐人类参考序列的读取)一起,该团队提出了新的计算方法来处理与细胞内DNA纳米球彼此接近相关的背景噪声。
特别是,研究人员确定了一种将核苷酸序列分配到图像中的每个像素的方法。Lee说,通过将每个序列与参考序列对齐,他们能够相当容易地使用这种方法区分真实的读数和背景荧光。
他解释说:“因为(读取)有30个碱基长,随机噪声、自动荧光或背景碎片……实际对准RefSeq库的概率非常非常低。”
在剔除不匹配的reads后,研究小组通过观察每个reads是否与其他序列相似的reads接近,进一步验证了他们的reads,就像细胞中的转录本所期望的那样。
在每次读取的X和Y空间坐标的帮助下,研究人员可以应用统计分析和成像“掩模”来将每个转录本定位到特定的细胞器或细胞室。
最终,该小组的目标是使用网络软件滚动给定组织中的细胞图像,以查看各种RNA转录本出现的位置,以及这种分布与编码它们的基因的已知功能之间的关系。
在这项研究提交发表时,研究人员仍在开发对准每个细胞的三维图像的方法。Lee解释说,为了简化分析的分析部分,他们在纤维母细胞上进行了论文中描述的实验,纤维母细胞相对平坦。
“我们决定寻找一个相对平坦的细胞,这样我们就可以从(三维)图像中制作一个简单的(二维)图像文件,”他说,并指出类似数据的三维对齐即将出现。
如果成纤维细胞研究的结果被成功地复制到其他类型的细胞中,研究小组怀疑RNA测序原位可能是一种以非靶向方式快速定义细胞类型特异性转录组特征的手段。如果是这样,这将提供一种定义细胞类型或疾病状态的方法,而不依赖细胞形态或靶向标记物的使用。
就他而言,Lee对使用FISSEQ以快速和公正的方式快速缩小各种细胞类型的转录签名的前景持乐观态度,无论是健康细胞还是患病细胞。以肿瘤细胞为例,他认为有可能使用这种方法来定义和描述肿瘤细胞,而不单纯依赖组织学方法。
由于该方法同时产生其他表达和序列数据,理论上应该可以同时检测来自同一数据集的单个肿瘤细胞的基因表达谱和信息突变,而不会丢失上下文数据。
Lee说:“在临床上,我们现在可以定义细胞类型,这意味着我们也可以定义肿瘤类型,而不仅仅是通过组织学方法。”“与此同时,我们正在定义这些对靶向治疗很重要的其他突变。”
他注意到RNA测序的能力原位也可能对那些研究健康组织的人有利,包括目前使用FISH等靶向方法评估的脑细胞样本类型。
Lee说,该团队已经开始通过实验探索这种可能性,并计划从各种细胞类型中生成数据集,并将其与已经通过艾伦大脑图谱集或胚胎基因表达图谱项目等工作验证的表达谱进行比较。
该小组目前与下一代测序公司的合作旨在开发更快、更自动化的测序版本原位RNA测序方案将使这种临床和研究应用更加可行。
Lee预计,这一领域的首批商业产品将是概念验证工具,对现有硬件和软件进行尽可能少的调整。他进一步指出,从理论上讲,这种发展可能会导致完全彻底改革的仪器。
他说:“我预测,当人们开始自己生成数据时,他们会看到对它的需求,这种类型的专业仪器将会出现。”
哈佛团队已经申请了多项与原位RNA测序法。