纽约(GenomeWeb)——FANTOM联盟已经生成了一份人类长链非编码rna的图谱,表明超过19,000个lncrna可能是功能性的。
国际团队此前绘制转录起始位点,检查转录因子相互作用,识别增强子等。在其最新的论文中,今天出现在自然, riken领导的研究小组报告称,他们建立了一个包含近3万个人类lncrna的图谱,该图谱具有准确的5'端,并确定大多数lncrna来自增强子。此外,研究人员发现,更多的lncrna可能具有功能作用,比人们普遍认为的要多。
来自日本理化学研究所生命科学技术中心和西澳大学的资深作者阿利斯泰尔·福雷斯特在一份声明中说:“在我们的基因组中产生的数千个长非编码rna是有功能的,还是只是嘈杂转录机制的副产物,科学界存在激烈的争论。”“通过将改进的基因模型与基因表达、进化保护和遗传研究的数据相结合,我们发现了令人信服的证据,这些长链非编码rna中的大多数似乎是有功能的。”
为了构建这个图谱,Forrest和他的同事们将来自GENCODE、ENCODE、miTranscriptome和Human BodyMap 2.0数据集的转录模型与70个FANTOM5样本结合起来基因表达Cap分析(笼)方法。通过这种方法,研究人员能够基于CAGE集群和TIEScores来评估转录起始位点(TSS),这估计了CAGEcluster和转录模型真正包含TSS的可能性。
研究人员指出,许多其他绘制转录图谱的努力并不总是能捕捉到准确的5'末端,但在这里,他们报告了27919个具有高可信度5'末端的lncRNA基因。
基于它们的tss和DNase I超敏位点(DHS)被认为是启动子、增强子或dydaddic调控区域的重叠,研究人员发现大量lncrna起源于增强子DHSs,而不是启动子。他们进一步报告说,lncrna比以前认识到的更加保守。
许多lncrna似乎也与疾病有关。通过结合遗传和基因表达数据,研究人员发现,通过全基因组关联研究,与疾病相关的SNPs重叠的lncRNAs在疾病相关细胞类型中表达。这表明lncrna可能参与多种疾病。
此外,他们还指出,与eqtl相关snp重叠的lncrna与相应的mrna共表达,这表明这些lncrna可能有助于调节转录。
总之,研究人员认为,他们的分析表明,大约69%的FANTOM CAT lncrna(或19,175个)可能是功能性的。他们指出,这与已知蛋白质编码基因的数量不相上下。
理化学研究所的皮piero Carninci补充说:“从这个图谱中获得的改进的基因模型和人类长链非编码rna的广泛功能线索,可以作为我们正在进行的工作的一部分,为我们实验研究它们的功能相关性提供罗塞塔石碑。”