一个国际研究团队本周,该公司宣布计划使用下一代平台对至少1000到2000个人类基因组进行测序,目标是制作一份详细的遗传变异目录。
由美国国立卫生研究院国家人类基因组研究所、英国威康信托基金会桑格研究所和中国北京基因组研究所深圳分所领导的为期三年的“1000个基因组计划”,不仅将绘制snp图谱,还将绘制高分辨率的结构变异图谱,如插入、删除和重排。
据一个财团估计,这项研究预计将为公共数据库增加至少6万亿数据库的新数据——比过去25年存入这些数据库的所有序列数据多60倍——并将花费3000万至5000万美元的成本。
虽然现有的数据库列出了在至少10%的人群中发现的基因变异,但新的图谱将包括在整个基因组中存在的只有1%的人的变异,以及在0.5%或更少的人身上出现的基因变异。
到目前为止,研究疾病遗传原因的研究人员关注的要么是引起疾病的非常罕见的变异,如囊胞性纤维化或亨廷顿舞蹈症,要么是增加糖尿病或心脏病等常见疾病风险的更常见的多态性。
哈佛大学医学院遗传学和医学副教授、布罗德研究所研究员、该联盟指导委员会联合主席大卫·阿特舒勒在一份声明中说:“在这两种非常罕见和相当普遍的遗传变异之间,我们在知识上存在着巨大的差距。”“1000个基因组计划旨在填补这一空白,我们预计其中将包含许多与人类健康和疾病相关的重要变异。”
该项目的结果还可以帮助研究人员更好地解释现有和未来全基因组关联研究的数据。在这些研究中,研究人员经常发现与疾病相关的基因组区域,但他们不知道因果变异。
NHGRI大规模测序项目的项目主管亚当·费尔森菲尔德(Adam Felsenfeld)告诉记者,“1000个基因组计划”将帮助这些研究人员制作“一个现成的目录,你可以[用来]跟踪”全基因组关联研究按顺序上周。“你不需要对(该区域)重新排序,只需从数据库中取出(可能的变体),然后开始测试它们。”
由阿特舒勒和桑格研究所首席研究员理查德·德宾共同担任主席的指导委员会将管理该项目。该财团还包括几个负责生产的集团;分析;数据流;样本,伦理,法律和社会问题。
该项目将从三个试点研究开始,预计持续一年左右,然后是为期两年的生产阶段。预计成本为3000万至5000万美元,费尔森菲尔德称这是一个“大概的估计”,这是基于“我们认为新技术平台可以做什么的最佳信息”。vwin德赢ac米兰合作他说,使用基于桑格的测序技术,该项目可能会花费超过5亿美元,这将是“令人望而却步的”。
他说,NHGRI预计将利用分配给大型测序中心的现有资金,为该项目提供多达一半的资金。桑格研究所和华大基因的代表没有透露他们的机构预计承担的总成本有多少。
五个中心将生成序列数据:桑格研究所、深圳华大基因和NHGRI的三个大型测序中心,分别是麻省理工学院和哈佛大学的布罗德研究所、华盛顿大学医学院的基因组测序中心和贝勒医学院的人类基因组测序中心。
根据Felsenfeld的说法,更多的参与者可能会在之后加入该财团,他补充说,该项目已经收到了感兴趣的各方的询问。他说,这些潜在的合作伙伴将需要为“项目目标”做出贡献,如果他们想产生序列数据,“将大量的测序能力带到桌子上”。
Felsenfeld说,五个参与中心将使用所有三个商用的下一代测序平台:罗氏/454的基因组测序仪FLX、Illumina的基因组分析仪和应用生物系统公司的SOLiD测序仪。
Felsenfeld说,以后可能会加入新的技术。他说:“如果我们知道还有其他东西在冒泡,我们就不想把它与任何特定的技术挂钩。”vwin德赢ac米兰合作“如果(其他技术)看起来不错,而且能提供(同样的)质量和更好的成本,我相信人们会想要使用它们。”
前1000个样本将来自国际HapMap项目和扩展的HapMap集。这些匿名样本(共1085个)来自非洲、日本、中国、欧洲、印度和墨西哥的几个种群。
根据Felsenfeld的说法,他们“对任何疾病都是无偏倚的”,并且是在“适当的同意”下收集的,用于全基因组测序研究。
NHGRI基因变异项目主任丽莎·布鲁克斯(Lisa Brooks)表示,为了更好地代表某些人群,该联盟还可能收集多达900个额外的样本并进行测序。
费尔森菲尔德解释说:“最终,你希望目录中所代表的变异在很多方面都能代表你对未来疾病研究感兴趣的人群。”
每个测序小组都将参与试点项目;他们希望在未来几个月内收到样品。
在第一个试验中,科学家们将以20倍的覆盖率对6个成年人的基因组进行测序——两对父母和他们的成年子女。根据该联盟的声明,这一试点将“帮助该项目弄清楚如何使用新的测序平台识别变异,并作为其他工作的比较基础”。
在第二个试点项目中,科学家们将以两倍的覆盖率对另外180个个体的基因组进行测序,这将使他们能够了解这种数据是否可以识别序列变异。
“如果(其他技术)看起来不错,而且能提供(同样的)质量和更好的成本,我相信人们会想要使用它们。” |
在第三个试点项目中,研究人员将对大约1000个个体中大约1000个基因的外显子进行测序,以确定对人类基因组中所有外显子进行测序的最佳方法。
根据Felsenfeld的说法,这些中心还没有确定在生产阶段如何分割样品。
沃什大学的基因组测序中心将在试点研究中使用其454、Illumina和ABI下一代测序平台。“我们认为,由于不同平台在不同的试点项目中具有广泛的适用性,我们将为每个项目提供最‘适合’的平台,”该中心联席主任伊莱恩·马尔迪斯(Elaine Mardis)说按顺序通过电子邮件。
她没有提到她的研究中心为每个试点项目选择了哪个具体的平台,但她说:“例如,成对的末端对于全基因组项目是可取的,……外显子覆盖的读取长度更长,等等。”
Mardis说,GSC还没有决定在外显子测序试点研究中使用哪种捕获方法,但它将考虑内部方法以及基于安捷伦和NimbleGen技术的方法。vwin德赢ac米兰合作
Mardis说,虽然华盛顿大学的测序能力最初是足够的,但该中心“计划在今年春季增加测序和数据存储[和数据]分析能力”。
德宾说,桑格研究所还计划在试点中使用所有三个商用的下一代测序平台按顺序.他指出,该研究所已经对Illumina的测序技术进行了“大量投资”,但他说,他和他的同事也对试点项目的“新技术可能感兴趣”。vwin德赢ac米兰合作
负责华大基因全球合作的卓丽告诉记者按顺序该研究所计划在试点研究中使用下一代测序技术,但没有具体说明是哪些技术。截至本月,华大基因拥有7台Illumina基因组分析仪和2台ABI SOLiD系统按顺序1/15/2007
).他还表示,华大基因计划为该项目采购更多的测序仪和计算设备。
在截止日期前,贝勒大学的HGSC和布罗德研究所都没有回应置评请求。
据Felsenfeld说,所有参与的研究人员都将把原始试验数据存入一个新的短读存储库,由NIH的国家生物技术信息中心维护。vwin德赢ac米兰合作此外,项目数据将由欧洲生物信息学研究所和NCBI保存和分发,并将从华大基因深圳的镜像站点获得。
这一分析可能会带来一系列挑战。布鲁克斯说:“尽可能地组装每个个体的基因组,找出哪些是SNP变异,哪些是结构变异——仅仅是获得这些基本数据就会成为新技术的挑战。”
此外,开发所谓的imputation方法,允许研究人员使用低覆盖率的多个个体的序列数据来推断基因型,“是一个重大挑战,但它是该项目的真正基础,”她说。
最后,她补充说,将序列数据组装成单倍型将是一项艰巨的任务。
更多关于1000个基因组计划的信息,以及去年为该计划奠定基础的一个研讨会的信息,可以在这里找到在这里.
据德宾说,五年前,当第一个人类基因组测序完成时,研究人员就开始考虑这样一个项目。“这显然是基因组计划的历史传统,”他说。
但这项研究并不是唯一的大规模人类基因组测序项目。本月早些时候,华大基因宣布了炎黄项目,该项目计划对来自中国个体的至少100个基因组进行测序,以研究中国人口的多态性按顺序1/8/2008
).据华大基因的卓伟介绍,这个项目“完全是由我们发起的”,但它的一部分将贡献给千人基因组计划。
另一项研究是由哈佛医学院的乔治·丘奇领导的个人基因组计划,该计划于去年夏天启动,首批10名志愿者(见按顺序7/31/2007
).该项目计划使用丘奇实验室开发的技术,并由丹纳赫运动公司(Danavwin德赢ac米兰合作her Motion)商业化按顺序12/4/2007)对参与者的外显子组进行测序,最终目标是招募10万名志愿者。与1000个基因组计划不同,PGP将把基因型与参与者的医学和其他表型信息联系起来。
去年秋天,j·克雷格·文特尔研究所(J. Craig Venter Institute)表示,计划今年对10到50个人的基因组进行测序,作为一个大规模项目的试点研究,该项目的目标是在10年内对大约1万人进行测序。JCVI当时表示,它希望为该项目测试各种新的测序技术,包括来自454、Illumina、ABI和Church实验室的平台。