纽约(基因组网)-两篇论文今天发表在科学而且细胞正在提供更多的证据,证明在执法机构和公众都可以访问的数据库中,个人的基因组数据可以揭示该人的家庭关系。
在科学由哥伦比亚大学亚尼夫·埃利希(Yaniv Erlich)和纽约基因组中心领导的研究人员展示了数据库在遗传谱系学中的应用能揭示许多美国人的家庭关系吗有欧洲血统。他们分析了120万人他们接受了消费者基因公司My Heritage的基因分型埃利希担任该公司的首席科学官。
作者写道:“我们的研究结果显示,近60%的远程家庭搜索会返回一个亲戚,”他们是第三代表亲(共有一个曾曾祖父母的人)或更近的亲属。
在细胞,由斯坦福大学教授诺亚·罗森伯格领导的研究人员描述了一种允许他们识别亲子关系和兄弟姐妹关系的算法基因组数据不一致的个体。首先,他们匹配了一个人的数据,其中一个人的数据来自SNP基因分型,这通常用于消费者基因组学,另一个人的数据是短串联重复(STR)配置文件,这用于执法部门运行的DNA数据库。
在218个SNP和218个STR配置文件的模拟数据集中,每个配置文件与其他数据类型的配置文件“匹配”,研究人员能够识别高达32%的父母-后代对和高达36%的兄弟姐妹对。
埃利希告诉基因组网说:“这两篇论文讨论了基因隐私、消费者数据库和法医工作的融合问题。”两个团队的研究人员还表示,他们的论文对研究中使用的基因组数据有影响。
今年,执法部门因使用基因谱系学来识别备受瞩目的悬案嫌疑人而登上头条。今年4月,加州官员逮捕了一名男子,据称他是连环杀人犯和强奸犯金州杀手.今年5月,华盛顿州官员宣布逮捕了一名1987年的两起谋杀案.
基因组数据在帮助识别个体方面的力量,已经在今天发表这篇论文的每个研究小组之前的工作中得到了证明科学而且细胞研究。2013年,埃利希在科学这表明STR分析可以帮助调查人员找到家族姓氏,当与其他公开数据一起使用时可以用来识别人吗.
去年,斯坦福大学罗森伯格领导的研究人员发表了一篇论文论文美国国家科学院院刊详细说明了他们如何能够将SNP配置文件与同一个人的STR配置文件相匹配。该方法利用两种遗传标记类型之间的连锁不平衡来寻找经常一起遗传的标记。因此,他们能够协调数据类型并将其用于标识。
随着法医DNA方法逐步向下一代基于测序的技术发展,这类研究也在不断发展增加证据这表明了SNP基因分型是如何改变了可能法医遗传学。
“有了snp,一切都改变了,”加州大学戴维斯分校的博士后迈克尔·埃奇(Michael Edge)说细胞纸。“在[Erlich的论文]中,他们讨论了如何使用这些[SNP谱]来识别这些长距离的家庭关系。我们的目标是将旧的信息来源与新的信息来源连接起来。”
很快,“几乎每个有欧洲血统的美国人”都可以通过基因数据识别出来,埃利希补充道。“即使某个特定的人不在这些数据库中,他们的亲戚也可能在,这足以识别他们。”
在论文中,他的团队提出,在给定的数据库中,只需要目标人群的2%就可以找到感兴趣的人的第三表亲。埃利希指出:“如果你有家谱记录,就很容易追溯。”
不仅是执法调查中的嫌疑人可以被识别。“研究对象可以使用同样的策略来确定,”他说。在论文中,作者认为,消费者基因组公司应该联合起来开发加密措施,以帮助控制记录去匿名化的风险。
的细胞论文作者对此表示赞同,并指出他们的论文对法医学和基因组研究也有影响。
罗森伯格在一份声明中说:“公众应该意识到,这两种基因数据之间的信息可以以意想不到的方式联系在一起。”“这是一个遗留问题,自20世纪90年代以来,执法部门一直使用这个古老的遗传标记系统收集了如此多的DNA图谱。该系统不是为目前更有挑战性的查询而设计的,比如识别DNA混合物中的人,或者识别DNA样本贡献者的亲属。”
Edge指出,该算法可以为旧的遗传数据集提供向后兼容性。他说:“我们讨论的是str和snp,但算法没有针对这些数据类型的任何内容。”“也许你有snp和snp,但它们是不同的。或者你有一个古老而稀疏的SNP集,但你的研究对象是相同的人。你也可以在这种情况下使用算法。”