芝加哥——瑞士一家教学医院的生物信息学家开发了一种面向患者的应用程序,根据用户的个人偏好,通过测量和量化个人向第三方披露基因组数据的风险,解决对基因组数据隐私的担忧。
他们希望这个名为“基因共享”的软件能够为安全共享敏感信息的知情决策提供基础,从而释放精确医疗的一些潜力。
瑞士洛桑大学医院精准医学数据科学和研究负责人Jean Louis Raisaro解释说:“GenoShare的目标是让人们重新掌握他们想与谁分享的数据,并告知他们隐私风险方面的潜在后果。”上周,Raisaro在2020年美国医学信息协会(AMIA)虚拟年度研讨会上介绍了基因共享技术。
“这个工具不能为你提供正式的隐私保障,但它会告诉你潜在的风险,”Raisaro在后续采访中说。“它在这个过程中提供了更多的透明度,把个人带到中心,让他对这些数据感到更有权力。”
这家医院的Raisaro团队——以其法语首字母缩写CHUV为人所知——准备了一则短片手稿原定于4月举行的欧洲医学信息学(MIE)会议因新冠肺炎疫情而取消。欧洲医学信息学联合会发表了MIE2020的会议记录,但AMIA会议是基因共享的第一次公开展示。
CHUV已经写了一份技术报告,仅可根据要求获得,目前的原型版本的基因共享超出了MIE论文。
在瑞士洛桑联邦理工学院攻读博士学位期间,Raisaro首次提出了基因共享的概念。vwin德赢ac米兰合作他在2018年的报告中描述了这项技vwin德赢ac米兰合作术的博士论文并在加入CHUV后将这个想法变成了原型。
Raisaro说,他的团队对该技术进行了概念验证试验,约有30名患者参与了CHUV的生物库。vwin德赢ac米兰合作研究人员试图评估人们对基因组隐私问题的认识、基因共享系统的可用性,以及人们对它是否对决策有用的看法。他说,测试小组规模太小,无法从中得出任何重要的见解。
更详细的GenoShare试点正在进行中,但这要等到Raisaro和他的同事完成MIE手稿的更详细版本,并于2021年初提交给一份期刊时才能实现。根据Raisaro的说法,在明年上半年进行试点后,CHUV计划向开源社区发布程序代码。
他将GenoShare称为“模块化框架”,可以模拟对患者基因组数据的各种类型的攻击。
Rosairo说:“人们对共享基因组数据有点担心了。“我们的想法是建立一个框架,以便对所有这些风险进行系统推理。”
这样的担忧源于一个问题2008年的论文在公共科学图书馆遗传学来自转化基因组学研究所和加州大学洛杉矶分校的研究,表明在全基因组关联研究中,即使是微量的DNA,也可以很容易地识别出个体,据Raisaro说。
Raisaro指出,这项研究导致美国国立卫生研究院(US National Institutes of Health)控制对许多组聚合基因组数据的访问,并催生了基因隐私专家的社区,他们开发了“推断攻击”,展示了潜在恶意行为者可能如何利用基因组标识符。
他说:“我的泄露会导致泄露给我的家人。”“在基因组本身中,有敏感的信息,因为你可以推断出疾病的易感性和侮辱性特征。”
例如,根据手稿,基因共享公司确定,一个患者选择透露一组400个与精神分裂症相关的基因变异,“带来了几乎100%的风险,泄露了她双相情感障碍易感性的价值,以及她参加了一个少于50人的研究,以及60%的风险,泄露了她与一个可能被对手知道的一级亲属的亲属关系。”
Raisaro说,医院作为它所进行的研究的“可信数据保管人”。GenoShare只是帮助人们理解同意参与试验对隐私的影响,无论医院是否进行试验。
Raisaro解释说,有两种类型的攻击者简介:一种是假设一个坏行为者只拥有公开可用的信息,另一种是“最坏的情况”,即攻击者知道测试对象的亲属的基因组。
GenoShare技术框架有vwin德赢ac米兰合作三个基本组件:攻击模拟、风险评分和基于个人隐私偏好的发布或保留所请求数据的建议。该软件生成可视化图形,向消费者表示风险。
模拟考虑了所要求的遗传信息、先前可用的数据和敌对玩家所拥有的背景知识。对抗性知识可以包括家庭关系、基因型-表型相关性、来自其他研究的总结数据和基于人群的等位基因频率。
确定攻击风险的指标包括第三方在数据处理方面的声誉、各种潜在攻击者的概况,以及为特定用途需要共享的DNA序列的部分。该软件模拟恶意攻击和入侵,并输出一个从0到100的范围内的隐私风险评分。
个人在这个范围内为他们愿意接受的披露数据的风险设定阈值,如果特定风险超过阈值,GenoShare就会发出警报。然后,个人可以根据基因共享的建议自由选择是否参加研究。
CHUV通过测试基因共享算法对基因组进行初步模拟1000基因组计划联盟数据库。Raisaro说,他打算在即将进行的试点中坚持使用公共数据库,但他希望该软件能够对任何类型的基因组数据集进行准确的风险评估。
他说,1000基因组计划的数据有助于建立潜在对手的档案。Raisaro解释说:“对手可以访问所有公开的数据,所以GenoShare必须考虑这些数据进行推断攻击。”
就目前来看,GenoShare是一款基于网络的应用程序,针对桌面和移动设备进行了优化。Raisaro表示,他正在考虑未来的几种部署方式,包括通过应用程序编程接口将其嵌入23andMe和Ancestry等直接面向消费者的商业基因检测平台。两家公司目前都没有参与开发。
根据Raisaro的说法,在DTC环境中理解同意尤其重要,因为这类公司经常与制药公司共享数据。
“这也可以成为(DTC基因检测)公司用来提高透明度和控制用户的工具,因为现在这是一个是或否的决定。它完全是二元的。无论你是分享还是不分享,”他说。
根据用户对每个研究机会的风险承受能力,GenoShare将允许用户分享他们基因组的特定部分。他说:“这可以加强客户和这类服务提供商之间的信任。”
在他的设想中,GenoShare不是一个DTC应用程序,而是像医院、合同研究机构或测试实验室等中介机构提供给患者的东西。
这一进展与瑞士一项更广泛的健康隐私努力有关个性化健康中的数据保护(DPPH)和国家数据互操作性计划瑞士个性化健康网络.DPPH是一个为期四年、耗资300万瑞士法郎(330万美元)的承诺,旨在解决与共享健康信息有关的隐私和安全问题。
作为这些项目的一部分,CHUV的信息专家还在开发一个联邦的、以隐私为重点的分析平台MedCo,基于同态加密和安全多方计算等加密技术。Raisaro说,他的团队正在几家瑞士大学医院测试这项技术,并希望明年能在全国范围内用vwin德赢ac米兰合作于肿瘤数据。