纽约-数据隐私公司Gretel周二宣布与Illumina公司合作,为医学研究生成人工基因组数据。
据Gretel介绍,这些公司将为研究人员提供统计上准确的、符合GDPR、CCPA和其他隐私法的人工版本的基因组数据集,使用这些数据集将使他们避免机构审查委员会冗长的审批过程。
双方合作的财务和其他细节尚未披露。
这些公司在周二发布的白皮书中写道,合成数据涉及使用人工智能算法“创建敏感数据集的人工版本”。
对于白皮书中描述的一个案例研究,他们合成了一个小鼠基因型数据集,该数据集在全基因组关联研究分析中提供了与真实数据集相似的结果。在基因型和表型数据上训练合成模型的计算成本约为1440美元。
研究人员声称,这项研究证明了在基因组学、诊断学、法医生物学、病毒学和其他相关领域合成数据的新用例的可行性。