纽约- Catalog DNA正在进入证明阶段,它将成为DNA信息技术的领导者。vwin德赢ac米兰合作
凭借超过1000万美元的新资金和一款可以将1和0转换成a、t、g和c的自动化设备,麻省理工学院(Massachusetts Institute of Technology)正在签署试验项目协议,测试其数据存储技术,该技术提供了比传统计算更大的存储容量,同时具有更低的功耗和更高的可移植性。vwin德赢ac米兰合作
Catalog联合创始人兼首席执行官hyjun Park在接受采访时说:“我们可以在你手里拿着的试管中拥有数百或数千pb的数据。”1pb相当于100万gb。去年,该公司完成了内部概念验证项目,使用原型设备将维基百科的全部内容编码到DNA中。
现在,Catalog正在寻找客户数据的类似成功。Park拒绝透露该公司正在与哪些公司合作,但表示他们来自多个行业,包括石油和天然气、电影和媒体,甚至体育。
这家总部位于波士顿的公司是胚胎dna数据存储领域的领导者,与微软、扭转生物科学Gartner IT行业分vwin德赢ac米兰合作析师尼克•赫德克(Nick Heudecker)表示。无论谁先取得突破,都可能在这个潜在利润丰厚的市场上拥有大量感兴趣的客户。“需求就在那里,只是需要得到满足,”他说。
随着Catalog这样的公司的发展,他们可能会为DNA测序仪创造一个独特的市场,在这个市场上,速度和成本效率比碱基对的准确性更受重视。Park说,Catalog主要使用牛津纳米孔技术公司的仪器,并正在与其他尖端纳米孔技术公司进行谈判,以创建定制的分析仪。vwin德赢ac米兰合作
Catalog成立于2016年,借鉴了Park和联合创始人Nathaniel Roquet在麻省理工学院教授实验室的同事时提出的想法提姆鲁.该公司参与了IndieBio加速器项目,还获得了风险投资公司OS Fund和NEA的资金。
本月早些时候,该公司宣布已完成融资A轮1000万美元由Horizons Ventures领投,Airbus Ventures参与。Park说,该公司有10名全职员工,目前正在招聘更多员工。
一般来说,基于dna的数据存储很有吸引力,因为它维护成本低。Heudecker说:“你可以将数据存储在DNA中,并保存500年左右。”磁带仍然是长期存储的首选技术,它的使用寿命约为10年,占用大量空间。vwin德赢ac米兰合作以这种方式存储的pb级数据将占据整个房间;DNA中存储的pb级数据可以装进一个小盒子里,使其便携。1月,情报高级研究项目活动(IARPA)拨款4800万两组进行基于dna的数据存储。
除了像微软和Twist这样的老牌公司,其他几家公司也在争夺市场份额,包括总部位于爱达荷州博伊西的半导体制造商美光科技和法国的美光科技vwin德赢ac米兰合作DNA脚本.令Catalog与众不同的是它的编码方案,Park说。他说,这些信息不是以DNA“字母”的精确序列存储的,这与数十亿年来生命在DNA中存储信息的方式不同。
Catalog的技术vwin德赢ac米兰合作工作原理更像USB u盘中的固态存储器,电荷存储在预定义的地址,电荷的存在或不存在被解释为比特。帕克说:“我们只是用DNA分子做实验。”
该公司使用预制的合成寡核苷酸——20到30个碱基对的双链线性DNA——并将它们组合成几百个碱基对长的更长的分子。这些分子的序列指定一个位地址,并且在每个池中存在一个复杂的混合物。帕克解释说:“一个分子在那里意味着它是一个1。”“如果你不读回地址,这意味着它是零……你不需要在地址和值之间单独指定。”
到目前为止,该团队已经使用其方案和原型(名为香农)编码了价值14g的维基百科数据,以纪念信息论先驱克劳德·香农。这台l型机器占据了一间14英尺乘12英尺的房间。Catalog首席技术官戴夫·图雷克(Dave Turek)解释说,它使用改进的喷墨打印头,将含有DNA的液滴沉积在聚合物“织带”上,然后将这些液滴聚集在一起。
数据开始进行数字编码,经过几个软件过滤器,最后进入试管,在试管中使用下一代测序技术提取数据。Shannon可以以每秒超过10mb的速度写入数据,一次运行可以存储高达1.6 tb的压缩数据。但香农的未来尚不明朗,图雷克表示,该公司不打算大规模生产并运往客户现场。试点项目还将帮助Catalog确定市场是否更需要产品或服务。
对于读取数据,Catalog主要使用包括PromethIon在内的纳米孔测序仪,因为它需要分析的分子时间比许多短读取Illumina平台直接测序的时间长,而且数据格式可以容忍较低的保真度以获得更高的吞吐量。
Heudecker说,除了提供档案存储外,基于dna的数据还可以嵌入到玻璃或其他材料中,可能是秘密的。DNA可以用来确保真实性或出处,也可以用来编码指令。
一些用例接近于科幻小说。帕克说:“如果我们要把人送上火星,我们要让他们掌握最重要的知识。”“发送这么多信息的唯一方法是DNA之类的东西。从另一个方向看,太空探测器可以收集大量信息并将其发回地球。
但Catalog的未来并不局限于最后的前沿领域。该公司计划利用酶和分子过程对存储在DNA中的数据进行计算。
Heudecker说,这是“量子计算的另一端,量子计算非常复杂,但只能在少量数据上完成。”他说,可以执行的操作的复杂性“将低于传统或量子计算选项,但数据量和(低)功耗使其在各种用例中更具竞争力”。
如果你想在大量数据上执行相同的操作,基于dna的计算可能是唯一的方法。数据集中的模式匹配或在大量非结构化数据上搜索是这种技术的两个潜在用例。vwin德赢ac米兰合作基于dna的计算机功耗低,这可能会吸引开发机器学习算法的人,因为需要大量数据来训练模型。
Park说Catalog已经在创建一种工作的基于dna的计算架构的路上,已经证明它可以进行随机访问内存和复制数据。
Heudecker说,基于DNA的数据存储仍然需要在写入和读取步骤上进行改进,并指出DNA合成的进展还没有看到测序仪所取得的相同飞跃。但他预计这一领域将在未来10年取得进展,两到三年内就会出现商业上可行的基于dna的数据存储解决方案。他说:“我们可能还需要10年时间才能实现商业化的DNA计算,那时你也可以处理这些数据。”