将数字数据存储在DNA中的想法看起来像科幻小说。乍一看,分子可以存储数据似乎并不明显。术语“数据存储”让人联想到像CD和数据中心这样的物理伪像,而不是像DNA这样的微观分子。但是有很多原因可以解释为什么DNA是一种令人兴奋的信息存储选择。
现状
我们正处于数据爆炸之中。我们通过估计的170亿互联网连接设备创建了大量信息:智能手机,汽车,健康追踪器和所有其他设备。随着我们继续向物理设备添加传感器和网络连接,我们将生成越来越多的数据。同样,当我们将目前处于离线状态的42亿人带到网上时,我们将生成越来越多的数据。
我们通常也希望存储数据以用于长期目的。这些时间范围可能超出当前存储技术的能力。例如,我们可能希望存储家庭照片和视频,以便100年后我们的后代可以查看和与之交互。我们可能希望将文物,家庭食谱或技术诀窍传递给后代。
我们当前的数据存储方法正在努力跟上我们对存储功能的需求。数据存储危机将令人难以置信地扼杀人类发展。因此,我们需要针对短期和长期数据存储的新的强大且可持续的解决方案。
在面板SynBioBeta SF 2016使用Intel,Gen9和半导体研究公司代表讨论的DNA数据存储的当前状态。讨论的一个主要内容是长期数据存储市场是数据存储市场中增长最快的部分。此外,所有专家小组成员似乎都认为,对DNA数据存储的需求将主要受到对超越硅基存储系统极限的更好解决方案的需求的驱动。
为什么我们要将数字数据存储在DNA中?
DNA是大自然的信息媒介。事实上,我们称DNA为“生命蓝图”,因为它含有指导细胞制造蛋白质的配方。这些蛋白质可以实现生命的各个方面,从消化到运动,从生长到对抗疾病。
因此,DNA已编码信息 - “生物食谱”,如果你愿意的话。因此,DNA数据存储的想法是重新利用信息存储容量,以便我们可以将我们的数字数据 - 我们的自拍,电影和文档 - 存储在DNA中。要做到这一点,首先必须将数字信息转换为生物信息。
使用DNA的主要原因是:
1.永恒的相关性
:只要地球上有基于DNA的生命,DNA就是相关的。传统的数据存储方法将始终被新技术所取代,因此如果我们使用传统的数据存储,我们将始终需要将数据传输到新的更好的系统。
2.稳定性
:DNA似乎能够承受一定程度的环境压力。2013年,科学家们阅读了来自一个有70年历史的马化石的DNA。这表明基于DNA的存储系统将比硬盘和磁带持续更长时间。
3.高存储容量
:DNA的存储潜力远远超过所有其他媒体。一些专家估计,世界上所有的数据都可以存储在一公斤的DNA中- 这是一个令人难以置信的命题。
我们今天在哪儿?
今年早些时候,微软和华盛顿大学的研究人员打破了将数字数据存储在DNA中的记录。他们使用Twist Bioscience提供的DNA设法存储和检索200兆字节的信息(包括高清视频,多本书籍和文章以及数据库)。
存储200 MB代表了2013年创造的0.74 MB的先前记录的巨大飞跃。这是一个巨大的进步,它突出了更多的兴趣投入到这一努力的事实。然而,目前DNA数据存储的成本并不具吸引力。
在DNA中存储数字数据涉及读取和写入DNA。虽然读取DNA(DNA测序)的价格急剧下降,但编写DNA(DNA合成)的价格目前仍然高得惊人。像Gen 9和Twist Bioscience这样的新公司已经出现了新方法,可以实现更便宜,更快速的DNA合成。
然而,在这方面需要更大的成本降低以加速DNA数据存储。
需要做什么?
为了使DNA数据存储成为商业现实,我们需要:
开发将数字信息转化为生物信息的新的更好的方法;实现快速,准确和经济高效的信息检索的方法。
发明并推进新化学,以实现廉价的DNA合成。
在生产工作流程中加入更多自动化,以降低成本。
打开问题
由于这个领域非常年轻,因此有几个悬而未决的问题尚未得到解答:
1.我们如何设计安全性?
如今,很少会阻止熟练,专注且耐心的黑客访问和窃取机密信息。如果我们要设计一个新的数据存储系统,它应该比当前的范例更安全。我们需要从一开始就认真考虑安全设计。
2.用户界面的外观如何?
新技术的用户界面通常会影响该技术是否会被大量采用。我们如何与DNA数据存储技术进行交互仍然没有答案。将来,我们是否都拥有DNA测序仪,DNA合成仪和算法,可将数字数据转换为我们的手机,家庭或当地社区生物黑客空间中的生物数据?或者这些能力是否仅限于公司?在任何一种情况下,我们与DNA数据存储技术交互的容易程度可能会影响我们采用这种技术的速度。
3.世界将如何收到这个?
今天,关于消费者隐私和生物技术的争论很紧迫。在斯诺登揭露之后,许多人都是偏执狂,我们的数据可以在未经我们许可的情况下访问。此外,许多人普遍对生物技术漠不关心。也许有机会创造一个消费者可以通过DNA存储他们自己的数据而不是使用集中数据中心的世界。
虽然有些人会欢迎从磁存储过渡到DNA数据存储,但其他人可能会对此感到不安,理由是他们对生物技术不信任。考虑到许多人不知道目前存储他们信息的过程,未来的消费者是否应该被告知他们的信息存储在合成DNA中?或者消费者对存储介质漠不关心?
人们对这些问题的回答可能会随着他们在世界上的位置而变化。
4.我们想用DNA存储什么样的信息?
我们希望不那么频繁访问的档案数据,例如我们可能希望传递给未来几代人的消息,或者更频繁访问的数据,例如我们的自拍和Netflix电影?
DNA-for-data-storage场景非常新颖。今年早些时候,Helixworks宣布推出可以在亚马逊上购买的DNA数据存储系统。他们的系统最多可以存储512 kB,根据Helixworks的说法,它足以“存储一张小照片,一首诗,一封情书,一封悼词或一个比特币钱包。”最近有许多团体试图尝试新的解决方案:爱丁堡2016年本科iGEM团队以及目录,是IndieBio在旧金山的第四批生物技术创业公司的新成员。
随着这些团队继续开发他们的技术,我们将开始更清楚地了解他们的实施策略。在此之前,确定预测还为时过早。