欧洲核子研究中心大型强子对撞机的实验每年产生1500万千兆字节的数据。这是大量的数字数据,可以刻录在硬盘上,也可以传输到“云端”。纳米综合纳米技术中心桑迪亚国家实验室生物工程师George Bachand正在探索一种更好,更永久的方法来加密和存储敏感数据:DNA。与数字和模拟信息存储相比,DNA更紧凑,更耐用,永不过时。可读DNA是从育空地区发现的60万年前的马遗骸中提取的。
基于磁带和磁盘的数据存储会降级并且可能会过时,需要每十年左右重写一次。基于云或服务器的存储需要大量电力; 2011年,谷歌的服务器农场使用了足够的电力为20万个美国家庭供电。此外,老派的方法需要大量的空间。IBM估计 1000千兆字节的书籍信息会占用7英里的书架。事实上,桑迪亚最近完成了一个15,000平方英尺的建筑,可存储35,000箱非活动记录和档案文件。
“从历史上看,国家实验室和美国政府都有很多高度安全的信息,他们需要长期存储。我认为这是一种潜在的强有力的方式来存储未来的机密信息,以保存它多代,”巴尚先生。“关键是你如何从文本转向DNA,并以安全可靠的方式做到这一点。”
Bachand的灵感来自于将所有莎士比亚的十四行诗记录到250万个碱基对DNA中 - 大约是微小大肠杆菌细菌基因组的一半。使用这种方法,欧洲生物信息学研究所的这个小组理论上可以在一克DNA中存储2.2PB的信息,是国会图书馆印刷材料的200倍。
Sandia和George Bachand配偶的生物工程师Marlene Bachand补充说:“我们正在利用生物成分DNA,并利用其独特的能力以极小的体积编码大量数据,以开发可构建的DNA构建体。用于传输和存储大量加密数据用于安全目的。“
由桑迪亚实验室指导研究和开发计划资助的Bachands项目已成功从绘图板转移到信头纸。该团队使用一个几乎不可破解的加密密钥,编写了由哈里杜鲁门总统写入DNA的历史信件的简略版本。然后,他们制作了DNA,将其发现在桑迪亚信笺上,并将其邮寄到全国各地。在信件的越野之旅后,Bachands能够从纸张中提取DNA,扩增和测序DNA,并在大约24小时内以大约45美元的成本对信息进行解码。
将文本加密为DNA并生成消息
为了实现这种原理验证,第一步是开发软件以生成加密密钥并将文本加密成DNA序列。安德鲁·戈麦斯(Andrew Gomez)在桑迪亚(Sandia)实习期间从事这项工作。他现在是新墨西哥大学科技园区的纳米医学公司Senior Scientific。
DNA由四个不同的碱基组成,通常用它们的单字母缩写表示:A,C,G和T.使用三碱基代码,确切地说生物体如何存储它们的信息,64个不同的字符 - 字母,空格和标点符号 - 可以编码,有冗余空间。
例如,空格占文本文档中字符的平均15%到20%,加密密钥可以指定TAG,TAA和TGA每个代码为“空格”,而GAA和CTC可以编码为“E”。这将减少重复的数量 - 技术上制造和读取DNA的挑战 - 并使蛮力黑客攻击更加困难。
该团队的第一个测试是对180个字符的消息进行编码,大小与推文的大小相同。将消息编码到550个基站很容易; 实际上使DNA很难。
“我们最初的方法非常昂贵,非常耗时并且无法正常工作,”George Bachand说。然而,“有一种新技术出现并且能够采用合成DNA,即所谓的基因块,并将它们拼接到这些人工染色体中。这些变化刚刚发生在过去的几年里,这使它变得漂亮现在可以很容易地在台面上制作这些基因块,并且可以很快地在大规模的生产规模上完成。“
确定潜在的国家安全应用
自从成功编码,制作,读取和解码180个字符的消息和700个字符的杜鲁门字母后,Bachands现在正致力于更长的测试序列。然而,Bachands真正想要做的是超越测试并将他们的技术应用于国家安全问题。
“我们已经实现了原则验证。是的,这是可能的。现在我们面临的最大挑战是确定潜在的应用,”George Bachand说。“使用DNA来存储信息非常酷,这是科幻小说,但真正的问题是它对任何事情都有好处吗?它能真正取代现有技术中的任何技术以及我们未来的发展方向吗?”
该团队已确定的两个可能的应用是存储历史机密文件和条形码/水印机电组件,例如在存储之前在微系统和工程科学应用复合体,Sandia的国防部认证的制造设施中制造的计算机芯片。
George Bachand想象将每个组件的历史编码 - 制造时,批号,起始材料,甚至可靠性测试的结果 - 编码到DNA中并将其发现到实际芯片上。未来的工程师不必在数字或纸质数据库中查找序列号并查找元数据,而是可以擦拭芯片本身,对DNA进行排序,并以实际防篡改的方式获取信息。
为了测试可行性,Marlene Bachand发现实验室设备带有测试信息,即使经过数月的日常使用和日常清洁,也能够恢复和解码信息。发现在电子元件上并存放在阴凉,黑暗环境中的DNA可以恢复数百年。
Bachands的DNA存储方法的另一个更直接的应用是历史或很少访问的机密文件。与基于磁盘或磁带的存储相比,DNA所需的维护要少得多,并且不需要大量电力或大量空间,如基于云或纸张的存储。但将纸质文件转换为DNA需要“麻烦”的扫描,加密,然后合成DNA的过程,承认乔治·巴尚。制造DNA是该过程中最昂贵的部分,但成本在过去几年中大幅下降,并且应该继续下降。
“我希望这个项目的进展和扩展桑迪亚项目的生物范围和性质。我相信仿生学领域没有界限。考虑到加密和数据泄露破坏的所有问题,这项技术可能提供一条解决途径这些及时且不断增加的安全问题,“Marlene Bachand说。