全球研究人员目前正在研究基于 DNA 的存储技术。将数字数据与生物学相结合可以实现两全其美,尽管一些挑战仍在减缓市场和行业的采用。近几年来,使用 DNA 测序的富有远见的解决方案一直被誉为存储领域的未来。生物学似乎在几十亿年前就解决了数据编码问题,因此我们可以从大自然中学到一两件事,同时准备在 2025 年底将世界数字领域扩展到 180 ZB(相当于 1800 亿兆字节)。
以色列研究人员表示,他们已经找到了一种显著改善数据检索过程的方法,这是DNA 存储技术目前面临的最大问题之一。以色列理工学院的一个团队使用经过专门训练的 AI 模型将 DNA 链数据恢复速度提高了 3200 倍。毋庸置疑,这个过程仍然比市场上现有的“现代”存储技术慢得多。
这项 AI 技术被称为 DNAformer,它基于由以色列理工学院研究人员使用合成数据训练的变换器模型。为 DNAformer 提供数据的数据模拟器也是由以色列理工学院创建的。该模型可以从容易出错的副本中重建准确的 DNA 序列,并且由于专门设计用于 DNA 的自定义纠错算法,可以进一步提高数据完整性。
DNAformer 检索数据的速度比之前公布的方法快得多。该人工智能模型读取 100 兆字节的速度比现有最准确的方法快 3200 倍,而且似乎不会丢失数据。准确度也提高了“高达”40%,这可以进一步缩短总检索过程时间。
以色列研究人员在一个 3.1 兆字节的小型数据集上测试了 DNAformer 的功能,该数据集包括一张彩色静态图像、一段 24 秒的音频剪辑、一篇关于 DNA 存储的书面文章以及一些随机数据。后者有助于展示该模型在处理加密甚至压缩的数字数据时的表现。官方研究称,该团队在高噪声条件下实现了每 (DNA) 碱基 1.6 位的“数据速率”,将读取数据所需的时间从几天缩短到仅 10 分钟。
以色列理工学院团队表示,DNAformer 将得到进一步开发,并根据不同的数据存储需求进行量身定制。该技术可以轻松扩展并适应各种场景,其适应性前景光明。研究人员已经在考虑“市场需求”和 DNA 测序的未来改进,以改进他们的人工智能技术。