DNA 数据存储使用称为寡核苷酸 (oligos) 的短脱氧核糖核酸 (DNA) 串,它们通常混合在一起,没有特定的物理排序方案。 这种存储介质缺乏专用控制器和组织手段来了解一个介质子组件与另一个介质子组件的接近程度。 DNA 存储与磁带、HDD 和 SSD 等传统介质有很大不同,后者具有固定的结构和控制器,可以从结构化介质读取和写入数据。 DNA 缺乏物理结构,需要采用独特的方法来启动数据检索,这带来了其标准化方面的特殊性。
为了解决这个问题,SNIA DNA Archive Rosetta Stone (DARS) 工作组(DNA 数据存储联盟的一部分)制定了两个规范:“零区”和“一区”,以促进启动 DNA 档案的过程。
零扇区作为起点,为档案阅读器提供所需的最少详细信息,以识别负责合成 DNA 的实体(例如 Dell、Microsoft、Twist Bioscience)以及用于编码第一扇区的 CODEC(例如 Super Codec、Hyper 编解码器,Jimbob 的编解码器)。 零扇区由 70 个碱基组成:前 35 个碱基标识供应商,后 35 个碱基标识编解码器。 扇区零中的信息使得能够访问和解码存储在扇区一中的数据。 SZ 中存储的数据量很小,适合单个寡核苷酸。
第一扇区对此进行了扩展,包括内容描述、文件表以及将数据传输到定序器所需的参数。 该规范确保档案的主体是可访问和可读的,为数据检索铺平了道路。 第一区正好包含 150 个碱基,并将跨越多个寡核苷酸。
DNA 数据存储联盟董事会的 Dave Landsman 表示:“DNA 数据存储联盟的一个主要目标是制定和发布规范和标准,以促进可互操作的 DNA 数据存储生态系统的发展。随着联盟第一个规范的发布,我们在实现这一目标方面迈出了重要的一步。零区和一区现已公开,允许该领域的公司采用和实施。”
DNA 数据存储联盟由 Catalog Technologies, Inc.、Quantum Corporation、Twist Bioscience Corporation 和 Western Digital 领导(尽管我们不确定 Western Digital 的 NAND 还是 HDD 部门负责制定该规范)。 同时,包括微软在内的众多行业巨头也支持DNA数据存储联盟。