研究克服了扩大DNA数据存储的关键障碍

2019年6月3日马特·希普曼

立即发布

阿尔伯特·亚强 ajkeung@ncsu.edu 919.515.8992

詹姆斯·塔克 jtuck@ncsu.edu 919.513.0923

马特·希普曼 matt_shipman@ncsu.edu 919.515.6386

来自北卡罗来纳州立大学的研究人员开发了在基于DNA的信息存储系统中标记和检索数据文件的新技术，解决了广泛采用DNA数据存储技术的两个关键障碍。

“DNA系统之所以吸引人，是因为它们潜在的信息存储密度;该研究论文的共同通讯作者、北卡罗来纳州立大学电气与计算机工程副教授詹姆斯·塔克(James Tuck)说。

“但这里的两个大挑战是，你如何识别包含你要寻找的文件的DNA链?”一旦你确定了这些线，你如何去除它们，使它们可以被阅读——并且这样做而不破坏线?”

”以前的工作已经提出一个系统,附加短,20-monomer长序列称为引物结合的DNA序列存储信息的DNA链的末端,”阿尔伯特·亚强说,共同通讯作者论文的,化学和生物分子工程学助理教授数控状态。“你可以使用一个小的DNA引物，匹配相应的引物结合序列，以确定组成你想要的文件的合适的链。然而，这些结合序列估计只有30,000个可用，不足以用于实际应用。我们想要找到克服这一限制的方法。”

为了解决这些问题，研究人员开发了两种技术，他们称之为DNA富集和嵌套分离，或密集。

研究人员通过使用两个嵌套的引物结合序列来解决文件识别的难题。系统首先识别包含初始粘结剂序列的所有股。然后，它对该链的子集进行第二次“搜索”，以找出那些包含第二结合序列的链。

塔克说:“这使估计的文件名数量从大约3万个增加到大约9亿个。”

一旦确定，文件仍然需要提取。现有的技术使用聚合酶链反应(PCR)来制造大量相关DNA链的副本，然后对整个样本进行测序。因为目标DNA链有很多副本，它们的信号压倒了样本中其他的DNA链，这使得识别目标DNA序列和读取文件成为可能。

“这种技术效率不高，如果你试图从高容量的数据库中检索数据，它也不起作用——系统中有太多的其他DNA，”北卡罗来纳州立大学的博士生凯尔·托梅克(Kyle Tomek)说，他是这篇论文的主要作者之一。

因此，研究人员采取了一种不同的方法来检索数据，将几个小分子标签中的任何一个附加到用于识别目标DNA链的引物上。当引物找到目标DNA时，它使用PCR技术复制相关DNA，并将复制的DNA附着在分子标签上。

研究人员还利用了涂有分子的磁性微珠，这些分子可以与特定的标签结合。这些功能化的微珠“抓取”目标DNA链的标签。然后可以用磁铁将这些微珠取出，并将目标DNA带走。

Keung说:“这个系统使我们能够检索与特定文件相关的DNA链，而不必对每条链做许多拷贝，同时也能在数据库中保存原始DNA链。”

Keung补充道:“我们已经使用样本文件实现了DENSe系统的实验，并证明了它可以用来存储和检索文本和图像文件。”

Tomek说:“这些技术如果同时使用，就为开发具有现代能力和文件访问能力的dna数据存储系统打开了大门。”

塔克说:“接下来的步骤包括扩大规模，用更大的数据库测试DENSe方法。”“最大的挑战是成本。”

纸”,驱动dna信息存储系统的可扩展性发表在杂志上ACS合成生物学．这篇论文的共同主要作者是北卡罗来纳州立大学的博士生凯文·沃克尔(Kevin Volkel)。这篇论文的作者之一是亚历山大·辛普森(Alexander Simpson)，他曾是北卡罗来纳州立大学(NC State)的研究生;奥斯汀·哈斯(Austin Hass)和伊莱恩·因德莫尔(Elaine Indermaur)，他们都是北卡罗来纳州立大学的本科生。

这项研究得到了美国国家科学基金会1650148的支持。

希普曼-

编辑:研究摘要如下。

“驱动dna信息存储系统的可扩展性”

作者: Kyle J. Tomek, Kevin Volkel, Alexander Simpson, Austin G. Hass, Elaine W. Indermaur, James Tuck, and Albert J. Keung, North Carolina State University

发表: 5月22日,ACS合成生物学

DOI: 10.1021 / acssynbio.9b00100

文摘:极高的DNA密度比当前的存储介质具有显著的优势;但是，为了达到实际能力，需要组织和获取信息的新系统。在这里，我们使用化学句柄从复杂的DNA数据库中选择性地提取独特的文件，模拟了5tb的数据，并设计和实现了一个嵌套文件地址系统，将DNA存储系统的理论最大容量提高了五个数阶。这些进步使基于dna的数据存储系统具有现代能力和文件访问能力的发展和未来扩展成为可能。