在这个信息爆炸的时代,传统的存储方式已经越来越吃力了,于是,一种新的存储技术——DNA存储应运而生。这种技术利用DNA分子来存储数据,每克DNA可以存储数百艾字节的数据,并且在没有电力的情况下能保存数千年。尤其是在生物医学领域,DNA存储的潜力更是巨大——它不仅能高分辨率地存储图片数据,还能长时间保存,非常适合处理复杂的医学影像和基因组数据。
近日,我国科研人员在DNA存储领域取得新突破,研发了一种全新的DNA存储系统——HELIX,该系统专门用于存储生物医学数据,并成功实现了60MB的时空组学图像的存储与恢复。
这一科研成果由天津大学应用数学中心吴华明教授团队取得,相关论文《使用HELIX进行生物医学图像的DNA数据存储》发表在国际期刊《自然—计算科学》上。
(HELIX系统架构。图源:天津大学新闻网)
HELIX系统的创新之处
1.图像压缩、纠错编码和复原技术详解
天津大学研究团队开发的HELIX系统包含3个核心模块:图像压缩、图像纠错编码和图像复原。针对DNA存储过程中可能出现的碱基错误,HELIX对现有压缩算法进行了优化,大幅增强了系统的容错能力。同时,为了提高图像解码的成功率,团队还引入了深度学习技术,在图像修复过程中显著提升了信息恢复的能力。
2.深度学习在图像修复中的应用
在实际实验中,团队成功将两张60MB的时空组学图像编码为13万条、每条183个碱基的DNA序列,并通过DNA合成与测序技术,成功恢复了图像数据。实验结果表明,HELIX系统非常强大,只需要约5.8倍的测序深度,就能恢复图像的绝大部分信息。
吴华明表示,该研究表明,针对特定数据类型量身定制的DNA存储系统,不仅在存储效率上表现卓越,还在可靠性方面展现出更大的优势,为DNA信息存储技术的广泛应用奠定了坚实的基础。
DNA存储技术的优势与挑战
DNA存储技术凭借其惊人的存储密度和超长的保存寿命,成为应对数据爆炸问题的革命性方案。1克DNA可以容纳215PB的数据(相当于1000万小时的高清视频),理论上一吨DNA就可以存储全球现有的所有数据。而且,在低温干燥条件下,DNA可以稳定保存数千年甚至更久。相比之下,传统的硬盘或磁带只能保存几十年。
然而,这项技术也面临一些挑战。首先是成本高昂,目前合成2MB数据需要约7000美元,读取还需要额外2000美元,商业化成本远超传统介质。其次,读写效率低下,化学合成速度仅为0.1秒/碱基,存储一首MP3需要一个月的时间,测序速度也落后于硬盘几个数量级。此外,合成和测序过程中的错误率也不容忽视,需要依赖纠错编码来保障可靠性。最后,技术标准化缺失,编码规则和存储格式尚未统一,与现有信息系统兼容性不足。
近年来,研究人员在酶促合成和并行写入技术方面取得了重要进展。例如,北大“活字印刷”技术将通量提升至27.5万比特/次。这些技术的突破有望大幅降低成本并提高存储速度,从而推动DNA存储技术向实用化迈进。未来,随着技术的不断进步,DNA存储可能会成为解决数据存储难题的关键技术之一。
新闻来源:新华社
记 者:叶家余
编 辑:卢婷婷
主 编:陈 鑫
总编辑:余师亮
声明:除原创内容及特别说明之外,推送稿件文字及图片均来自网络及各大主流媒体。版权归原作者所有。如认为内容侵权,请联系我们删除。
暂无评论