基于Huffman编码的DNA信息存储方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:hdc988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字化社会的不断发展,日益增长的海量数据在推动文明进步、方便人们生活的同时也带来了巨大的存储负担。在过去的二十年中,世界各地的科学家致力于寻找具有更高存储密度、更长存储期限的数据存储解决方案。作为生物遗传信息的优良载体,脱氧核糖核酸(Deoxyribonucleic acid,DNA)在信息存储方面具备种种远超磁盘存储的优异性能。因此研究者们对利用DNA作为信息存储介质实现高密度、低功耗、长期稳定的数字信息存储有着浓厚兴趣,DNA信息存储技术前景广阔。DNA用作数字信息存储,就是要建立存储内容与DNA分子碱基序列的映射关系,合成相应的DNA分子,从而完成存储内容的写入。DNA测序技术可以通过读取DNA分子的碱基序列进行存储内容的恢复。目前DNA信息存储技术的信息存储密度与DNA分子本身的信息存储潜力尚有差距,研究如何提高DNA信息存储密度对于降低成本、提升效能具有重要意义。同时,设计相应的纠错算法以减少在DNA序列的合成、复制、测序过程中引入的错误,也是重要的研究方向。针对信息存储密度的提升,本文主要工作如下:1)提出了一种引入熵编码的DNA信息存储编码方案,该方案通过四进制哈夫曼DNA编码建立存储内容与DNA碱基序列的映照关系。该模型有着高于当下国内外方案的存储密度,适用于图片、音频、文本等格式的文件。2)在方案中引入汉明纠错码完成纠错检错功能,并结合DNA信息存储的实际特点对汉明码进行了四进制改进。通过在碱基序列中插入相应的纠错位,纠正存储与读取过程中发生的序列错误,该方案可以在尽可能引入较低冗余的前提下实现纠错,降低信息存储的错误率。3)设计了可视化界面,实现存储内容到数据流,数据流到碱基序列的相互转换,以分别实现存储内容的存储写入与读取恢复。4)进行了本文所提出DNA信息存储方案包括生物实验在内的全流程实现,将两份文本文档和一张图片存储到了生物合成的DNA分子中,存储文件大小为5.2KB,合成短链DNA共8条,共计3614位碱基。通过DNA测序技术读取了一份备份的碱基序列,进而成功解码恢复了存储内容。
其他文献
黄萎病作为棉花生产上一种危害严重的土传真菌病害,在世界范围内造成了严重的经济损失。根际微生物与黄萎病的发生存在密切的联系。本文在两块棉田分别选取中植棉2号和鲁棉研
主要针对《计算机网络技术》课程在职业院校实际教学中存在的问题进行了分析和探讨,结合教学实际,提出一些具体措施。
山水画是中国绘画体系中重要的组成部分,它是以描绘自然山水的为主的特殊绘画形式,近代中国美术的大变革,很多国内山水画艺术家借鉴西方绚丽多彩的画面色彩效果,试图寻找西方
自融合教育理念引入国内,我国将随班就读作为主要的实施模式,然而现有随班就读的实施情况与融合教育理想仍存在距离。在如今随班就读儿童人数逐渐增多、障碍类型趋向多元化的
基于曲线映射理论,阐述谐波齿轮传动非干涉且大范围啮合齿形的设计方法。先根据柔轮中线上点的运动轨迹,确定近似齿形;然后考虑柔轮齿倾斜和运动轨迹改变的情况,对近似齿形进
近年来,随着信息技术的快速发展,众多具有战略性的新兴产业应运而生,逐步发展成为潜力巨大的战略需求产业,而数字动漫与影视产业正在其中。数字动漫影视产业是互联网信息技术与人文艺术内容相结合的创新驱动发展产业,其真实感渲染技术在影视特效领域中发挥着极其重要的作用。现如今,文化创意产业对影像的呈现精度和质量的需求越来越高,其大规模计算任务和数据存储需求是真实感渲染与视觉特效仿真方面应探究的内容。本文针对国