论文部分内容阅读
Adleman 1994年在Science上发表的文章“Molecular Computation of Solutions to Combinatorial Problems”,成功地用DNA计算方法求解有向图的Hamilton有向路问题,标志着一个全新的研究领域——DNA计算的随之产生。由于DNA计算机具有的巨并行性、海量存储以及低能耗等特点,该领域的研究引起了众多学者的关注。
在DNA计算中,信息是以DNA序列为载体并通过DNA分子间的特异性杂交来完成信息处理的。十年来的研究表明,编码问题是整个DNA计算机研制中最为核心的问题。①它直接影响着DNA序列的合成质量;②编码的好坏直接影响着能否按照所设计的目标进行杂交;③编码的好坏不仅直接影响解空间的大小,而且与DNA计算机能否深入发展息息相关;④当前DNA计算的一个主要的难点是解的检测问题。随着DNA 计算研究的逐渐深入,编码问题的重要性愈加凸显。因为它在一定程度上决定着DNA 计算模式的未来走向。
由于DNA计算编码问题实质上属于NP问题,目前的编码方法还无法很好地满足特定DNA计算模型的实际要求。根据DNA计算中编码问题的定义,一个好的DNA编码序列应满足①杂交反应的特异性,即确保随后所进行的生化反应为特异性杂交;②产物的可扩增性,即反应产物可进行可控的PCR反应;③解的稳定性和解空间的可检测性,即要求解空间稳定可靠等三个约束条件。所以,一套相对完善的用于DNA计算的编码序列设计方案应综合考虑上述三个约束条件。因此,如何选择高质量的编码来最大限度避免计算过程中假阳性的出现就成为一个非常迫切和重要的问题。
从分子生物学角度看,编码序列的存在形式决定于DNA 序列自身的物理化学属性,而编码序列的热力学属性则是后续生物化学反应的动力源泉。基于此,本文在对DNA计算中编码问题的产生背景和主要研究进展做了简单介绍,并进一步综合分子生物学实验涉及到DNA设计基本原则的基础上,较为系统地研究适用于DNA计算的较短的DNA序列的热力学属性和物理化学属性,探求各约束条件之间的内在联系,对其进行整体优化组合,构建了计算DNA编码序列的通用设计平台,该平台包括:设计标准、设计策略、编码生成软件以及编码序列评价体系等。并以此为指导在生化实验室中用于解决图与优化组合中的某些实际问题。通过解决这些问题,对原编码方案进行了进一步的优化与完善。在此基础上,以重组DNA技术作为技术基础,以DNA计算理论研究中较为成功的,有较好发展前景的粘贴模型作为信息编码工具,提出了一种新的基于粘贴DNA计算模型的数据存储技术的实现方法。
结果显示,本文的编码设计平台便于利用数字计算机进行DNA编码序列的设计与选择,可为可控的DNA计算提供可靠有效的编码序列。