【摘 要】
:
随着计算机技术和生物医学的飞速发展,人类对于基因表达和遗传信息的传递有了更高的认识,越来越多的学者开始关注DNA序列中控制基因表达的植入位点发现问题的研究。本文对DNA
论文部分内容阅读
随着计算机技术和生物医学的飞速发展,人类对于基因表达和遗传信息的传递有了更高的认识,越来越多的学者开始关注DNA序列中控制基因表达的植入位点发现问题的研究。本文对DNA序列植入位点和数据挖掘技术等相关理论进行了深入的探讨,充分总结归纳了目前植入位点发现问题研究领域的最新研究成果,并针对高等生物中普遍存在的双植入位点查找问题,设计并实现了基于频繁模式挖掘算法思想的D-Apriori算法。首先,基于对DNA单链中碱基序列具有“近似频繁模式”特性的认识,本文重点分析了结合Apriori算法的下封闭特性和FP-Growth算法的树型压缩结构的Bpriori算法,并将其成功应用于解决双植入位点查找问题中。其次,设计并实现了D-Space算法,实现单植入位点的拼接,从而有效地完成双植入位点的查找工作。将D-Apriori算法分别在人工合成数据集和真实数据集上进行了大量的实验,实验结果表明:D-Apriori算法在保证准确率的前提下,可以查找到所有满足要求的并且模式长度未知的双植入位点结构。本课题的研究成果不仅对于解决DNA中查找双植入位点问题有着良好的性能优势,并且还可以应用到数据挖掘领域中所有关于解决字符串查找问题的研究中。对于进一步描绘和预测生物基因表达提供理论工具,为人类疾病的预防、发现及治疗提供更直接有效的手段,从而更好地促进生物信息学和医学领域的发展。
其他文献
目前,电信网络技术正在飞速发展,整个电信网络的体系结构正在发生深刻变化,以开放性、综合性为主要特征的下一代网络(NGN)已成为电信网发展的必然趋势。在这一发展趋势下,电
纹理分类是模式识别领域中的一个重要的分支,它的目的是识别出具有不同纹理特征的物体的各种表现形式。纹理分类在计算机视觉、图像处理及计算机图形学领域和工程技术方面有
数字家庭这个概念近几年在消费电子领域正在升温,数字家庭生活所引导的新兴行业及消费理念,已经成为以家电行业为代表的相关企业的战略重点。与数字家庭发展相辅相成、密切相
随着现代对互联网需求的日益增长,网络与信息安全逐渐成为Internet及各项网络服务和应用的进一步发展需要解决的关键问题。继防火墙后,入侵检测系统(IDS)近年来得到了迅速的
随着计算机网络对资源共享的有效实现,网络信息安全问题也变得尤为突出。为了保证信息的保密性、完整性、可用性,我们必须对网络认证技术更加重视。认证技术用于防止对系统进
20世纪后半叶,数值计算方法使各个学科获益匪浅。作为海洋科学基础的物理海洋学也不例外,在第一台电子计算机问世不久,海洋数值模拟的工作就开始了,大洋环流、潮波数值模式及环境
由3GPP(第三代合作伙伴计划)组织制定的3G网络核心技术标准IMS(IP多媒体子系统)被认为是实现未来FMC(固定/移动网络融合)的关键技术。对于网络融合的实现,网络间信令的互通是
目前,随着网络技术的迅速发展,特别是随着网络上发布的Web服务数量的急剧增加,面对数量庞大的服务群,如何从海量的Web服务中快速、准确、高效发现满足用户需求的服务已成为亟
随着科技的发展,手机已经成为人们日常生活中必不可少的工具之一,手机的功能和性能也在日益提高,个性化的手机系统软件日益增多。传统的手机软件开发周期较长,开发难度大,可移植性
阈下信道是一种特殊的、有着广阔应用前景的现代信息隐藏技术。由于其隐蔽性好、安全性高等特点近年来引起了国内外学术界和相关部门的重视。阈下信道是在基于公钥密码技术的