【摘 要】
:
序列模式挖掘是数据挖掘分支,而序列模式匹配是序列模式挖掘的重要基础。将挖掘方法用于生物序列、顾客购买序列、网络日志的分析,我们可从大数据中获取各种潜在的规律和感兴
论文部分内容阅读
序列模式挖掘是数据挖掘分支,而序列模式匹配是序列模式挖掘的重要基础。将挖掘方法用于生物序列、顾客购买序列、网络日志的分析,我们可从大数据中获取各种潜在的规律和感兴趣的信息。在这些研究中,带有通配符间隙约束的生物序列匹配和挖掘比传统的串匹配方法更具有挑战性,且衍生出诸多种类的条件和约束。有一种方法是建立在无重叠条件基础上的模式匹配,该问题是当给定具有间隙约束的模式串时,在给定的序列中找到满足无重叠约束的最多出现,而无重叠出现是指任何两个出现中不能在相同位置处使用相同字符。因此本文对无重叠约束的严格模式匹配问题进行研究。本文的主要研究内容和相关工作如下:(1)给出了无重叠约束模式匹配的严格形式化定义;(2)理论证明了无重叠约束模式匹配的计算复杂性是P的,即无重叠约束模式匹配是具有多项式时间的确定性算法来求解的判定问题;(3)采用网树结构构造了完备性求解算法NETLAP-Best算法;(4)大量对比性实验验证了NETLAP-Best算法的正确性与有效性。综上,本文不但理论证明了无重叠条件下严格模式匹配问题的计算复杂性为P,而且提出了有效地完备性求解算法NETLAP-Best算法,大量实验不但验证了该算法的完备性,而且验证了其较INSgrow是更为高效的算法。
其他文献
OPC(OLE for Process Control)作为一个重要的工业标准,目的是为工厂底层设备或者控制室数据库中的大量数据源之间的通信提供一种标准的通信机制。它把硬件厂商和应用软件开发
随着中国社会和经济的高速发展和城市化进程的加快,许多城市都开始被交通拥挤和随之而来的环境污染等问题所困扰.与其他机动化交通方式相比,常规公交(通常为公共汽车)具有投
当前在纯净环境下采用朗读方式的语音识别系统识别性能已经达到一个相当高的程度,在这种情况下,语音识别走向实际应用必须解决对噪声环境的鲁棒性问题和对说话人本身的鲁棒性问
在实际系统中,时滞现象是非常普遍的,而时滞的存在会破坏系统的稳定性,影响系统的控制性能,所以对时滞系统的稳定性研究一直是控制界的一个热点问题。对时滞系统稳定性的研究,主要
随着人脸识别技术的发展,光线问题成为制约其发展的主要瓶颈之一.在很多情况下,由于光线变化,主要是方向变化,产生的图像变化要远远大于不同人脸图像的差别.该文以光线为研究
本文首先介绍了本课题的研究背景,全面阐述了当今嵌入式系统的两大核心技术:嵌入式处理器和嵌入式实时操作系统;接着对整个主板做了一个简单的描述,列举了主板的组成模块,以及本论
许多实际动态系统不仅存在随机现象,同时也存在时间滞后现象,对于这类现象无法用常微分方程表示,需要利用具有时滞特性的随机微分方程进行描述,只有这样才能准确表述时滞系统复杂
对于发电企业来说,要把握电力市场的大方向,使本企业适应电力市场环境的变化,重要的是要准确掌握发电成本,实行优化运行,节能降耗.本论文以神经网络理论为基础,主要致力于火