无重叠条件模式匹配的在线求解算法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:hellring
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘研究领域中,序列模式挖掘是一个重要的研究分支。序列模式挖掘可以应用于购买模式分析,生物序列特征提取,网络流量分析等等诸多领域,帮助研究者获取潜在的有价值信息。作为序列模式挖掘的基础,序列模式匹配算法对挖掘的效率与质量有着至关重要的影响。序列模式挖掘往往建立在各式各样的条件和约束下,其中无重叠约束下的带间隙模式挖掘拥有更强的表达能力,也对作为挖掘基础的模式匹配算法的性能提出了挑战。无重叠匹配问题指在序列中找到模式的最多出现,且不同的出现中不可用相同模式元素匹配同一序列元素。尽管已有的研究证明了无重叠条件下的带间隙模式匹配是一个多项式时间复杂度问题,并提出了完备的匹配算法,但是这些匹配算法均使用离线方式进行计算,存在空间复杂度高的固有缺陷。为提升挖掘的性能,本文的研究致力于设计一种高效的在线匹配算法。本文的主要工作及研究贡献如下:(1)明确了在线方式计算无重叠约束下模式匹配的定义;(2)提出了一种用于处理在线匹配的数据结构,称为流网树结构;分析了在线方式匹配计算时保证解完备的条件,并依此给出了令匹配计算次数最少的判断机制。基于流网树结构,我们构造了在线求解算法NOSE-Online。为保证算法的空间复杂度仅与模式有关,我们提出了两种剪枝策略,分别利用流网树中最小路径的性质以及节点的可达性进行剪枝,极大降低了算法的内存消耗。(3)进行了大量的对比实验,匹配数的对比验证了NOSE-Online算法的正确性,并从算法运行时间及算法内存消耗两个角度展示了NOSE-Online的高效性。
其他文献
我国人口老龄化问题愈加严重,失能老人问题亟待解决,失能老人的日常生活照料、康复保健等护理和精神慰藉需求越来越强烈。由于我国家庭结构小型化、子女工作忙、人口流动等问
糖类物质作为核酸和蛋白质之外的第三类生物大分子,在信号转导、分子识别及免疫应答等生命过程中发挥着重要功能。糖基化是重要的蛋白质翻译后修饰方式之一,对蛋白质的结构和
研究人员发现复杂网络中有一些具有相同功能或属性的节点,这些节点聚集在一起形成具有特定功能的模块,节点集合称为社团。复杂网络可以划分为若干个社团组成的社团结构,该结
碳纤维增强片材(Carbon fiber Reinforced Plastic,简称CFRP)具有轻质、高强、耐腐蚀性等优点,近年来预应力CFRP加固技术在工程中得到了越来越广泛的应用。经预应力CFRP加固后
根系是边坡植被恢复中植被与土体连接的重要器官,不同植物组合可以提高边坡的稳定性。而目前人工植物配置存在一定的盲目性。为研究不同根系类型组合植物对边坡生态和护坡功能的影响,减少植物配置盲目性,本试验选取了4种不同根系类型(垂直轴根型、水平轴根型、根蘖型和丛生型)植物进行了9种组合设计:高羊茅(Festuca elata)+高羊茅、紫穗槐(Amorpha fruticose)+高羊茅、胡枝子(Lesp
酒泉地区地处“丝绸之路经济带”的关键部位,是中国西北粮仓河西走廊的重要组成部分。作为中国西北重要的粮、油生产基地,其食品安全对于生态与社会的持续稳定发展至关重要。
相比于中国传统的婚姻家庭文化而言,我们近现代以来的继承法制度从清末修律到南京国民政府颁行《中华民国民法》经过了一场天翻地覆的变革演进。晚清变法修律运动的推动,使得相传数千年之久的依赖于中国传统封建社会的中华法系随之不复存在,取而代之的是学习借鉴西方先进国家的法律制度。继承制度随着晚清变法修律运动的推动,在修订最适合于中国民情法则精神的指导之下,《大清民律草案》“继承编”编排体例在形式上虽然力求仿照
以新能源为支点的能源转型是目前我国电力工业控制系统发展的大趋势,随着越来越多的新能源厂站建设和入网,新能源厂站网络安全风险也日益突出。国内外由此造成的电网事故时有发生,造成了重大国民经济损失。目前,新能源厂站尚未形成较为完整的安全防护体系,相关措施也不完善。急需提高新能源厂站网络安全防护技术,维护厂站的网络安全。本文通过分析新能源厂站纵向网络边界存在的安全风险,结合国家提出的安全防护标准以及国内外
炉内燃烧质量的正确评价对锅炉高效运行具有指导意义。火焰可视化和表征技术是深入了解煤粉燃烧的重要研究工具之一,旨在为燃烧调整提供安全保障。本文研究分析了现有火焰监测与燃烧诊断的方法,提出采用深度学习方法对火焰图像进行特征提取,结合人工智能方法实现燃烧状态识别以及燃烧过程监测,准确有效地监测炉膛燃烧状态,保证火电机组运行的安全性和经济性。首先,本文提出了一种新的基于深度学习的方法来识别炉膛燃烧状态——
由于胚胎干细胞的多能性使其在再生和移植医学,建立疾病模型,药物筛选和人类发育生物学领域得到持续的关注和发展。与体细胞类型不同,多能干细胞仅在胚胎发生的最初几天短暂存在,并且没有能够在体内长时间维持多能性的环境,因此实验室中的hPSCs都是依靠细胞培养条件,各种通路信号刺激和合适的培养方法及模式维持hPSCs多能性并促进其分化过程。心脏的形成是一个复杂的过程,包含了细胞的快速特化和分化以及相关基因按