闭合序列挖掘模型与算法的研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:jsw10000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的日新月异使得各个领域的数据量激增,大型、分布式数据库成为数据存储的主要方式。在此背景下诞生的知识发现和数据挖掘提供了一种新的认识数据、理解数据的智能手段,序列模式挖掘是其中的一个重要研究分支。经典序列模式挖掘算法大都致力于挖掘序列模式全集,降低了空间性能。挖掘闭合序列集合能在保持信息完备性的前提下,比挖掘频繁序列全集更加精简有效。本文着重对此进行了研究,主要研究内容如下:1.已有的闭合序列挖掘算法大多遵循由短到长、自底向上的挖掘模式,当支持度阈值较小或闭合序列较长时,时空性能显著下降。基于上述原因,本文提出InverClos算法,采用最小序列长度约束,实现从最长序列开始由长到短、自顶向下的倒序挖掘闭合序列模式。分析与实验表明,该算法较经典闭合序列挖掘算法CloSpan具有更好的时空性能。2.研究了基于剪枝概念格的闭合序列模式挖掘求解,提出基于同步剪枝概念格的闭合序列挖掘算法。同步剪枝概念格构造算法以属性插入方式动态地构造概念格,在插入属性构造概念格的过程中,依据Apriori性质实现剪枝,得到剪枝概念格。基于剪枝概念格挖掘闭合序列,减少了相应的搜索空间,提高了序列模式挖掘的效率。
其他文献
Apriori算法是数据挖掘中最普遍的关联规则挖掘算法。但是在大型数据库或低阈值的挖掘中则会相当耗费时间,因为Apriori算法在数据挖掘的过程中有两个效率上的缺点,其中一个是需
近年来,能源的过高消耗是我国面临的一个严峻问题,节能措施已经迫在眉睫,利用能耗监控系统,能够科学方便地找到有效的节能措施,从而减少能源不必要的消耗和浪费。高校不仅是培养社
在过去的几十年里,随着计算机技术的进步,数字图像输入输出设备的发展和普及,以及功能强大的图像处理软件的开发,数字图像处理技术已经渗透到各个领域,制造出逼真的篡改图像
移动Ad Hoc网络节点的协作性是指节点参与网络服务的程度。缺乏节点协作性的节点主要表现为没有提供尽力而为的、正确的网络层服务,目前提出的各种移动Ad Hoc网络协议基本上都
系统进化树的研究已经有很长的历史,它在分子进化与系统发育研究中起的作用也越来越大。系统进化树直观的反映出生物进化过程的顺序,有助于我们了解生物进化的历史和进化机制。
随着第三方物流企业在国民经济中的重要性不断加强,物流企业与贸易伙伴间的交互日益密切,如何在他们之间快捷、可靠地交换大量的业务数据,已经成为第三方物流信息化研究中面临的
专家系统是针对实际领域建造的计算机智能系统,用来辅助或代替领域专家解决实际问题。专家系统是人工智能的重要分支,它是人工智能学者从探讨一般思维规律方法走向以专门知识信
制造业是我国经济的支柱产业,信息化是促制造业企业跨越式发展的重要途径。从“十五”开始,我国大力实施制造业信息化工程,在27个省、46个中心城市和2000多家企业全面开展信息化
随着计算机技术的飞速发展,计算机网络及其相关应用也得到了迅猛发展和普及,Intemet作为人们交流信息的方式早已深入到日常生活中。人们对信息的需求不再仅仅局限于文字和图片
XML作为一种可扩展标记语言,自描述性和半结构化的特点使得它非常适用于表达物流元数据的复杂结构。不仅如此,XML的核心作用还体现于数据的交换与共享,利用XML的样式语言来实现