基于多序列的序列模式挖掘算法的研究和应用

来源 :广西大学 | 被引量 : 0次 | 上传用户:lin0929
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从存放在数据库、数据仓库或其他信息库中的大量数据中发现有趣知识的过程,是涉及人工智能和数据库等学科的一个相当活跃的研究领域。序列模式发现是其中一个重要的研究方向。   序列数据库由记录带有或不带有具体时间概念的有序元素或事件的序列组成。序列模式挖掘就是在序列数据库中发现频繁发生的有序事件或者子序列模式。序列模式挖掘有着广阔的应用前景,例如交易数据库中的客户行为分析、Web日志分析、文本分析、DNA分析和自然灾害预测等等。   现实世界中的事物是相互联系的,挖掘基于多序列的序列模式能够更好地反映现实世界中事物的关联。本文在传统的序列模式挖掘基础上,通过改进实现了多序列模式的挖掘。首先,对传统的序列模式概念进行扩充,提出了多序列模式概念(Multiple Sequential patterns)以及基于多序列约束的优化和剪枝技术。其次,在Prefix Span算法的基础上实现了多序列模式的挖掘算法(MS_PrefixSpan);在CloSpan算法的基础上实现了闭合多序列模式的挖掘算法(CMS_CloSpan)。最后,将闭合多序列模式挖掘算法应用到实际数据分析中。   实验结果表明,本文提出的多序列模式挖掘算法能够准确高效地挖掘出多序列模式,并在实际数据分析中挖掘出了较有实用意义的模式。
其他文献
随着Web服务技术的发展,越来越多的服务提供方以Web服务形式提供服务,当单个简单Web服务无法满足需求时,需要组合多个Web服务来完成,在组合过程中如何高效准确组合现有服务成
移动增值业务结合了互联网与移动通信的技术优势,在满足人们随时随地获取信息需求的同时,还可以提供除语音业务外的多媒体业务、交互式数据业务、电子商务等其它丰富的业务应
程序验证用逻辑证明的方法证明程序满足其规范,是实现安全性的重要方法。出具证明编译器(Certifying Compiler)是编译器与验证器的结合。本文描述的出具证明编译器项目CComp让
分类问题是模式识别的核心研究内容,其目的是通过对己知标签数据集的学习设计一个分类器,然后用该分类器来预测新样本的标签。按照样本所属标签个数,分类问题可以分为单标签
网格技术的提出为互联网络中资源共享、大规模计算应用的解决提供了很好的支撑平台,但是网格环境本身固有的动态性、异构性等特点,又给网格作业的调度带来了不小的难度,因而
XML作为新一代的数据交换标准,在网络上的应用越来越多,由此也产生了大量的XML数据。如何对XML数据进行有效的查询处理成为现在研究的热点。而XML作为半结构化数据具有自定义
计算机在不同行业的广泛使用,需要大量的软件作为支撑,越来越多的软件企业发现按照传统的一次开发一个软件的方式已经不能满足需求,它们需要提高软件开发的效率,而基于生产线
进化非选择算法是基于生物免疫进化机制和免疫非选择机制而提出的,其已被应用于异常检测问题。本文主要对进化非选择算法用于异常检测时的平均时间复杂度进行分析;并从理论上
高光谱遥感数据凭借非常高的光谱分辨率,在地物分类方面存在巨大的潜力,从而在矿藏勘探,环境保护等诸多领域得到了广泛的应用。近年来,随着高光谱分类算法研究的不断深入,融合了空间特征的分类模型成为学者们研究的热点领域。而以往的许多研究忽视了空间特征的重要作用,以及很少对多种特征的融合策略进行研究。基于这种现状,本文主要对多种特征在不同的层面的融合方式进行研究,主要内容如下:第一,从高光谱遥感数据的构成、
在计算机网络技术快速发展的今天,网络安全越来越受到人们的重视,非法外联监控系统是解决网络安全问题的有效手段。在一些保密级别较高的内部网络中,网络管理人员往往在内部