【摘 要】
:
关联规则挖掘是数据挖掘领域中一个重要研究方向,频繁模式挖掘是关联规则、时序模式挖掘等应用中的关键技术和步骤,而数据流频繁模式挖掘又是当前频繁模式挖掘的一个热点问题
论文部分内容阅读
关联规则挖掘是数据挖掘领域中一个重要研究方向,频繁模式挖掘是关联规则、时序模式挖掘等应用中的关键技术和步骤,而数据流频繁模式挖掘又是当前频繁模式挖掘的一个热点问题。然而,由于挖掘频繁模式内在的计算复杂性,为了提高挖掘效率,业界提出了最大频繁模式挖掘问题。最大频繁模式隐含了所有的频繁模式,同时,在规模上,最大频繁模式小于频繁模式,并且在某些数据挖掘应用中仅需挖掘出最大频繁模式。在现实情况下,由于一些数据流的流动速度是非恒定的,因此如何达到对非恒定流速的数据流进行挖掘是一个值得研究的问题;再有,使挖掘结果更好的体现新事务,而降低早到达的旧事务对整个挖掘结果的影响也是业界关心的一个热点问题。因此,对这些问题进行研究具有重要意义。本文主要研究了数据流挖掘中的相关问题,主要包括以下内容:(1)提出了一个基于数据流的最大频繁模式挖掘算法BFPM-Stream。该算法采用事务和时间相结合的滑动窗口方法来解决数据流的流速不确定性问题,同时利用位对象数据表示方法和位频繁模式树BFP-Tree等对数据进行存储和处理。实验结果验证了BFPM-Stream算法的有效性。(2)提出了一个基于事务衰减的数据流最大频繁模式挖掘算法BFPMW-Stream。该算法采用事务滑动窗口,并利用位对象数据表示方法、位频繁模式树BFP-Tree和存储模式树P-Tree等对数据进行存储和处理,从而针对数据流中的新旧事务的不同作用挖掘出最大频繁模式。实验结果验证了BFPMW-Stream算法的有效性。
其他文献
随着移动计算和移动智能终端的迅速发展,移动网络数据库作为一种新型数据库系统得到广泛应用。但是,由于其所处的无线网络端端延迟大、带宽有限,影响了移动网络数据库的访问
序列图像超分辨率重建是指利用已有的低分辨率(Low Resolution,LR)图像序列中的冗余信息融合成一幅对应的高分辨率(High Resolution,HR)图像的技术。这项技术可以克服成像系
当计算机的应用渗透到社会各领域,信息系统的安全,特别是数据库的安全,至关重要。对数据库进行加密是在非可信环境下保护数据安全的一种有效方法。然而在多数情况下,现有的数
旅客伤亡管理系统是一个基于B/S (Browser/Server,浏览器/服务器)的Web应用系统。随着社会的发展,基于B/S架构的Web应用系统规模逐渐增大,系统开发的复杂程度也达到了前所未有
本论文的研究背景是西南交通大学四川省网络通信技术重点实验室进行的有关下一代Internet(NGI)体系结构的研究工作——“单物理层用户数据交换平台体系结构”(SUPA-Single ph
传统的机器翻译模型使用批量学习的方法进行参数优化。随着稀疏特征等概念的提出,批量学习方法已经远远无法满足现有的需要,在线学习技术逐渐进入了人们的视野。一些研究者提
对于多媒体数据而言,数据的真实性显得尤为重要,很多情况下,我们需要对图像的真实性(也称完整性)进行验证。本文对当前基于数字水印的图像认证方法进行了介绍,主要有奇异值分
电容层析成像技术(ECT)和电阻层析成像技术(ERT)是两种新型电成像测量技术,在多相流检测中具有广阔的应用前景。实际多相流既具有介电常数分布特征,也具有电导率分布特征,将
语义知识库是一种结构化数据库,其中存储的是实体及实体间的相互关系,是当前学术界和企业界的研究热点,其在语义搜索、机器问答等实际的应用中有非常重要的意义。然而现语义
现有的工作流引擎在设计上往往与具体的业务领域相关,在实现上通常与具体的业务逻辑存在代码粘连,这样导致引擎的通用性差。研究发现,工作流引擎主要具有两项功能:流程调度功