【摘 要】
:
信息技术的日新月异使得各个领域的数据量激增,大型、分布式数据库成为数据存储的主要方式。在此背景下诞生的知识发现和数据挖掘给人们提供了一种新的认识数据、理解数据的
论文部分内容阅读
信息技术的日新月异使得各个领域的数据量激增,大型、分布式数据库成为数据存储的主要方式。在此背景下诞生的知识发现和数据挖掘给人们提供了一种新的认识数据、理解数据的智能手段,而概念格以它完备的结构和坚实的理论基础成为数据挖掘过程中的主要模型之一。 作为数据挖掘的一种重要模式,关联规则一直受到广泛的关注。本文提出了一种新的基于概念格模型挖掘关联规则的方法。该方法通过构造概念格来发现频繁项集,进而生成关联规则。当前大多数基于频繁项集求解关联规则的挖掘算法不仅需要多次扫描数据库,而且针对经常维护的数据库会增加重复的开销。本文提出的方法仅需一次扫描数据库即可确定最大频繁闭包项集并能够发现所有的频繁项集,节约了大量的I/O开销,提高了算法的时空性能。更为重要的是挖掘过程中构建的概念格是可维护的,利于动态数据库以及多种模式的挖掘。 文章首先讨论了概念格和扩展概念格的构造原理,提出了新的构造算法并给出两种有利于关联规则挖掘的剪枝概念格的构造方法。在此基础上详细描述了基于概念格模型的关联规则的挖掘算法,并以实验证明了算法的正确性和优越性。基于以上研究,文章最后提出了一种分布式挖掘关联规则的体系结构,该结构也能够处理大型数据库的关联规则挖掘,实验验证了算法的正确有效。
其他文献
工程数据库管理系统是建立在工程数据库之上的综合性的软件系统。工程数据库的版本管理和并发控制是工程数据库管理系统的两个关键性技术。工程设计的反复性决定了工程数据库
我国政府近年来加大力度进行电子政务建设并已经取得了一定的成果。威海作为信息产业部“信息化试点城市”及山东省“数字化试点城市”,政府投入大量资金进行电子政务应用系
软件工程在软件开发中起着重要的作用,而软件测试又贯穿了软件工程全过程,软件测试保证了软件质量。 测试是劳动密集型工作,手工测试试图在软件发布前或是在Beta测试中发现尽
信息时代的到来为以Internet为核心的各种网络技术的发展提供了巨大空间,同时各种各样的针对E-Service技术的研究也相继出现。在涌现的众多课题中,围绕为访问Web网站的互联网
多机器人协调与协作是机器人研究领域的一个重要课题,将智能体理论与多机器人研究相结合又是当前研究的一个热点。本文以二维环境中军用水下多机器人的巡逻和围捕任务为应用
随着互连网规模和复杂程度的迅速增长,网络安全的重要性不容忽视。入侵检测系统作为一种能够自动检测计算机系统或网络上入侵行为的系统,成为网络安全的重要组成部分。它是继
网络教育正在中国迅速的成长和发展,有着巨大的市场前景。协同学习系统用于网络教育,包含了普通远程教学的功能并且还具备远程教学不具有的功能,对于提高学习者的兴趣和学习成效
Internet与无线通信网的结合日益紧密,成为互联网发展新的增长点。两者相结合的产物是无线应用协议(WAP),移动互联网必须遵守该协议,相应地,必须建立WAP站点以提供信息服务;配置WA
石油企业所要进行投资的项目,往往具有庞大、复杂、周期长、相关单位多等特点,其经济性受多方面因素的制约,故企业在做出投资决策时存在着风险。这样,项目投资存在着相当多的不确
在智能交通系统中,交通流仿真软件是人们评估交通管控策略、验证交通流理论中新的算法、和培训交通管理人员的有效工具。同时,多智能体系统,作为计算机科学与分布式人工智能领域