【摘 要】
:
数据挖掘是当前计算机学科的一个前沿研究方向.作为一门应用性很强的新兴技术,它存在很多值得研究的地方.如何合理的应用数据挖掘技术,如何针对现实生活中的问题改进数据挖掘
论文部分内容阅读
数据挖掘是当前计算机学科的一个前沿研究方向.作为一门应用性很强的新兴技术,它存在很多值得研究的地方.如何合理的应用数据挖掘技术,如何针对现实生活中的问题改进数据挖掘技术是其中的热点问题.该文尝试从一个新的角度研究数据挖掘中关联规则的优化问题:加强支持度和信任度的定义,使其不用增加新的阈值就可以挖掘出无冗余、无虚假的关联规则.现有的关联规则发现算法基本采用频繁K项目集来生成候选K+1频繁项目集.当交易数据库很大时,计算频繁项目集的时间较长,并且在降低支持度和信任度时,关联规则数目会急剧增加,包含了大量的冗余规则,从而影响到整个算法的效率.同时由于关联规则定义的局限性,使得生成的相当一部分关联规则是虚假的、无意义的.针对这挖掘出来的问题,该文重新给出关联规则的形式定义,提出了一个关联规则生成算法,该算法通过引入反向项目来加强支持度和信任度的定义,并且通过简单冗余规则和严格冗余规则的定义来删除正向规则与反向规则的冗余项,从而从整体上提高了挖掘出来的关联规则的质量.
其他文献
本论文的选题来源于西北工业大学的青年教师基金“基于互联网的知识检索和管理的研究”,它为今后项目的开展提供了技术储备。 信息检索技术总的发展趋势是朝着多功能化、智
论文以货运管理系统IT-FRENS实际项目为背景,开展了大量的工程实践与理论研究工作。通过对框架产品Watool的应用与分析,讨论了基于框架的构件系统开发与应用。结合作者在工程中
高性能计算机(High Performance Computer)或称为超级计算机(Super Computer)一直是世界各国政府关注的一项重要技术.通信环境对高性能计算机并行计算效率的提高起着重要的影
电子商务的发展改变着企业的商业模式。Internet在将企业与客户,供应商以及合作伙伴更紧密的联结起来的同时,也使企业面临着复杂多变的商务环境。企业迫切需要构建一个功能齐
随着社会信息化的不断发展和普及,Internet和无线网络的成熟,新的业务与应用不断涌现。而嵌入式设备与无线通信是目前发展迅速的两种技术。嵌入式设备不仅可以在离线的情况下处
随着计算机网络和多媒体技术的迅猛发展,Internet上的Web应用一直呈现爆炸性增长趋势。目前,Web流量成为Internet上信息传输的主流,并呈指数性增长,因此Internet上的许多热门站点
面向服务的开放网格服务体系结构(OGSA)把网格技术和Web服务技术结合在一起,提供了在分布式环境下对资源共享的能力.在OGSA支持下的虚拟组织中,大量的以有状态的Web服务形式
遗传算法是一种模仿生物自然进化过程的、自适应启发式的全局优化算法。由于在利用遗传算法求解问题时仅需要很少的辅助信息,容易与其它领域的知识相结合,且具有较好的自适应
在科学研究、商业信息处理等许多领域,都要进行高性能计算。作业管理系统是组成高性能计算环境的关键部分,它提供了作业提交、调度、执行及控制的新机制,可以充分利用网络中的各