【摘 要】
:
数据挖掘是研究从大量数据中用非平凡的方法发现有用知识的理论与方法.分类作为数据挖掘的一个重要课题,在统计学、机器学习、神经网络和专家系统中得到了广泛的研究.在分类
论文部分内容阅读
数据挖掘是研究从大量数据中用非平凡的方法发现有用知识的理论与方法.分类作为数据挖掘的一个重要课题,在统计学、机器学习、神经网络和专家系统中得到了广泛的研究.在分类方法研究中,利用“属性-值”序偶模式构造分类器是一种重要的技术.其中,基于显现模式构造的分类器在分类特征表现明显的情况下具有较高的分类精度,但对数据特征不明显的数据集合,分类效果却较差.本文首先介绍了分类的相关概念及基本技术,随后详细介绍了显现模式的基本概念及有效的使用边界操作挖掘显现模式的MBD-LLBORDER算法,然后简要分析比较了目前几种基于显现模式的分类方法.最后,本文给出了两个利用显现模式进行分类的算法.一个是基于显现模式分类能力,同时利用贝叶斯网络分类器的稳定性,构造的限制性贝叶斯分类算法.本文提出了一种新的度量显现模式分类能力的方法,该度量方式进一步反映了贝叶斯分类器中属性之间的依赖关系.这种限制性贝叶斯分类器从本质上减弱了朴素贝叶斯分类器的属性条件独立性假设.另一个是基于特殊显现模式的分类算法.利用显现模式分类能力定义了显现模式的分类系数,依据分类系数挖掘新的特殊显现模式,并且利用特殊显现模式来构造分类算法,这个分类算法中主要内容是要对分类系数进行准确度量.为了测试算法的分类性能,在UCI机器学习库中的20个数据集上的实验结果表明,与NB,C4.5,TAN以及CAEP比较分析,本文所提出的算法具有更好的分类效果.
其他文献
自动人脸识别(AFR)技术试图赋予计算机根据人脸特征辨别人类身份的能力,该研究具有重要的科学意义和巨大的应用价值。经过三十多年的发展,AFR技术取得了长足的进步。目前,最
随着计算机技术的广泛应用,人们对电脑文件的安全信息更加注重。对于黑客或者电脑爱好者,如何不动声色的潜入别人的计算机并获取一些有价值的信息,不断的成为了人们的关注焦
在很多实际应用中人们只能得到纸质半调图像,因此需要将半调图像扫描输入计算机后进行逆半调,转化为尽可能逼近原图像的连续色调图像,才能进行各种数字图像处理、分析及再利
现有Internet体系结构存在用户数据传输平台层次结构复杂、传输效率低下以及服务质量难以保证的缺点,而多媒体数据在网络应用数据中的比重越来越大,传统的有线电视网络、电信
近年来,为了满足各种业务需求,网络中出现了大量的Web应用程序。随着网络环境的变化,业务需求的提升,这些Web应用程序的缺陷日益突出,逐渐不再满足于业务需求。它们一般是在不同时
煤炭在中国的能源体系中占有非常重要的地位,而选煤是提高煤炭质量的有效技术手段。为了提高选煤厂的生产质量管理效率,提出了基于Spring的选煤厂质量控制系统。系统采用面向
随着经济全球一体化、Web服务技术的不断进步和IT业界组织联盟的加强,对于敏捷性软件以及跨平台性软件的需求不断增加。在这种状况下,面向服务架构(Service-Oriented Archite
P2P网络是一种对等网络,没有中心节点,每个节点既可提供资源也可以共享资源。P2P网络具有动态性、开放性和匿名性等特点,由于其匿名性,使得一些节点基于自身理性的考虑,只共
单个Web服务因服务粒度小而导致应用范围受限,并不能完全满足实际应用的需求,Web服务组合为解决这一问题提供了可能。由于传统Web服务组合开发方式实现从需求模型到可执行代
软件复用的核心技术是软构件技术,软构件技术中最基本、最重要的一项技术是构件获取技术。现有构件提取方法大多是对UML图抽象后进行构件提取。但总体来说现有的基于逆向工程