基于属性加权的选择性朴素贝叶斯分类研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:zhangdeyu520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯分类属于数据挖掘领域重要的分类方法之一,朴素贝叶斯分类是一种简单的贝叶斯分类方法,与其它分类方法相比,它的优点是简单、高速、分类效果稳定和理论基础坚实,因此也得到了广泛的应用。但是朴素贝叶斯模型假定在给定分类特征条件下属性间是相互独立的,而这个假定在实际应用中往往是不成立的,这就给朴素贝叶斯方法带来了局限性。为此,很多学者试图通过放松属性间的独立性假设来提高朴素贝叶斯分类器的性能,其中属性加权和属性选择是两种比较好的方法。本文正是从属性加权和属性选择两个方面改进朴素贝叶斯分类模型。主要的研究工作包括:(1)从属性加权方面改进朴素贝叶斯分类,详细介绍了属性加权朴素贝叶斯分类的基本原理,深入分析了引入属性权值后对于分类结果的影响,介绍了一种称为相关概率法的确定属性权值的方法,并按照该方法构造了一个加权朴素贝叶斯分类器WNBC。(2)从属性选择方面改进朴素贝叶斯分类,深入分析了两种不同的属性选择方法,分别是属性相关性度量法和包装法。关于属性相关性度量法,介绍了一种基于x~2统计量法的属性选择算法,并按照该方法构造了一个选择性朴素贝叶斯分类器RNBC;关于包装法,研究了包装法选择属性的具体过程,包装法实现时需要注意的各个方面,然后基于包装法构造了一个选择性朴素贝叶斯分类器SNBC。(3)提出将两种方法相结合的进一步改进的NBC模型WRNBC和WRSNBC。WRNBC模型将属性加权和基于属性相关性度量的属性选择方法结合,首先通过x~2统计量法得到最优属性约简子集,然后在该子集上构造加权NBC模型;WRSNBC模型将属性加权和两种不同的属性选择方法结合,首先通x~2统计量法得到最优属性约简子集,然后在该子集上使用加权NBC模型运行包装法进一步对属性进行选择,最后在得到的属性子集上构造加权NBC模型。
其他文献
云影音智能终端是将个人媒体内容与互联网结合起来,使得所有的媒体内容都可以通过高清平板电视观看的一款三网融合的产品。在云影音智能终端中有海量的音视频资源,用户需要高效
压缩感知是作为一种新的采样理论,根据信号的稀疏特性,利用远低于Nyquist采样率来获取信号的离散样本,并能够通过非线性的重构算法无失真地恢复出原信号。压缩感知理论的出现
随着世界范围内人口的膨胀和城市的发展,出现了越来越多人群密集的公共场所。这些场所在提供人们生活便利的同时,也为犯罪活动提供了地点。因此,公共安全是全世界面临的一个刻不
克隆代码进化研究以软件的多个版本为基础,通过克隆代码检测及跟踪来获取克隆代码进化信息。克隆代码进化研究对于了解克隆代码特征,维护和重构克隆代码、评价克隆代码有害性以
随着互联网的高速发展与不断普及,越来越多的敏感信息在互联网第三方站点上存储与共享,例如云存储和云共享。通常情况下,这些敏感信息并不是以加密的形式进行存储,对敏感信息
近年来,无线传感器网络(Wireless Sensor Network,WSN)相关技术取得了巨大的进步,被广泛应用于军事、医疗、环境等领域。然而,由于传感器节点常被部署在开放环境中,而且其资
近年来随着Android操作系统在各种电子移动终端设备中的迅速普及,数字电视机顶盒采用Android操作系统已经成为目前主流的发展趋势。电视机顶盒的人机交互操作主要依靠遥控器上
分级存储的设计初衷是将数据按访问热度的不同存储于不同性能的存储设备上,最大化存储利用率。当数据的热度发生变化时,便将数据迁移至更符合其当前热度值的存储设备上。因此,对
传统的编程技术无法模块化实现系统关注点,导致系统关注点的实现代码横切于多个代码模块中,因此这些关注点被命名为横切关注点。面向方面编程技术可以将这些横切关注点单独实现
多示例学习被认为是继监督学习,无监督学习和强化学习之后的第四类机器学习方法,它的出现为机器学习注入了新的活力,在图像处理、股票市场分析等领域有着广泛的应用前景。本文对