基于朴素贝叶斯的分类方法研究

被引量 : 0次 | 上传用户:babyleah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是数据挖掘中的一个重要研究课题。它的目标是构造一个分类器,对由属性集描述的实例指定最适合的类标签。许多分类方法和技术用于构造分类模型,其中贝叶斯方法由于具有坚实的数学理论基础以及综合先验信息和数据样本信息的能力,使其成为当前数据挖掘的研究热点之一。基于贝叶斯理论的分类,主要由两个分支构成,一个是朴素贝叶斯分类器,另一个方向是贝叶斯网络。 由于算法简单性和计算的有效性,朴素贝叶斯分类器在分类方法当中一直是研究的重点。传统的朴素贝叶斯分类器有着很强的假设,即假设各个属性之间是相互独立的。但是现实当中并非如此,这在一定程度上影响了分类器的分类性能。 本文通过对几种贝叶斯分类模型的学习,分析了各自的特点,为了充分利用朴素贝叶斯模型(NBC)的优势及其在分类中的分类效果,就其严格的独立性假设的限制,提出一些改进,取得了比较好的分类效果。 第一章 绪论 主要概述了数据挖掘和知识发现相关概念,包括数据挖掘的挖掘过程,数据挖掘的功能,介绍了数据挖掘及其研究对象的发展现状和未来趋势,详细阐述了数据挖掘中分类问题的定义、方法以及分类模型评价的标准等。 第二章 本章主要对基于贝叶斯技术的分类问题做了概述性介绍:首先介绍了贝叶斯理论的基本知识。接下来主要介绍了几种贝叶斯分类模型:朴素贝叶斯分类器,贝叶斯网络分类器,增量贝叶斯分类模型等,并对其特点进行分析。目的是从多角度看贝叶斯分类,拓宽思维。 第三章 本章主要介绍Rough集的基本理论。首先介绍了粗糙集合、知识化简、知识的依赖性等基本概念,然后介绍了Rough集在理论与应用方面的研究现状等,接着就粗糙集相关的有效算法进行探讨。 第四章 我们先后比较了几种不同的朴素贝叶斯的扩张模型,探讨了如何更好地改进朴素贝叶斯分类,提出了一种贝叶斯分类模型,试图对由属性的各种组合进行遍历,通过计算,挑选出对其他属性具有很强影响的属性。由于受条件互信息值θ和预先设定强属性的个数D的作用,将会构造出若干个不同结构的分类器。将它们看作是一组基本分类器,依次利用训练集训练每个基本分类器,生
其他文献
价值观直接影响着个体的认知前提、过程、结论和行为方式,进而也就关系着一个国家、一个民族的现状与发展。对教育活动来说更重要的是,课堂教学该如何应对课堂多元价值观冲突?
选相元件是输电线路保护装置中的重要元件,在常规保护装置中为综合重合闸服务,其作用是单相接地短路时,选出故障相来实现单相跳闸,在两相短路、两相接地短路和三相短路时实现三相
白颊长臂猿是中、老、越三国交界地区的特有种,属于国家Ⅰ级重点保护动物。目前我国白颊长臂猿主要分布于西双版纳自然保护区和绿春黄连山自然保护区。北京动物园目前共饲养
赣东北乐华—德兴成矿带大地构造位置隶属于华南中部多期碰撞造山带。之前对该造山带的研究主要集中在其形成机制、超高压变质岩带的形成地球动力学背景等问题,而对于造山带中
目的:通过建立兔HLP模型,观察HLP对血浆tHcy浓度、NF-kB和LOX-1表达的影响及其与AS发病的关系,并探讨中药冠心康对高脂饮食所诱导的HLP和AS粥样化病变的拮抗效应,从而寻求内皮功
针对容量型最小费用流逆问题的可行性及相关优化进行研究,证明了判断容量型最小费用流逆问题是否可行可以在多项式时间内完成.如果容量型最小费用流逆问题不可行,即无论怎样
诚实信用原则是一条古老的民法原则,也是一条重要的民法原则,被人们尊崇为民法的“帝王条款”,是君临民法法域的条款。也是合同法的一个灵魂规则。本文从考察契约概念与诚实信用
遥感影像的处理和分析是一个复杂的系统工程,不同特点的数据具有不同的分析处理理论。高光谱遥感以其丰富的信息保有量,受到很多专业和行业的重视,成为遥感技术发展研究的重
本论文研究的“南来作家”是指1949年前后南来香港的难民作家和左翼作家、60、70年代受文革影响自我放逐到香港的作家以及之后在改革开放潮流中出于各种原因移居到香港的一批
企业价值理论与战略理论是理论界的热点问题,我国目前对企业价值的研究只是着眼于对企业价值评估的模型介绍、运用国外已有模型对我国上市公司进行分析;在对企业价值内涵的理解