朴素贝叶斯分类器及改进分类效果的若干方法的探讨

来源 :中山大学 | 被引量 : 0次 | 上传用户:omine001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
朴素贝叶斯分类方法是简单的贝叶斯分类方法,在众多分类方法和理论中,朴素贝叶斯由于计算高效、精确度高,并具有坚实的理论基础而得到了广泛应用。朴素贝叶斯方法要求属性取离散值,并假定在给定分类特征条件下属性值之间是相互独立的,同时认为每个条件属性对分类特征的重要性是相同的。但是这在真实数据中不一定成立,此为朴素贝叶斯方法的局限性。 本文详细介绍了贝叶斯理论、贝叶斯分类器模型,详细阐述朴素贝叶斯分类器模型的优点和局限性,针对局限性,详细介绍常用的连续属性离散化方法,阐述它们各自的优缺点。在连续属性离散化、学习属性权重这两方面提出了改进朴素贝叶斯分类效果的两个方法:进一步改进的基于熵的连续性属性离散化方法、N—Boost—加权朴素贝叶斯算法。最后,通过实验验证了本文提出的两点改进可提高朴素贝叶斯分类器的分类准确性。 本文在离散化时将连续属性分为5类,但是将连续属性划分为多少类最佳有必要进行进一步的讨论;同时,本文的N—Boost算法在调整权重时使用的函数是否最优,这一问题也值得进一步探讨。
其他文献
复杂网络在社会、经济、生物、科技等领域有着重要的应用。可以说网络与人们的生活有着密切的关系,例如社会网络,技术网络,合作网络,生物网络。可以说网络无所不在。科研工作者们
本文研究的是一维空间中单极量子流体力学模型的解的存在性以及一些相关的性质.该模型是关于粒子浓度和电流密度的连续方程,关于电势的Poisson方程的耦合方程组,其中含有三阶量
本文研究了保等价部分变换半群的变种半群上的正则性及格林关系,给出由部分变换半群的一个子集合生成给定子半群的充要条件和保等价变换半群的变种半群若干结果,本文共分三章,各
近年来,高阶Courant结构已经成为泊松几何与数学物理两大学科中比较热门的研究课题,它的理论研究和实际应用都具有非常重要的意义。在Nambu-Poisson流形和Jacobi代数的研究中,经
信赖域方法是求解非线性优化问题的有效迭代方法.它在理论上具有非常好的收敛性,在计算上有很好的效果.二维子空间技术就是在二维空间中搜索方向或求解候选位移,这样既能降低
学位
随着信息科学技术的迅速发展,日常生活中产生了大量的图像数据。如何对这些数据加以分类,并有效利用,成为了机器学习中的重要问题。图像聚类的目的就是根据图像的内容特征或
组合数学是数学一个很重要的研究领域,随着计算机科学的迅速发展,组合数学的重要性也日益显现.而图论和组合矩阵为组合数学中非常重要的研究内容.  本论文主要研究了一类本
确定型变分不等式问题(VariationalInequalityProblem)最初出现在数理方程中。1964年Lions.JL与TampacchiaGS等学者首先建立了初期变分不等式(VIP)理论,随着变分不等式理论和
现实中的许多科学问题往往需要大规模计算,并且需要极高的精度.这就要求我们能够设计出新的更有效的算法来解决这些问题.随着并行计算机的出现,并行计算成为解决这类问题的一
近年来,人们主要应用二次Lyapunov函数研究Takagi-Sugeno(T-S)模糊系统。但是,由于二次Lyapunov函数只含有一个正定矩阵,在多数情况下,单个正定矩阵无法同时满足模型所有的子系统,因