【摘 要】
:
在连续值分类问题中,对于基于概率密度估计的朴素贝叶斯分类器而言,往往采用多个正态分布概率密度函数的叠加去拟合连续值属性变量的真实概率密度函数,从而相应的类条件概率计算
论文部分内容阅读
在连续值分类问题中,对于基于概率密度估计的朴素贝叶斯分类器而言,往往采用多个正态分布概率密度函数的叠加去拟合连续值属性变量的真实概率密度函数,从而相应的类条件概率计算也是以多个正态分布概率密度函数值的加和来完成的。当确定新样本的类别标签时,如果新样本与训练集合中某个样本点距离大于某阈值时,那么,此训练样本在确定新样本类别的过程中的作用将会被忽略,即训练样本的信息会被丢失。为了弥补这一缺陷,本文提出了一种基于定邻域概率的朴素贝叶斯分类算法(Fixed Neighborhood Based Native Bayesian Classifier-FNNBC),试图将定积分的概念扩展到每一个正态分布概率密度函数中,即使用积分值的加和,也就是定邻域概率的加和表示类条件概率。在实验部分,我们分别在人工数据集和UCI标准数据集上对FNNBC算法进行了验证,最终的实验结果表明,在人工数据集及大多数UCI标准数据集上,在时间复杂度没有显著增加的前提下,FNNBC算法比现有的处理连续值属性的朴素贝叶斯算法拥有更高的分类正确率。
其他文献
这篇文章主要讨论了在有界区域中,某些变量离散化的波方程的可观性和可控性.其中主要研究了以下两类情形.第一类情形是将方程{ytt-△y-λ/|x|2y=0,(t,x)∈(0,T)×Ωy(t,x)=u,(t,x)
本文一方面探讨了球面散乱数据插值与逼近的若干方法,针对球面多项式逼近与球面基函数(SBFs)逼近分别给出了误差可控性研究,同时考虑了“本性障碍”问题及多尺度逼近算法,通
为研究施用根瘤菌对大豆不同生育时期土壤酶活性及产量的影响,于大豆苗期、盛花期、鼓粒期及成熟期对大豆根际土壤过氧化氢酶、脲酶、蔗糖酶活性进行测定,并于大豆成熟期对大
本文运用成熟的战略分析工具--SWOT分析,分别论述了永置式井下监测与水平井相结合的优势(strength)、劣势(weakness)、机遇(opportunity)和威胁(threat),以期对今后这两大技术的有机结
为了解鸦胆子(Brucea javanica)的化学成分,从鸦胆子果实中分离得到13个已知化合物,经波谱学分析鉴定为:对羟基苯甲醛(1),对羟基苯甲酸(2),3,4-二羟基苯甲酸(3),3,4-二羟基苯
寻找对称来约化微分方程,是求解偏微分方程精确解的重要方法之一,所以,就需要通过研究微分方程更多的对称,来获得方程更多的精确解,本文利用李对称法,研究分析了两个(2+1)维
介绍光学电压传感器的基本原理 ,简要综述国内外共同关注的几类光学电压传感器的技术动向与发展趋势 ,展望光学电压传感器研究的主流方向。
The basic principle of optical
本文主要分为两大部分。第一部分主要提出了BCI-代数可合并部分的概念,讨论了其相关的一些性质,并且利用可合并部分的思想讨论了BCI-代数计数的一些相关问题及方法。第二部分主
时滞现象在控制问题中十分普遍,因而加强对控制系统时滞问题的研究变得非常重要。在加深对时滞控制问题研究的同时,学者们也注意到了时滞系统的稳定性问题。实际工程中由于被控
螺形映射是比星形映射更广泛的映射.本文以多复变数为背景,以双全纯映射中螺形映射为研究对象,从新的角度以一种新的方法研究螺形映射的增长定理及偏差定理,从而进一步完善多