一种改进隐朴素贝叶斯算法的研究

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:zhangmin6278
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
朴素贝叶斯分类器(NB)由于结构简单,计算高效而被广泛应用,但它不能充分利用属性间的依赖关系,有一定的局限性.因此,隐朴素贝叶斯分类器(HNB)通过为每个属性引入一个隐藏父节点,将各个属性之间的依赖关系都综合其中,使属性间的依赖关系得到了利用.但隐朴素贝叶斯分类器忽略了属性对与该属性的依赖关系,故在此基础上提出一种改进算法--双隐朴素贝叶斯算法(DHNB),使属性对与该属性的依赖关系得到了充分的利用,并提出一种新型的阈值定义法,使得选取的阈值让分类精度与时间复杂度的比值为最大,缓解了算法时间复杂度和分类精度之间的矛盾.然后将改进的算法在UCI数据集上进行仿真试验,结果表明其分类性能优于HNB和NB,该方法具有较好的适用性. Naïve Bayes classifier (NB) has been widely used due to its simple structure and high computational efficiency, but it can not make full use of the dependencies between properties and has some limitations. Therefore, the Hough Bayes classifier (HNB) A hidden parent node is introduced for each attribute, and the dependencies among the attributes are integrated into each other so that the dependencies between the attributes are utilized. However, the hidden naive Bayesian classifier ignores the dependence of attributes on the attribute On this basis, an improved algorithm called Double Hidden Bayes Algorithm (DHNB) is proposed, which makes full use of attribute dependency on this attribute, and proposes a new threshold definition method that makes The threshold value is chosen to maximize the ratio of classification accuracy to time complexity, which alleviates the conflict between algorithm time complexity and classification accuracy.And then, the improved algorithm is simulated on UCI dataset and the results show that the classification performance is better than HNB and NB, the method has good applicability.
其他文献
分布式实时事务调度协议用于实现事务间读写的并发控制,以满足事务的一致性与隔离性要求.本文改进了动态调整时间间隔的乐观并发控制协议,提出了一种分布式实时事务调度协议D
Web文档聚类是web数据挖掘的重要任务之一,针对Web文档向量空间的高维性与数据聚类问题的最优化性质,采用LDA对文档向量空间进行降维,提出运用混合优化算法GA_PSO在此低维空
在Web cache集群中,Web突发请求的频繁出现引发资源供给不足,造成系统性能显著下降.为有效处理Web突发请求,构建了同时使用本地资源和云资源的弹性Web cache集群.在弹性Web c
本设计实现一种动态归并算法,主要应用在对于分布式结构化数据的跨节点跨表实时分页查询的业务场景中.分布式数据库中数据表都会被拆分为若干子表并存储于若干数据节点中,在
利用双线性对提出了一个基于身份的多(Private key generator)PKG广义签密方案.它能满足具有不同域参数的各PKG之间的用户相互之间进行只加密、只签名或签密操作,使得原来不
随着硬件平台的多元化,软件兼容性问题日益突出,二进制翻译技术是解决软件兼容性问题的重要手段.鉴于二进制翻译系统大部分执行时间消耗在后端指令的查找和执行过程中,高效的
随着无线传感器和射频芯片等物联网应用的广泛兴起,相应的信息安全问题也得到更多的重视.由于具有低功耗的特性,轻量级分组密码算法在资源受限环境下的应用前景得到广泛关注.
针对昂贵单目标约束优化中真实模型计算费时且现有算法收敛速度慢的问题,提出了动态Kriging优化算法以提高计算效率.该算法首先将所有约束条件转换为一个约束函数,然后采用拉
多模式匹配是串处理系统中最重要的操作之一,而Wu-Manber算法是多模式串匹配算法中平均性能表现最好的算法.针对Wu-Manber多模式匹配算法在规则集中存在短模式串时性能下降的
针对嵌入式片上多处理器MPSoC(multiple processor system on chip)平台下任务并行化分配的问题,从理论上对任务调度进行了建模,针对模型中的任务间依赖问题,给出了层次任务