【摘 要】
:
分类作为数据挖掘领域中的核心研究内容,在现实生活中有着非常广泛的应用,例如根据病人的临床病症属性判断病人患了什么病。常见的构造分类器的方法有很多,如贝叶斯网络、支
论文部分内容阅读
分类作为数据挖掘领域中的核心研究内容,在现实生活中有着非常广泛的应用,例如根据病人的临床病症属性判断病人患了什么病。常见的构造分类器的方法有很多,如贝叶斯网络、支持向量机、人工神经网络和模糊集等等。而朴素贝叶斯分类算法作为贝叶斯算法家族中的一种经典分类算法,因其结构简单、计算高效的特性得到了广大学者的重视。朴素贝叶斯分类算法基于这样一种假设:在给定类标记时,属性值之间是相互条件独立的。这种假设虽使得其计算简单,但同时也限制了它在许多属性间相关性较强的数据集上的分类表现。因此学者们纷纷从放松它的假设条件入手提出了众多的改进算法,平均单一依赖估计算法和隐朴素贝叶斯算法则是其中的优秀代表。它们不仅极大提高了原算法的分类精确度,而且还在众多不同种类的数据集上均有较好的分类表现。本文以平均单一依赖估计算法和隐朴素贝叶斯算法为基本研究对象,并考虑到在实际应用中数据类型对分类的影响,提出了两个基于属性加权的平均单一依赖估计算法和一个基于属性值加权的隐朴素贝叶斯算法。具体的研究工作如下:(1)通过研究朴素贝叶斯分类算法和平均单一依赖估计算法,分别提出了基于相关系数Tau-y和Lambda-y的属性加权的平均单一依赖估计算法,并通过数值实验验证了两个改进算法的分类性能相较于原始算法有了显著的提高。(2)深入研究朴素贝叶斯分类算法和隐朴素贝叶斯算法,通过整合隐朴素贝叶斯算法在分类器构建过程中使用的相关属性、属性值和类标记的统计信息计算公式,得到一个属性值加权公式,提出基于属性值加权的隐朴素贝叶斯算法,并通过数值实验验证了改进算法的分类性能相较于原始算法有了显著提高。(3)以时间复杂度、分类精确度和AUC值为指标,对比本文提出的三个改进算法的优缺点,提出它们未来的研究方向。(4)将本文提出的三个改进算法应用于喘病中医诊断领域,构建了一整套喘病中医诊断的建模方法,然后通过数值实验对比了改进算法与原始算法的性能,进一步验证了改进算法的有效性。
其他文献
并联机构末端位姿精度是机器人性能的重要指标,直接影响工业大量应用,因此研究如何有效提高并联机构的精度具有重要意义。本文以课题组现有的3-RRR+(S-P)球面并联仿生髋关节样机为研究对象,围绕运动学控制和运动学标定这两方面任务,旨在实现样机实时以较高精度运动。首先,在基于“PC机+UMAC多轴运动控制器”控制模式的样机控制系统环境下,将3-RRR+(S-P)球面并联仿生髋关节的运动学模型嵌入到了U
随着云计算的发展,云存储的应用也越来越普遍,然而由于云服务提供商是半可信的,因此在享受云储存所带来的便利的同时,保障云存储上的数据安全是不可忽视的重要一环。为实现这
随着网络技术的快速发展,互联网用户数量以及用户对业务流量的需求急剧增加。使得网络运营商需要持续扩大网络基础设施的建设,以满足用户对业务流量的需求,这使得网络规模不
随着互联网的迅速发展,在人们的日常生活中,社交网络的重要程度也越来越高。人们通常会注册多个不同的社交网络账号以享受不同的社交网络的功能。用户对齐是指将多个社交网络
高等职业教育作为高等教育的重要组成部分,已经占据高等教育的半壁江山,以培养高职业素养、高技能的复合型人才作为目标。这一目标实现的重要载体是教师的工作积极性和自主创
人类室内活动的密集化和室内上网需求的日益攀升,早已推动了室内无线网络的发展。得益于室内无线网络成熟部署的天然优势,目前基于Wi Fi的室内定位技术具有重要的研究价值。
随着国家“海洋强国”和“一带一路”战略的发展,我国迎来了海洋结构物建设的高潮,特别是在跨海桥梁方面,成果更为显著。与内陆桥梁不同,跨海桥梁所处的海洋环境比较复杂,其下部桩基础往往承受较大的波浪荷载,影响桥梁结构的稳定性。周期性的波浪荷载一方面会直接对桩基础造成损伤,直接造成结构性破坏;另一方面,波浪会对桩基周围的海床响应产生影响,间接危害海洋结构安全。在波浪的传播过程中,会在海床表面施加周期性的波
主观幸福感的研究发展到今天已经成为一个多学科的研究方向,对于主观幸福感的探讨也是多种多样,但国内主要的研究是集中于中东部地区,对于西北地区则缺少相关研究。对于研究
纳米复合金属氧化物由于其独特的结构特性对其性能有较大的影响,本文制备不同摩尔比例的镁铝复合金属氧化物;以葎草为模板成功地制得拥有葎草茎秆状结构的锌铝复合金属氧化物。运用一些表征手段,包括有XRD,SEM,TEM,FTIR,Zeta电位等对样品的形貌结构和物化性能进行分析,并且对样品进行吸附甲基蓝和抑菌实验研究。以不同摩尔比例的硝酸镁,硝酸铝和尿素作为原材料,通过水热法,制备不同摩尔比例的镁铝复合金
面对高温热力耦合、测量空间有限等复杂的测量环境,传统的基于单点变形测量的力学参数识别技术难以实现多种类力学参数的同时测量。近年来,基于全场变形测量的力学参数反演方