基于特征加权最小最大概率机的分类判别研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户:mutaozhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的飞跃,数据已经成为现代社会中的各个领域和各种行业的重要生产因素。采用数据驱动的方法,对收集到的某个问题的数据集进行分类判别,可以有效处理这些数据,挖掘其潜在的信息。传统的分类判别方法需要提前假设研究问题的数据集服从高斯分布,而在实际生活中这往往是没法得到满足的。本文采用最小最大概率机(MPM)解决该问题,并针对该方法的不足提出改进办法。原始的最小最大概率机用到了样本的所有特征来计算目标函数,并没有考虑到样本特征的重要度对最终分类结果的影响,即并不是所有的样本特征都与最终的分类结果强相关。因此,本文使用三种特征加权方法来度量研究的数据集中各个特征的重要度,计算出特征权重矩阵。然后将特征矩阵与原始最小最大概率机进行结合,建立特征加权最小最大概率机模型来进行分类判别研究。为了考察我们提出的方法的有效性,本文使用原始的最小最大概率机,三种特征加权最小最大概率机(FWMPM),以及传统分类判别分析中的k近邻,朴素贝叶斯,Logistic回归,支持向量机,决策树八种方法,在“威斯康星乳腺癌诊断”(Breast Cancer Wisconsin Diagnostic)数据集上进行实证分析。通过对比这八种方法的分类结果准确度,我们发现基于信息增益法的FWMPM的平均准确度最高,达到了97.2%,可以得出:本文提出的特征加权最小最大概率机方法在特定的数据集上取得了一定的效果,该方法针对现实生活中的数据集,有一定的适用性。
其他文献
近年来,知识图谱成为知识表示的重要方式。一个由主谓宾形成的三元组是知识图谱的基本构成单元。将主语和宾语作为带标签的节点、将谓语作为带标签的有向边,则可以将一组三元
随着信息技术的飞速发展,复杂系统的大量涌现,网络科学作为一门新生学科也得到了快速发展。链路预测作为该领域中的一个重要课题,可以根据已有网络拓扑结构等信息,来发现网络
随着微电子工业的不断发展,电路板热流密度不断上升,现有的导热、散热材料已跟不上电子行业的发展脚步,电子元器件的热管理成为研究热点。由于金属基、陶瓷基、碳基导热材料
学术研究是研究型大学肩负的一项重要使命,学术治理是研究型大学治理的一项重要内容。随着科学研究水平的不断提高,研究型大学在发展过程中面临的竞争日益激烈,因此,完善大学
热电器件可以将人体产生的热量转化为电能,为可穿戴的健康检测设备提供电能支持。然而现有的技术方案在单位面积的输出功率和柔性方面仍有很多不足,本文旨在通过电极设计,协
无人机市场近几年发展势头迅猛。以大疆为首的中国高新科技企业更是抢占了国际上绝大部分的民用无人机产品市场。除了军事用途外,以无人机作为基站或者通信中继正在成为未来
经过过去几十年的研究,聚合函数已经在许多实际问题中获得了广泛的应用,无论是在应用数学还是计算科学,或者是社会学研究方面,聚合函数都是十分重要的分析和计算工具。本文中
女子学院是美国女子高等教育重要的组成部分,其产生于19世纪30年代,一度成为美国女性接受高等教育的唯一途径。经过一百八十余年的发展,在男女合校教育成为主流的今天,美国女
由于现阶段大多数人脸识别系统没有配备活体检测功能模块,无法识别出人脸的真实性,人脸识别系统的安全性近期备受人们的关注。尤其是在现在这个信息爆炸的时代,用户人脸的信
众所周知,写作不仅是人与人之间相互交流和学习的一项重要工具,更是人们的一种书面表达的能力和信息传递的一种重要方式,在英语教学中起着重要作用。如今随着全球化的进程,书