数据分类器及其实现的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:dongdongthere
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要是针对数据挖掘中的分类算法进行研究。在分析已有算法的基础上,提出了自己的改进算法,并且利用实验对算法的性能进行了分析,对其中涉及到的改进的原因、改进的途径、改进的效果都做了详细的讨论。 在引入条件概率估计方法ME(M-Estimate)和TE(Traditional Estimate)以后,提出了自己的关于条件概率的估计方法CE(C-Estimate)和SE(S-Estimate)。在认真分析实验结果的基础上,回答了 “每种估计的效果和特性”以及“为什么要提出新的估计”的问题。然后借助自定义的指标差异度ψ,仔细比较四种估计方法在欠学习情况下对贝叶斯分类器性能的影响,并谨慎地选择了ME和CE,结合两者的优势提出了基于ME&CE融合的贝叶斯分类算法的改进算法。 在对算法实现做了大量的优化工作之后,分类器运算速度得到了大幅度的提高。在分类器实施过程需要注意的一些问题在文中也进行了阐述。在数据简化方面,利用互信息和自定义的β值衡量每个属性的分类能力,用以去除不相关的属性。特别要提及的是,我们给出了针对贝叶斯分类器训练和分类指标α的计算的优化算法,并且对算法的优势在理论上给出了分析。
其他文献
本论文的课题就是为了解决检测这类型的网络访问事件并追踪、定位访问者或攻击者的真实来源,就成为当前的研究热点和困难问题而提出来的。论文首先对于相关技术,包括安全审计、
本文对医学图像融合的理论、方法和技术作了全面、细致的研究。首先对研究背景以及医学图像融合的有关概念、分类及方法进行了综述,然后分别深入研究了单模医学图像的配准、多
旅行商问题(TSP)是一个有着重要工程背景、在图论中的典型组合优化问题,己被证实是一个NP完全问题.该文将解决TSP问题转化为一种特殊的最短路问题.通过构造耦合神经网络,使得
人类已步入信息时代,物质、能量、信息是人类赖以生存的三大资源。以计算机为核心的现代信息处理和以数字化通信为特征的现代信息传输正在紧密地结合起来,将人类带入到未来崭新
随着经济体制改革的不断深化和信息技术的飞速发展,越来越多的企业、公司需要跨地区、跨省,甚至跨国经营.企业信息来源于企业数据,数据是企业信息系统的核心.信息的分布式处
本文主要论述的是如何在蓝牙设备组成的微微网中进行合理调度,从而提高数据传输效率的问题。在当今蓝牙设备使用日益广泛、蓝牙网络拓扑结构日益复杂的情况下,一个庞大的蓝牙散
入侵检测系统作为一种动态防护体系,首先从计算机系统和网络中的不同关键点采集信息,然后通过分析这些信息来确定入侵的迹象,其本质还是一个聚类、分类的问题.支撑向量机是与
智能体(Agent)的概念起源于分布式人工智能(DAI),其相关的理论和技术,尤其是多智能体系统(MAS)和面向Agent的编程(AOP),已经越来越广泛地被应用于知识表示、DAI、Internet数据开