基于一种新的关联性度量指标的特征选取方法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lhz19700717
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在各种实际应用中经常要研究各种变量之间的复杂关系,这往往需要考虑度量各个变量之间的关联程度的指标。在现有的诸多指标中,互信息和条件互信息作为信息论的基本概念,受到了相关领域专家学者的广泛关注,在很多工程与应用领域,比如生物、化学、通信等领域得到很广泛的应用。但是由于其精确计算的复杂程度,大大的限制了应用的范围。特征征选择是变量降维的一个重要应用。通过特征提取得到的输入特征数据量很大,直接用于分类需要很大的运算量。特征选择的研究任务就是寻找一种好的算法,以便在允许的时间内找出对分类最有效的一组特征。用信息论的方法进行特征选择是较常用的一种方法。用信息论算法进行特征选择要同时考虑各输入特征对分类类别的重要性和各输入特征之间的相关性,用输入特征和分类类别的互信息反映该输入特征对分类的重要性,用输入特征之间的互信息反映输入特征之间的冗余性。 本文在前人工作的基础上,首先提出了函数相关系数作为度量离散型变量之间的相关指标并从理论上严格证明了其性质,表明该系数可以用来描述随机变量之间的函数相关程度(包括线形和非线性)。其次,在该指标和信息论概念的基础上设计了一种新的特征选择方法,通过实验计算说明该方法是可行有效的。最后,将函数相关系数应用于其它实验,通过和现有的系数均方列联进行比较更进一步认识该系数具有的特性。文章分为五个部分: 第一部分,对现有相关性度量指标的国内外发展状况以及相关的基本概念进行了介绍,并阐述了本文的主要工作; 第二部分,介绍信息论基本概念、原理以及信息论在特征选择中的应用,并分析了其优缺点及国内外的主流算法策略。 第三部分,在传统相关系数的基础上进行扩展,提出新的指标(函数相关系数),从理论上讨论并证明其具有的良好性质。 第四部分,将函数相关系数应用到特征选择中,在与信息增益的特征选择方法的比较实验中,说明该算法的有效可靠性,有着广阔的应用范围。 第五部分,将函数相关系数应用到一些其他实验中,通过和均方列联的比较进一步验证其性质及合理性。
其他文献
Vapnik等人在统计学习理论框架下发展出了一种新的模式识别方法和通用的学习算法-支撑向量机(Support Vector Machines,简称SVM)。求解SVM被众多学者认为是继模式识别和神经
物理教学不仅是让所学者对物理知识的掌握和运用的过程,更是潜移默化提高科学素养的过程。当一个人只有知识没有科学素养时,知识对所学者而言,只是一位仅会机械运用知识的工
本文研究了两类中立型时滞微分方程解的振动性质. 第一章,介绍了问题研究的背景及本文的主要工作. 第二章,利用平均函数和积分算子,且采用Philos和Wong发展的一般的方法,化高
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
Falconer(TFanS Amer Math Soc 347(1995)3121-3129)弓入了子自相似集的概念,并得到了一些有趣的结果。在研究有重叠的迭代函数系的重分形结构中,弱分离条件起了很大的作用。本
本文讨论了矩阵特征向量系与矩阵可约性之间的关系,并在此基础上研究了矩阵的Perron-Frobenius性质.从而发现了DimitriosNoutsos文“On Perron-Frobenius property of matrices
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
当前国内众多高职院校的教学管理工作存在着诸多问题,在执行工作流程的时候仍旧沿用着传统的师本理念,过分强调管理学生而不是让学生们参与管理的过程中,在一定程度上这严重
图的能量是指图的所有特征值的绝对值之和。图的能量与分子的π-电子总能量密切相关,因此在理论化学和数学中得到了广泛的研究。 最近,其他学者已经确定了给定直径的具有最
爱国主义是中华民族传统美德,是联系中华民族的精神纽带,是国家发展的精神支撑,新时代下的爱国主义又赋予了新的内涵.构建社会主义和谐社会是更高层面的社会发展目标,爱国主