高性能特征选择及文本分类算法研究

来源 :华北电力大学(北京) 华北电力大学 | 被引量 : 0次 | 上传用户:majiguo1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从大量繁杂的文本信息中获取有用的信息是信息处理的一大任务,而文本分类是实现这个任务的最重要的方法之一。特征选择和文本分类算法是文本分类的两个重要的研究方向,特征选择是为了选取最能表示文本内容的特征来对庞大的文本空间进行约减,既提高了文本分类的效率又可以通过去除噪音特征提高分类精度,而好的分类方法能够有效地提高分类的效果。本文针对现有特征选择算法没有利用有用的词条频率信息,没有定性分析的现状,提出了基于词条频率的改进特征选择算法,对特征选择算法进行了定性分析,提出了构造高效特征选择方法的约束条件和步骤,构造出一种高效的特征选择方法,并用实验证明了改进方法的有效性。
其他文献
纹理合成以人工生成纹理为目的,是计算机图形学与图像处理的重要研究领域。基于样图的纹理合成是近些年来出现的一种新技术,它以小块纹理图像作为输入合成任意大的同类纹理,
数字水印是保护知识产权的一种新技术,它通过在数字产品中嵌入版权信息—水印来证实该作品的所有权,被嵌入的信息通常是不可见或不可察觉的,但通过检测器可以提取出水印或者
无线网状网(Mesh)是由Ad Hoc网络发展而来的相对静态的无线网络,是Internet的无线版本。无线网状网具有自组织、自配置和自治愈的特点,能够自动地将各个节点组织起来建立一个
支持向量机SVM是实现统计学习理论的通用学习方法,其优异的泛化性能使得支持向量机在模式识别、回归分析和预测、密度估计等领域都得到了实际应用。当SVM用于回归分析和预测
面向服务体系结构(Service Oriented Architecture,SOA)对现代软件开发模式产生了深远的影响,它通过服务的发布、发现以及绑定等机制为其他的应用程序提供服务。SOA具有松散
随着计算机技术和互联网的普及,网络安全成为每一个网络用户所必须考虑的一个重要问题。一旦网络安全问题发生,通常会造成严重的后果。在越来越多的计算机用户将个人计算机接
谱图理论是图论的一个非常活跃而又重要的分支,它在计算机科学、通信网络、信息科学和量子化学等领域都有着广泛的应用。谱图理论研究的主要对象包括图的邻接谱,Laplacian谱以
随着人们对移动性的追求,以3G技术和无线局域网技术为代表的无线网络获得了巨大的发展,无线网络的角色从有线网络的补充逐渐转变为有线网络的有力竞争者,给有线网络带来了巨大的
电力企业资产管理是关系到企业能否稳定生产、降低成本、继续发展的头等大事。目前,电力企业资产管理仅停留在单机或C/S(Client/Server)二层结构的系统状态上,逻辑层不独立,软件
近年来,手势识别逐渐变成人机交互中的一种重要手段。相对于静态手势识别而言,动态手势识别在现实应用中更加广泛。而手势轨迹是运动特征中的一种,其简单、鲁棒的特性使其广泛地