文本分类技术探究

来源 :宿州学院学报 | 被引量 : 0次 | 上传用户:FLASH920
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
首先阐述了文本分类的现状和定义,概述了文本分类的基本流程.然后对文本预处理过程中的分词和去停用词作了简要介绍。在简述文本表示的概念和常用模型之后,重点讨论了信息增益、文档频率、期望交叉熵、互信息和chi统计五种用于特征降维的特征选择方法,而后描述了Rocchio、朴素贝叶斯(NB)、支持向量机(SVM)、K最近邻(kNN)和决策树分类算法的基本指导思想。并从分类性能及其各自复杂度等方面分析比较了这几种算法的优缺点,最后评述了查全率、查准率和F—Measure三种常用的分类器性能评价指标。
其他文献
摘 要:本文就基于数字化富媒体教材的开发及推广进行探讨。富媒体数字教材,是将文字、图像、音频、视频等各种资源融为一体。富媒体教材将版式设计、仿真图像、仿真视频、知识点提示、媒体链接、指引导读等多媒体属性赋予教材,强调读者与教材之间的自主交互学习方式,学生可以在多个终端实现随时随地阅读学习的一种数字化教材。  关键词:数字化 富媒体教材 学材  富媒体教材区别于普通电子书,有如下特点:资源丰富且表达
为解决DDS频谱不纯、杂散成分较多等问题,对DDS频谱进行了仿真,分析了DDS触发时钟的相位抖动及其谱函数.采用非减性抖动改善DDS频谱,抑制频谱杂散效果明显。推导出直接数字频率合
关键词 保守治疗 脾破裂 利与弊  在腹部闭合性损伤中脾破裂20%~40%,真性破裂85%左右,因此脾切除术仍是治疗脾破裂,低血容量休克的首选。2006~2011年收治外伤性脾破裂患者56例,其中急诊手术38例,保守治疗18例中,失敗后中转手术14例,保守成功4例。保守治疗脾破裂,观察及护理难度增大,风险增加,成功率不高。  资料与方法
摘 要:思维导图将抽象化的概念、理论等可视化,通过中心关键词、图形等构建知识网络,帮助学生理解记忆,实现个性化的学习。本文从思维导图的定义特征出发,针对汽车专业课教学现状,对基于思维导图的教学创新应用进行了探讨。  关键词:思维导图 汽车专业 学生培养  教学是教育的关键环节,教法和学法则是教学过程的重要保障,著名的教育家叶圣陶曾指出“教学有法,教无定法,贵在得法”。教学首先要有符合教育规律的法制