基于特征相关性的汉语文本自动分类模型的研究

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:sddxfg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出一种基于预定义类别与文本特征之间相关性的自动分类算法,并在文中详细阐述了汉语文本自动分类模型的设计与实现过程。为测试分类模型实现性能,建立具有12类别的分类体系,并构造包含近500篇汉语新闻语料的测试集。实验结果表明,评价自动分类算法的两个重要指标:查全率和查准率,都比较令人满意。 In this paper, an automatic classification algorithm based on the correlation between predefined categories and text features is proposed, and the design and implementation process of Chinese text automatic classification model are described in detail. To test the performance of the classification model, a classification system with 12 categories was established and a test set containing nearly 500 Chinese news corpus was constructed. The experimental results show that it is quite satisfactory to evaluate two important indexes of automatic classification algorithm: recall rate and precision.
其他文献
本文介绍 X 波段砷化镓功率场效应晶体管(FET)的测量结果。这些器件是用简单的平面工艺制作的。多个单元并联的器件在9千兆赫下,输出功率大于1瓦,增益大于4分贝。4分贝增益下
2009年11月30日,国家标准化管理委员会发布155号公告,批准发布一批国家标准,其中涉及橡胶行业内容22项,标准名称及实施日期见附表。 November 30, 2009, the National Stand
对建立实用并行机群所需的机间通信、负载平衡和调度策略、并行编译、并行调试、故障恢复与容错、以及并行程序设计环境等关键技术及其研究开发工作的新进展做了比较详细的分
目的运用信息技术有效监控临床用药,实现对医嘱的自动核查并实时对问题医嘱发出预警提示,可在线查询药物使用说明、相互作用、配伍禁忌等相关信息,建立抗菌药物的分级管理和
重构计算技术在众多的专用应用领域具有通用计算机技术所无法比拟的性能。现在,通过将通用计算机与重构计算硬件结合,可以进行有效的通用重构计算。 Reconstruction computing
目的探讨基层医院不合理用药原因及管理对策。方法通过回顾2013年1月-12月我院1000张住院及门诊处方,分析了不合理用药类型及原因,并提出了相应管理对策。结果共有89张不合理
A new apparatus was designed with a thick-walled glass capillary,electric heater tube with red copper and heat preservation.The thick-walled glass capillary was
本文提出了一种新的集成注入逻辑结构——集成注入肖特基逻辑(I~2SL)。该结构采用P埋集电极纵向PNP晶体管作注入器,巧妙地实现了与正常向下工作的NPN晶体管并合。实验结果表
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
对工业生产中使用的化学危险物品,绝大多数人是知道的,比较警惕;然而对于生活用品也会“发火”的事儿,大多数人一听便会感到陌生。其实,不少人天天都与之打交道,经常使用它,只是人们