文本自动分类技术和算法研究综述

来源 :计算机科学 | 被引量 : 0次 | 上传用户:kayeyoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本自动分类技术是面向Internet搜索引擎的重要研究方向和关键技术.它是指在给定的分类体系下,根据文本的内容自动确定文本关联类别的过程.本文总结和跟踪了各种常用和最新的文本分类的技术、算法及其适用范围,对评价与比较分类器性能的定理和方法进行了分析,并简述了独立于算法的机器学习.
其他文献
2020年5月5日2时起,福建中南部沿海发生了一次较强海雾过程,范围覆盖中南沿海大部,持续时间超过8h。该文利用卫星、地面自动站、微波辐射计及风廓线雷达观测结果,结合再分析
针对难以利用传统测量方式完成具有特殊结构的机械构件边沿高度测量的现状,提出了一种基于机器视觉的机械构件边沿高度的尺寸测量装置,并重点对可能影响该装置测量结果不确定度的来源进行分析和评定。实验结果表明:设计的测量装置的不确定度评定结果在1μm,完全满足生产要求。
台风降水的分布特征及异常原因可以为台风预报预警服务提供参考。该文利用泉州市1981—2013年逐日的降水资料,将台风降水与季风降水进行分离,运用经验正交函数(EOF)和相关分
近年来,依托于科学技术的发展以及社会经济体制结构的不断优化,农业生产力水平得到显著提升。在此情况下,农业经济体系也实现了多元化发展,其中就包括基于电子商务的农产品销
本文在研究联合国有关20世纪人类消费基本状况和政策取向的基础上,针对中国人居资源禀赋和目前住宅建设与住房消费存在的问题,提出必须选择资源节约型发展模式,即占用资源少
结合土木工程的特点和近年来研究的发展趋势,认为对结构时变可靠性问题的认识应有一个重要转变,即应充分利用信息的不断更新,从静态思维转向动态思维.在有效信息的发掘和利用
为适应莆田市县气象预报业务集约化发展,采用B/S架构,应用JAVA技术,开发完成了莆田市县气象业务集约化平台。该平台通过设计"自启动"监控报警指标、预报预警文字产品转化规则和"批量"发布流程,搭建了"我的工作台""决策气象服务""气象灾害预警""后台管理"等4个模块,实现了产品制作"自启动"、产品"批量"生产、产品"批量"发布、制作"全流程"跟踪。平台的建成使得预报业务集约工作实现流程化、规范化、
利用莆田市三个国家气象观测站(莆田58946,仙游58936,秀屿58938)在日照平行观测业务期间的日照和云量观测资料,分析研究日照自动观测与人工观测的数据差异。结果表明,相比于
"一带一路"沿线国家港口物流能力对促进我国海外综合支撑体系建设具有重要意义。本文创新性地结合了品质型数据与数值型数据,融合灰色关联度分析法和因子分析法,提取了影响"