一种基于向量空间模型的改进文本分类算法

来源 :情报杂志 | 被引量 : 0次 | 上传用户:jekiyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
探讨了基于向量空间模型的文本分类技术,通过规范化向量空间模型术语,论述了向量空间模型中TD-IDF向量化文档的不足;提出基于位置等因素的权重改进算法;借助扩展的潜在语义索引算法KLSC和辅助主题词表来消除模型很难处理一词多义、一义多词的现象;根据用户个性化的服务需求,给出了个性化服务的意见。
其他文献
心血管疾病在慢性肾脏病(Chronic kidney disease,CKD)患者中非常普遍,是导致患者残疾和死亡的主要原因。
[目的]评估术前站立位、支点弯曲位、重力悬吊牵引位和仰卧侧屈位X线片在预测青少年特发性脊柱侧凸三维矫形融合术效果的价值。[方法]对63例青少年特发性脊柱侧凸患者的79个
针对传统网络信息检索中出现的查全率和查准率低下的问题,对Mizzaro相关性理论以及语义网理论进行介绍,指出查全率和查准率不高的主要原因在于检索算法采用词型匹配而非词义匹
小电流接地系统单相接地故障选相的传统判据是建立在电网对地参数严格对称的条件下形成的,由于电网不对称度的普遍存在,当电网发生不完全接地故障时,特别是经高阻接地时,传统
采用不饱和硅烷为接枝单体,不饱和烯烃为共单体,在双螺杆挤出机上实现均聚型聚丙烯的接枝交联,制得了高熔体强度聚丙烯。实验通过熔体指数(MFR)和凝胶含量的变化研究原材料对
手机市场有巨大的潜力。高通公司首席运营官兼高通CDMA技术总裁sanjay K Jha在今年6月11日的设计自动化研讨会的主题演讲中称,今天的无线用户有20亿,而到2020年,将有90亿人成为
本文将单调性看作限定词的语义特征,着重从逻辑语义学的角度对其主语部分的单调性进行系统的研究,并试图回答以下一个问题:限定词主语部分的单调性是否具有某种语义普遍性,可
不久前,在北京举行的德州仪器(TI)无线通信高峰会上,TI宣布推出一款全新OMAP-Vox单芯片解决方案—“eCosto”。TI总裁兼首席执行官Rich Templeton表示:“eCosto是TI推出的第二款单
学人名片$$ 徐崇温:中国社会科学院荣誉学部委员,哲学所研究员,博士生导师,出版《当代资本主义新变化》、《当代外国主要思潮流派的社会主义观》、《西方马克思主义事论研究》
报纸
探讨了竞争情报产业化产生的背景和理论基础、竞争情报产业化的内涵和基本特征、竞争情报产业化经营的运行机制厦其意义作用等问题,从理论上指导竞争情报产业化的发展。