一种基于词聚类的中文文本主题抽取方法

来源 :计算机应用 | 被引量 : 44次 | 上传用户:tandge
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于词聚类的中文文本主题抽取方法,该方法利用相关度对词的共现进行分 析,建立词之间的语义关联,并生成代表某一主题概念的用种子词表示的词类。对于给定文档,先进 行特征词抽取,再借助词类生成该文档的主题因子,最后按权重输出主题因子,作为文本的主题。实 验结果表明,该方法具有较高的抽准率。
其他文献
以双硫腙-非离子型表面活性剂Triton X-114为浊点萃取体系分离富集铋,在优化了溶液酸度、浊点萃取温度等实验条件下,应用氢化物发生-原子荧光光谱仪测定富集相中铋的含量。结
针对欧几里德旅行商问题,提出了一种“整体优先”算法。该算法的基本思路是边构造边调整路径,在调整中采用了独创的逆向调整方法,避免算法陷入局部优化陷阱。理论分析和大量实验结果表明,该算法不仅时间复杂度和空间复杂度低,寻优能力也相当强,其综合性能超过目前的一些主流算法。
5月18日,笔者有幸走访了福林格(青岛)农业机械有限公司(Fliegl)。在福林格公司的组装车间,整洁的工作环境和高效的生产流程令笔者赞叹不已。尽管今年只是福林格这家德国企业进入国
对目前现有的非否认协议的几种形式化分析方法进行了分析和比较,指出了它们的优缺点,最后提出了进一步的研究方向。
黄金十年,农机市场火爆,农机流通行业普遍得到较快发展。但自2015年开始,发展速度减慢,特别是今年以来,农机流通企业普遍感到经营困难,生存压力大。市场清淡,传统产品销量持续下滑,竞
"受前几日连续阴雨天气影响,豫北部分地区的麦收进度放缓。最近几天抓住降水间歇期和晴好天气,抢收进度加快,河南全省夏收工作预计将在2-3日内结束。目前,河北石家庄以南地区