基于文本的新闻事件多版本发现模型

来源 :智能系统学报 | 被引量 : 0次 | 上传用户:hjzxxhjzxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代的发展让越来越多的新闻事件充斥人们的生活,对于一件特定的新闻事件,目前已有很多算法可以帮助人们进行事件追踪和发现.提出一种CDW算法,帮助读者对于一件具有多个版本描述的新闻事件进行多个不同版本的发现.这个算法将文档集映射到话题层,通过提取每个话题的流行词,以得到文档集中具有高区分度的特征.然后根据这些特征对文档集进行聚类,最后得到事件的多个版本.通过在2个实际数据集上进行实验,实验结果表明,该算法与以往的相关算法相比是十分有效的.
其他文献
液晶显示模块是便携式仪器仪表常用的显示模块,文章就以应用广泛的GTC-16042液晶显示模块为例,在简单介绍其内部结构和操作方法的基础上,着重讨论了其与单片机的接口电路及相
目的分析人本位责任制整体护理促进患者康复效果及对并发症的预防作用。方法选择2011年1月至2014年12月该院骨科收治的下肢骨折患者210例,将其分为观察组与对照组,各105例。
目的分析中医肺康复疗法对慢阻肺临床诊治效果。方法按照1:1比例随机划分2015年4月—2016年6月本院收治90例慢阻肺患者为对照组和观察组,对照组吸入噻托溴铵,服用茶碱缓释片,
目的 探讨血管内皮生长因子(VEGF)预防血管成形术后再狭窄的机制.方法 使用高脂饲养建立实验性动脉粥样硬化家兔模型.将VEGF作用于健康兔和动脉粥样硬化兔主动脉血管内皮细胞(VE