基于中文Blog的话题识别方法探讨

来源 :大众科技 | 被引量 : 3次 | 上传用户:johnlu2828
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用话题识别技术将Blog文本信息按照所表达的话题进行归类和组织,可以使Blog信息更加有效、准确地为用户使用。文章重点研究话题识别模型中的词频,权重计算以及相似度计算,对聚类算法有简单的实现并通过该实验对聚类算法有了更深层次的认识。
其他文献
我国是世界上百合的分布中心.百合( Lilium spp.)是百合科多年生草本无皮鳞茎类花卉,是世界上主要切花之一.随着人们生活水平的提高,对百合切花的需求日益增加.现以我们在组
针对惠来电厂#1、#2机600MW机组所配备的六台真空泵在生产运行中,存在的缺陷以及这种缺陷给机组安全生产带来极大的危害,影响了机组的安全运行。在对惠来电厂凝汽器的结构和
马铃薯在利川市历年种植面积均在2.7万hm2左右,占全市总耕地面积的三分之一,然而近几年平均667m2产量仅500kg左右.
为了解南充市城区二次供水的卫生状况,于1996~2000年对南充市城区二次供水水质进行了卫生监测.随机采集南充市城区23家二次供水的管网末稍水,每年采两次.按GB5750-1985生活饮