基于隐含语义分析的微博话题发现方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:qwe8056
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微博的大量普及和关注度的不断提高,微博热点话题发现已成为当前研究热点。针对于短文本、向量空间模型(VSM)文本表示方法存在高维度、稀疏,以及同义多义问题,导致难以准确度量文本相似度,提出一种基于隐含语义分析的两阶段聚类话题发现方法。引入话题热度的概念来选取具有一定关注度的微博文本,用隐含语义分析(LSA)对数据集进行建模;用层次聚类的CURE算法确定初始类中心;用K-means聚类得到热点话题的聚类结果。真实微博数据集的实验结果验证了该方法的有效性。
其他文献
湛若水(1466-1560),号甘泉,是明代著名的思想家、教育家,是广东唯一入祀孔庙的大儒陈献章的衣钵传人。他一生从政、办学、著述、探究学问,是岭南心学的集大成者,构建了富于岭
目的为了减轻各种生理和心理性的伤害刺激引起神经、内分泌、免疫和代谢紊乱等全身性应激反应,严重或长期的应激反应导致的手术患者免疫功能抑制,杜绝诱发伤口感染、手术伤口
目的介绍effectcoding的变量赋值方法及其在医学研究中的应用,并与dummycoding方法比较。方法将2005年调查中搜集到西部10省40个县的村医20125张处方作为分析资料,省作为分类变
倾听是动手实践和课堂交流的基础,只有高质量的倾听才能让学生认清自己的目标,规划好自己的行动,只有高质量的倾听才能让学生明白别人的真实想法和意图,然后结合自己个性化的认识
目的:客观评价自拟经验方降脂护肝汤治疗非酒精性脂肪肝的临床有效性及安全性。方法:将门诊收集的60例非酒精性脂肪肝患者,按随机数字法将其分为降脂护肝汤观察组和荷丹片对照
清词选本作为词总集中一个独特的类别,对清词的传播和中兴具有重要的作用。在清词选本的编选过程中,通过序、跋以及词作数量多少的安排,编选者得以表达自己的词学主张和创作
在建筑施工领域里,普遍存在着"挂靠"经营的现象,由此会不可避免的带来各种风险。本文重点分析了建筑企业因为挂靠经营而带来的法律风险、经营风险、财务风险和项目质量安全风
【目的】明确当前新疆南疆地区麦田、核桃-小麦间作麦田和红枣-小麦间作麦田主要杂草种类及群落结构特征。【方法】采用棋盘法9点取样,对核桃-小麦间作麦田、红枣-小麦间作麦
国家治理体系和治理能力现代化是发挥中国特色社会主义制度优势的必然要求和逻辑展开。实现治理现代化既要根植于中国大地,又要放眼世界。艰巨而复杂的治理任务,既需要中国共
研究了不同剂型、不同剂量穿心莲对肉鸡体液免疫的影响.在试验的第14、21、28、35、42天分别采血,对肉鸡的新城疫血凝抑制反应(HI)抗体滴度、血清总补体溶血活性、血清球蛋白含