极大熵球面K均值文本聚类分析

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:foreverfreedom5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于极大熵理论的球面K均值文本聚类算法ME-SPKM.该算法利用了传统文本聚类算法SPKmeans中使用的余弦相似度度量,进而引入极大熵理论构造了适合文本聚类的极大熵目标函数.对文本数据的实验证明了极大熵球面K均值文本聚类算法取得了比传统文本聚类算法更好的聚类效果.
其他文献
许嘉璐先生说:“如果我们解决了小学生识字难的问题,使识字难变为不难,其意义并不比放一颗卫星小。”这就说明在小学语文教学中识字是第一大难题。
中文语言自身的特点决定了从中文自然语言文档中获取知识是非常困难的.尽管目前对中文的命名实档体识别(简称为NER)已经取得了较好的效果,但是如果不借助同义词表或者类似Wor
李杜七古异同论葛景春李白和杜甫的七言古诗(包括七言、杂言乐府歌行)是唐诗七古创作的最高成就,即使是后人也无出其右者。明人胡应麟曾对唐代的七言歌行有一个总评:“唐七言歌行
施光南是我国当代著名的作曲家,他在各个不同历史时期的作品中,都能确切地展现那个时代的精神风貌,着力表达了一种对祖国、对人民的深情厚谊,对幸福生活和美好爱情的赞美、歌
分析了目前描述逻辑DL的研究现状和存在的问题,特别是动态描述逻辑DDL作为语义Web逻辑基础所存在的问题.针对语义Web需要处理模糊和不精确知识的特点和需求,对DDL进行了模糊