论文部分内容阅读
对文本聚类中的降维方法进行了深入研究。重点研究了基于概念空间的文本的降维技术在解决中文文本处理领域常见的同义、近义和缩略等问题中的应用,并结合hash变换法实现了对大规模文本的特征提取。然后,通过增量聚类算法实现了文本聚类。最后,用试验表明了降维的有效性, 即缩短了聚类计算时间,提高了聚类精度。