论文部分内容阅读
随着互联网中信息的日益增长,通过文本挖掘,快速、准确地检索信息和分类信息成为人们日益迫切的要求,具有广泛的应用前景和实用价值.该文对文本数据挖掘中的一种重要方法--聚类分析进行了广泛而深入的探讨.通过对以文本数据为代表的高维特征空间特点的分析,该文主要从概率角度,特别是用贝叶斯方法,来研究文本数据的聚类分析.该文的研究工作主要集中在以下几个方面:1)基于文档信息量变化的概率层次聚类.2)贝叶斯模型选择在聚类分析中的应用.3)无监督学习中聚类准确度的评价.4)高维特征空间中的特征约简.