分级聚类与平面划分结合方法在网页分类中的应用

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:wrothnpc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章研究分级聚类与平面划分结合方法在网页分类中的应用。阐述了网页分类问题中样本特征分布的特点和复杂性,分级聚类能够生成层次化的嵌套类,且具有较高的准确度,但具有较高的计算复杂度,不适合计算大量样本的计算问题。K-均值算法受初始聚类中心的选择影响较大,对于不规则分布的样本往往聚类的效果不佳。文章考虑利用少数样本和分级聚类算法进行样本集合的初始聚类中心的划分,再利用K-均值算法对整个样本集合做聚类,则既可以避免分级聚类算法的计算复杂又可充分利用K-均值算法的快速特点;另一方面则利用了分级聚类算法准确度高为确定
其他文献
文章总结归纳了公路施工、营运期环境保护工作的重点与措施,对环境影响评价制度与方法进行了阐述,并通过与国外公路环境保护比较,指出:在公路建设中要加强对生态环境的保护,减少对
该文研究双秘钥公开钥密码体制,它不同于一般的只有一个秘密密钥的公开钥密钥体制,而是使用两个秘密密钥,要攻破它必须同时解决两个数学难题(素因子分解和求离散对数),从而大大增加