基于网页概率潜在语义信息的用户兴趣聚类

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:tower2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了能准确挖掘用户兴趣点,首先利用概率潜在语义分析PLsA模型将“网页一词”矩阵向量投影到概率潜在语义向量空间,并提出“自动相似度阈值选择”方法得到网页间的相似度阈值,最后提出将平面划分法与凝聚式层次聚类相结合的凝聚式层次k中心点HAK-medoids算法,实现用户兴趣点聚类。实验结果表明,与传统的基于划分的算法相比,HAK-medoids算法聚类效果更好。同时,提出的用户兴趣点聚类技术在个性化服务领域可提高个性化推荐和搜索的效率。
其他文献
目的探讨实验动物小鼠不同组织冰冻切片制作的方法与技巧,提高冰冻切片质量,更好地服务于单抗药物非临床安全性评价。方法采用德国徕卡CM1950恒温冷冻切片机,对健康NIH小鼠心
美丽乡村建设规划要实现“实用”,既要有战略性眼光进行全村统筹,也要有局部可操行性的实施性措施,在分期建设中,更需要具体的行动计划支撑规划逐步实施。基于多层次需求出发
介绍一种高效,多孔性钯/氧化铝纤维催化燃烧板的研制及其转化效率和催化活性,寿命,耐硫性等实验室试验。
本文提出了一种使用二又树组织多维数据的数据结构,在这种结构下提出了一个区域搜索算法,确定空间中给定点的区域内所有在给定数据集中的点,搜索效率与维数无关,算法的平均时间复
该文通过对野战综合电台车的电磁兼容性分析,建立了其电磁兼容性分析的工程模型,实现了其电磁兼容性分析的计算机模拟,并对模拟的结果进行了深入分析,为野战综合电台车的装配
不确定树模式聚类是数据挖掘领域中的一个重要问题,提出了一种新的不确定树模式聚类算法,有效地解决了因数据的不确定性而导致的无法聚类的问题。为了更加准确地度量树模式之间