论文部分内容阅读
相对于Web上的海量数据而言,个人阅读和理解信息的能力非常有限,很难获得他们所期望的知识,此即“信息爆炸”问题。为了解决这个问题,人们提出了很多技术来帮助用户利用网上资源,Web个性化即是其中之一。基于Web使用挖掘的个性化推荐系统已成为Web个性化服务领域研究的热点。然而,随着Web的迅速发展,Web的动态性已经对Web个性化系统提出新的挑战。Web网站的内容经常被更新,网站用户的浏览兴趣时常发生变化,而已有的推荐算法和个性化推荐系统体系结构并不能很好地解决Web动态性问题。针对这一问题,本文对基于Web使用挖掘的Web个性化技术进行了有益的探索和研究。首先,介绍了Web个性化技术以及基于Web使用挖掘的Web个性化技术的发展,介绍了Web使用挖掘中的数据特点并对Web使用挖掘在个性化应用中的处理过程进行了详细分析。其次,概述了聚类分析算法在Web使用挖掘个性化系统中的应用,针对Web动态性对已有聚类算法提出的挑战,以一种无向图的形式表示页面访问信息,提出了一种基于无向图的增量式页面聚类算法。随后,本文提出页面推荐得分的定义,以及基于页面聚类的推荐决策算法。然后,介绍了已有Web使用挖掘个性化推荐系统框架,分析了离线处理的方式在个性化推荐系统应用中存在的不足。针对这一问题,利用前文提出的推荐算法,本文提出了一种新的在线处理的基于Web使用挖掘的个性化推荐系统,并对推荐系统的各处理阶段进行了详细介绍。最后,在推荐系统设计方案的基础上,将推荐系统实现为Apache Web服务器模块的形式,并对推荐系统整体性能进行了验证,其中包括推荐表现形式、推荐有效性以及响应时间的实验。