论文部分内容阅读
随着Intemet的迅速发展和WWW技术日渐成熟并向社会生活各个方面渗透,可利用的信息资源的数量越来越大,类型越来越多。巨量的、无组织的信息,以及htemet上信息资源分布的广泛性,给用户寻找感兴趣的信息增加了困难,用户不知道如何更有效的发现自己所需要的信息资源。
传统的数据挖掘技术和Web相结合衍生的Web挖掘技术为有效解决这一问题开辟了崭新的途径。本文对Web日志挖掘处理的全过程进行了详细的研究,并将Web日志挖掘结果与个性化推荐服务结合起来,利用Web日志挖掘结果为用户提供个性化服务,这样既可以方便用户的访问,又吸引了更多的用户。
通过对当前个性化信息推荐系统以及相关技术的分析,在本文个性化推荐系统框架中主要着重解决以下问题:
1.将用户根据用户的访问特性进行分类,对于不同的用户采用不同的推荐策略。这样可以避免对所有用户使用相同的策略进行推荐时引起的错误。
2.将Web日志文件进行有效的数据预处理。
3.在预处理数据的基础上,采用聚类算法对用户以及页面进行聚类,并通过统计方法对页面的访问情况进行统计分析,在个性化推荐的在线实施部分将根据聚类结果和统计信息对用户进行推荐。
最后,模拟实现了一个个性化网站,分析了现在存在的问题以及以后的发展方向。