论文部分内容阅读
随着Internet应用的迅速发展,网络上信息迅速增长,信息种类也越来越多,人们面对太多的信息无法选择和消化,Internet上信息资源分布的广泛性又给用户寻找感兴趣的信息增加了困难,也就是所谓的信息过载和信息迷失。为了有效地解决信息过载和信息迷失给人们带来的种种困扰。最近很多学者提出了一种被认为能有效解决这些问题的技术-web个性化信息服务技术。
基于数据挖掘的个性化信息服务是目前Web个性化服务中应用和研究的关键技术,web个性化信息服务是指Web站点上通过跟踪,研究用户登陆、浏览记录等信息,发现用户的喜好,动态地为用户提供浏览建议,制定浏览内容。Web数据挖掘是利用数据挖掘技术在网页数据中发现潜在的、有用的模式或信息。本文主要对基于Web使用挖掘的个性化信息服务中若干关键技术进行了研究和应用。
本文的主要研究内容如下:
1.Web使用挖掘的方法研究。详细的研究和探讨了Web使用挖掘的整个过程(如:数据收集、数据预处理、模式发现、模式分析以及应用)。对各个过程进行了详细的介绍,尤其是针对过程中非常重要的数据预处理过程,给出了该阶段各项任务的相关算法。
2.本文对模糊聚类的概念、方法和技术进行了详细的研究,将模糊聚类运用到Web使用挖掘中,在实现Web服务器日志的数据预处理后,对Web事务数据进行Web模糊聚类、分析、研究,有效的抽取出用户感兴趣的模式。通过Web使用挖掘技术可按照用户的兴趣和爱好来改进和优化Web站点上的信息组织与显示,针对不同用户提供不同的服务策略和服务内容,改善网站的质量,使网站建设和修改更加有的放矢,减少用户的无效点击操作次数,缩短查找信息的时间,提高访问效率,更好地实现Web个性化服务。
3.文本提出了web使用挖掘技术的模糊聚类过程模型。对于该模型在Web事务中的web用户聚类、web页面聚类等方面的应用和实现进行了探索性研究。研究了基于页面层次和偏好度获取浏览频繁路径的方法。
4.结合已有的个性化信息服务框架模型,并对其进行了改进。依照该框架开发的网站针对用户不同的兴趣,对用户提供个性化信息服务,从而使网站更具人性化。