论文部分内容阅读
随着Internet的迅速发展,各种信息也在迅猛增加。面对海量的信息,人们常常无法选择和消化,不知道如何更方便、更快捷、更有效地发现自己所需要的信息资源。目前,Web系统为所有用户提供相同的服务,其典型的服务方式为通过建立一个Web站点来向所有用户发布相同的信息,然而Web用户的需求千差万别,用户希望Web系统能够根据他们特性的不同提供个性化的服务。Web日志挖掘技术应用于个性化信息推荐服务中,能够根据用户的访问模式,主动为其推荐所需要的信息。它的出现将有助于解决人们检索信息难的问题。本学位论文研究了基于Web日志挖掘的个性化信息推荐技术,即从用户访问日志文件中挖掘出用户感兴趣的浏览模式,向用户提供推荐服务。首先,对原始的日志文件进行了必要的预处理,清除“脏”数据。其次,基于Web日志的预处理结果,结合关联规则算法在Web日志挖掘方面的应用,利用支持-偏爱度的概念,提出了基于访问频度及浏览时间的浏览偏爱路径挖掘算法。最后,在该算法的基础上,提出了个性化信息推荐方法,该算法通过设置滑窗,根据用户当前的访问序列,主动为用户提供个性化推荐页面,从而指导用户的浏览行为。实验表明,将访问频度及浏览时间同时作为浏览属性的关联规则算法优于访问频度作为浏览属性的算法,能够提高推荐页面的F-测度。