论文部分内容阅读
互联网的迅速发展与普及,日益成为人们获取知识和信息的重要手段。它在提供给人们大量信息的同时,也带给人们检索信息的困难。如何帮助用户方便快捷地获得他们所需要的信息是互联网进一步发展所必需面对的一个问题。本文在对这一问题进行深入研究的基础上,结合文本挖掘与日志挖掘两种方法,提出了一种智能网页推荐系统的构建方法。这一系统可以根据用户以前的访问信息为用户在线推荐他所感兴趣的页面。 本文首先在对人们访问习惯进行系统分析的基础上,提出:将用户的访问事务区分为导航路径和兴趣页面集两部分;将WEB页区分为链接页面和内容页面两类。其次,提出从导航路径中利用构造复合后缀树的方法来挖掘用户关键路径,并利用关键路径将用户聚类成不同的兴趣群。根据兴趣群为用户确定一个初步的页面推荐集。为了更精确地识别用户兴趣,作者还提出利用关键路径来构造用户兴趣词集。最后,论文中定义了计算页面对用户的相关度计算公式。根据计算结果确定精确的推荐页面集为用户进行动态推荐。 文中详尽地给出了系统的构建流程和实现算法,并对算法的复杂度进行了初步的分析。分析结果表明该方法复杂度较低,易于实现。