论文部分内容阅读
大型网站为了提高访问效率,通常建立多个镜像站点,这导致获取网站全局的用户访问模式知识变得困难。该文提出一种分布式W eb日志挖掘模型DW LM S,并以路径分析技术为例,提出了基于DW LM S的局部频繁路的更新算法LFP和全局频繁路径的更新算法GFP,解决了W eb访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难。对提出的算法进行了实现和实际日志数据的测试,结果证明了算法的有效性。