基于web日志挖掘的用户访问模式研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:yuji712
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是数据库最活跃的领域之一。由于其广泛的应用背景和现实意义,数据挖掘技术的研究和应用都获得了突飞猛进的发展,在国内外的学术界和信息产业界备受关注。 数据挖掘是从大量数据中发现人们感兴趣的、隐藏的、先前未知的知识。数据挖掘技术主要研究结构化的数据挖掘,而Web数据的挖掘是应用于Internet的技术研究,是从半结构或无结构的Web页面中,抽取感兴趣的、潜在的模式。尽管Internet是一个半结构化的系统,很难对它进行处理,但是Web服务器日志记录具有良好的结构,非常有利于数据挖掘的进行。此外,Web日志挖掘作为Web挖掘的一个重要组成部分,具有独特的理论和实践意义。 本文系统地阐述了从数据挖掘、Web数据挖掘到Web日志挖掘整个过程,重点讨论在Web日志的挖掘上。通过阅读文献对web使用挖掘技术进行了分析和论述,特别是对Markov模型预测方法进行了详细的讨论分析了其优缺点,通过对已有的各种运用Markov模型进行Web浏览预测的方法的分析,发现这些预测的方法单纯考虑浏览次数往往会得到多个概率相同的结果,预测精度不够高。如果把时间因素加以考虑在内,在一定程度上就能解决这些问题。在此基础上本文提出了一种带访问倾向权重的Markov模型预测方法,该方法的主要特点是:在Markov模型中增加浏览时间参数,并利用值差分度量法对时间参数进行离散化处理;引入访问倾向权重的概念,对转移概率计算方法加以改进;在此基础上还引入新的预测算法。最后进行了模拟实验,说明该方法能获得较高的预测精度,可以用于预测Web用户非常可能访问的页面。
其他文献
近几年,嵌入式产品市场迅速崛起。随着网络技术的迅猛发展,WAP浏览器成为了很多嵌入式系统必不可少的一部分。许多公司都投入到了WAP浏览器的研究和开发中。 WAP浏览器是
随着COM、DCOM、COM+乃至ActiveX技术的应用和发展,软件系统的架构和程序设计的理念也发生了很大的变化。借助于组件和面向对象等模型,这些技术对近年来逐渐流行起来的客户/
随着信息技术、网络技术的快速发展,WEB 应用系统的开发,特别是企业级WEB 应用系统的开发已经成为软件开发的一个重要领域。企业级WEB 系统的开发通常要求有一个良好的软件体
本文介绍了一个基于数据库的具有语义访问功能的逻辑文件系统的设计,并以办公文档为例,具体介绍了如何以Oracle9 iFS为平台实现这个逻辑文件系统。 首先给出了课题背景和
在各商业银行提供的实时外汇买卖业务系统中所采用的汇率是以一种实时在线到达的、易失的、无限的方式获得的数据流。由于各种原因,在这个数据流中经常会出现一些异常片段。
随着网络应用的普及和网络技术的发展,信息技术的应用模式发生了很大的变化,新技术的应用带来了多种的网络连接方式,网络的规模也越来越大,计算机网络管理越来越重要。如何对
随着信息时代的到来和计算机网络技术的飞速发展,在分布式环境下,如何进行有效的数据挖掘成为信息科学研究领域一个新的课题。分布式数据挖掘是使用分布式计算技术,从分布式
随着互联网的发展,人们对在互联网上进行图像检索,尤其是基于内容的图像检索的需求越来越大。从20世纪90年代初起,基于内容的图像检索(CBIR)就成为多媒体技术应用的研究热点。由
地震勘探一般分为三个阶段:地震数据采集、地震数据处理和地震数据解释。野外采集的地震数据需要经过一定的方法进行处理,最后才能对地层构造进行准确的解释。在整个过程中,地震
本论文的研究内容是从结构的角度,通过在进化过程中相对保守,并且相互作用的结构域(domain)来描述蛋白质的相互作用。为此我们首先基于序列相似性的比较对生物序列数据进行了同