基于web日志挖掘的用户访问模式研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户：yuji712

【摘要】

：

数据挖掘是数据库最活跃的领域之一。由于其广泛的应用背景和现实意义，数据挖掘技术的研究和应用都获得了突飞猛进的发展，在国内外的学术界和信息产业界备受关注。数据挖掘

【作者】

：

王瑶

【机构】

：

重庆大学

【出处】

：

重庆大学

【发表日期】

：

2005年期

【关键词】

：

用户访问访问倾向权重数据挖掘数据库

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数据挖掘是数据库最活跃的领域之一。由于其广泛的应用背景和现实意义，数据挖掘技术的研究和应用都获得了突飞猛进的发展，在国内外的学术界和信息产业界备受关注。数据挖掘是从大量数据中发现人们感兴趣的、隐藏的、先前未知的知识。数据挖掘技术主要研究结构化的数据挖掘，而Web数据的挖掘是应用于Internet的技术研究，是从半结构或无结构的Web页面中，抽取感兴趣的、潜在的模式。尽管Internet是一个半结构化的系统，很难对它进行处理,但是Web服务器日志记录具有良好的结构，非常有利于数据挖掘的进行。此外，Web日志挖掘作为Web挖掘的一个重要组成部分，具有独特的理论和实践意义。本文系统地阐述了从数据挖掘、Web数据挖掘到Web日志挖掘整个过程，重点讨论在Web日志的挖掘上。通过阅读文献对web使用挖掘技术进行了分析和论述，特别是对Markov模型预测方法进行了详细的讨论分析了其优缺点，通过对已有的各种运用Markov模型进行Web浏览预测的方法的分析，发现这些预测的方法单纯考虑浏览次数往往会得到多个概率相同的结果，预测精度不够高。如果把时间因素加以考虑在内，在一定程度上就能解决这些问题。在此基础上本文提出了一种带访问倾向权重的Markov模型预测方法，该方法的主要特点是：在Markov模型中增加浏览时间参数，并利用值差分度量法对时间参数进行离散化处理；引入访问倾向权重的概念，对转移概率计算方法加以改进；在此基础上还引入新的预测算法。最后进行了模拟实验，说明该方法能获得较高的预测精度，可以用于预测Web用户非常可能访问的页面。

其他文献

WAP浏览器的研究与设计

近几年,嵌入式产品市场迅速崛起。随着网络技术的迅猛发展,WAP浏览器成为了很多嵌入式系统必不可少的一部分。许多公司都投入到了WAP浏览器的研究和开发中。 WAP浏览器是

学位

HTTP协议WHTTP协议浏览器无线应用协议解析

基于微软办公平台的专用软件的集成与设计方法的研究

随着COM、DCOM、COM+乃至ActiveX技术的应用和发展,软件系统的架构和程序设计的理念也发生了很大的变化。借助于组件和面向对象等模型,这些技术对近年来逐渐流行起来的客户/

学位

组件客户/服务器对象BCBVBA

基于任务的WEB开发框架研究与应用

随着信息技术、网络技术的快速发展,WEB 应用系统的开发,特别是企业级WEB 应用系统的开发已经成为软件开发的一个重要领域。企业级WEB 系统的开发通常要求有一个良好的软件体

学位

WEB 应用框架MVC 模式任务数据字典J2EE 平台

基于DB的逻辑文件系统的设计与实现

本文介绍了一个基于数据库的具有语义访问功能的逻辑文件系统的设计,并以办公文档为例,具体介绍了如何以Oracle9 iFS为平台实现这个逻辑文件系统。首先给出了课题背景和

学位

语义文件系统内容访问结构访问逻辑映射

数据流的变化检测算法及其在实时汇率数据流异常检测中的应用

在各商业银行提供的实时外汇买卖业务系统中所采用的汇率是以一种实时在线到达的、易失的、无限的方式获得的数据流。由于各种原因,在这个数据流中经常会出现一些异常片段。

学位

数据流变化检测外汇买卖汇率异常

基于SNMP的校园网网管系统研究与实现

随着网络应用的普及和网络技术的发展,信息技术的应用模式发生了很大的变化,新技术的应用带来了多种的网络连接方式,网络的规模也越来越大,计算机网络管理越来越重要。如何对

学位

简单网络管理协议基于WEB的网络管理校园网管理KMUSTNM原型

基于移动代理的分布式数据挖掘研究

随着信息时代的到来和计算机网络技术的飞速发展,在分布式环境下,如何进行有效的数据挖掘成为信息科学研究领域一个新的课题。分布式数据挖掘是使用分布式计算技术,从分布式

学位

数据挖掘分布式移动代理关联规则

一种基于PCA的相关反馈图像检索算法与实现

随着互联网的发展，人们对在互联网上进行图像检索，尤其是基于内容的图像检索的需求越来越大。从20世纪90年代初起，基于内容的图像检索(CBIR)就成为多媒体技术应用的研究热点。由

学位

图像检索主成份分析颜色直方图主色划分相关反馈

地震数据交互处理系统的研究与实现

地震勘探一般分为三个阶段：地震数据采集、地震数据处理和地震数据解释。野外采集的地震数据需要经过一定的方法进行处理，最后才能对地层构造进行准确的解释。在整个过程中，地震

学位

地震勘探交互处理Qt用户体验

Structural Modeling and Characterization of Protein Interaction Network

本论文的研究内容是从结构的角度，通过在进化过程中相对保守，并且相互作用的结构域(domain)来描述蛋白质的相互作用。为此我们首先基于序列相似性的比较对生物序列数据进行了同

学位

序列聚类蛋白质相互作用比较建模蛋白质对接相互作用网络生物序列数据模板数据库

基于web日志挖掘的用户访问模式研究

其他学术论文