Web使用挖掘及其在网站优化中的应用

来源 :西南大学 | 被引量 : 0次 | 上传用户：alimamaai

【摘要】

：

Web使用挖掘的研究对象是Web日志数据。Web日志数据记录了用户对Web站点的访问信息,对这些信息进行分析可以发现用户访问站点的浏览模式和访问习惯,可帮助实现网页的预存取和

【作者】

：

田倩飞

【机构】

：

西南大学

【出处】

：

西南大学

【发表日期】

：

2009年期

【关键词】

：

Web使用挖掘日志预处理点击流数据仓库序列聚类网站优化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Web使用挖掘的研究对象是Web日志数据。Web日志数据记录了用户对Web站点的访问信息,对这些信息进行分析可以发现用户访问站点的浏览模式和访问习惯,可帮助实现网页的预存取和缓存;对于页面重组、优化网站的结构等方面都具有十分重要的意义。本文对Web使用日志这些半结构化的数据进行预处理,结合实例网站的实际数据,创建了适合实例网站的点击流数据仓库模型,然后运用SQL 2005 AnalysisService中的Sequence Cluster模型进行数据挖掘,最后对数据挖掘结果进行数据分析,给网站的管理者提供网站结构优化的建议。论文所做的主要工作如下:1.对数据挖掘和Web使用挖掘的相关知识和技术进行了概述,阐述了Web使用挖掘的意义、研究现状以及面临的问题;2.讨论了Web使用挖掘的三个阶段:数据预处理、模式识别和模式分析,分析了Web使用挖掘的应用领域和研究方向;3.为数据预处理的数据采集、数据净化、用户识别和会话识别等部分提供了详细的算法。Web日志数据通过这些算法进行预处理后,为数据仓库的建立提供了可靠的准备数据。4.利用日志分析工具Deep Log Analyzer对经过预处理的日志数据进行分析,得到基本的统计数据及图表。接着分析建立点击流数据仓库的必要性。根据MarkSweiger等提供的标准点击流仓库模型,提出适合实例网站的数据仓库逻辑模型,并在此逻辑模型的基础上,建立相应的物理模型。5.最后将上述的数据预处理算法和数据仓库模型应用在实例网站的访问日志中,然后运用SQL Server 2005 Analysis Service中的Sequence Cluster模型分析数据仓库中的数据,并将分析结果应用于网站结构的调整。

其他文献

基于现场总线的温室大棚测控系统设计

针对温室大棚数量众多，使用人工控制温度、湿度成本过高的情况。本文设计了基于CAN现场总线的温室大棚自动测控系统。　　基于CAN现场总线的温室大棚自动控制系统由硬件和软件

学位

温室大棚现场总线测控系统硬件设计软件开发

基于数字图像的雾滴沉积分布试验研究

农药施用后雾滴在田间及作物上的沉积分布状况直接影响到农田灭虫除草的效果,本课题研究的目的就是利用数字图像技术对农药细雾的沉积分布进行研究,得出雾滴在棚室内的沉积分

学位

图像处理当量直径覆盖率沉积密度三维可视化

白背飞虱智能识别系统的设计与实现

水稻是我国最主要的粮食作物,在农业生产和粮食安全中具有关键性的作用。白背飞虱[Sogatellafurcifera(Horvath)]是目前影响水稻高产、稳产的主要害虫之一,因此,必须对白背飞

学位

白背飞虱采集装置不变矩二维傅里叶频谱识别

对初中英语课堂落实互动教学模式的策略探究

摘要互动教学旨在充分发挥教育者的主导作用以调动学生学习的积极性，让学生能够自主地参与教学活动，主动思考教学问题，全面提高自身素质。互动教学注重学生参与教育学习的过程，更注重教学过程中学生主体地位的充分发挥。在初中英语教育过程中充分利用互动教学模式可以有效地和谐师生关系，继而实现全面提高教学质量的终极目标。　　关键词初中英语；互动教学；主体地位　　中图分类号：G632文献标识码：A文章编号：100

期刊

初中英语互动教学主体地位

基于无线传感网的雪花牛肉溯源系统研究与设计

随着肉制品需求不断增加,肉类食品安全问题越发受到人们关注。在传统生产模式中,由于信息采集方法落后、各环节信息衔接不畅等问题,导致肉品信息记录与肉品本身无法有效关联,

学位

雪花牛肉无线传感网信息溯源数据库系统

光电倍增管光电性能初步分析与测试

锂玻璃探测器由锂玻璃探头和光电倍增管组成,其具有探测效率高,电子学和数据采集及处理设备简单,且能够在脉冲和电流两种模式下工作,尤其在高中子注量率条件下,能够迅速得到

期刊

锂玻璃探测器中子通量脉冲线性光电倍增管

新型冠状病毒肺炎疫情输入城市的风险隐患及应对建议

新型冠状病毒肺炎疫情目前进入大范围传播阶段.作为疫情输入地区,要加强疫情研判,及时调整防控策略,研发操作便捷的诊断试剂盒,广泛开展筛查,早发现、早隔离.实施流人人员分

期刊

新型冠状病毒肺炎疫情输入风险隐患

铸渗钒铁/高碳铬铁复合层的组织及干滑动磨损性能研究

本文采用消失模铸渗技术在ZG310-570表面制备复合层；采用JSM-5610LV型扫描电子显微镜，H-800型透射电子显微镜，EDAX能谱仪研究了铸渗复合层的显微组织、相结构；利用HVS-1000型数显

学位

铸渗复合层显微组织结构干滑动磨损耐磨性消失模铸渗技术

基于截面极限承载力曲线的衬砌结构安全性评价方法研究

复合式衬砌由初期支护、防水层和衬砌组成,是中国现行山岭隧道的主要结构形式,而衬砌是保证隧道长期运营安全的关键.衬砌结构的安全性评价一般根据相关的隧道设计规范进行.现

期刊

隧道工程衬砌结构安全性极限承载力曲线安全系数安全包络线衬砌截面承载力

CD44表达增强促进胃腺癌组织上皮间质转化和肿瘤转移

目的探讨胃腺癌组织中CD44、上皮间质转化(EMT)相关蛋白上皮钙黏素(E-cadherin)和波形蛋白(vimentin)的表达及临床意义。方法采用免疫组织化学Envision染色法检测95例胃腺癌

期刊

胃腺癌细胞CD44表达vimentincadherin上皮间质细胞肿瘤分化程度等级相关分析癌转移胃癌

Web使用挖掘及其在网站优化中的应用

其他学术论文