Web使用挖掘及其在网站优化中的应用

来源 :西南大学 | 被引量 : 0次 | 上传用户:alimamaai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web使用挖掘的研究对象是Web日志数据。Web日志数据记录了用户对Web站点的访问信息,对这些信息进行分析可以发现用户访问站点的浏览模式和访问习惯,可帮助实现网页的预存取和缓存;对于页面重组、优化网站的结构等方面都具有十分重要的意义。本文对Web使用日志这些半结构化的数据进行预处理,结合实例网站的实际数据,创建了适合实例网站的点击流数据仓库模型,然后运用SQL 2005 AnalysisService中的Sequence Cluster模型进行数据挖掘,最后对数据挖掘结果进行数据分析,给网站的管理者提供网站结构优化的建议。论文所做的主要工作如下:1.对数据挖掘和Web使用挖掘的相关知识和技术进行了概述,阐述了Web使用挖掘的意义、研究现状以及面临的问题;2.讨论了Web使用挖掘的三个阶段:数据预处理、模式识别和模式分析,分析了Web使用挖掘的应用领域和研究方向;3.为数据预处理的数据采集、数据净化、用户识别和会话识别等部分提供了详细的算法。Web日志数据通过这些算法进行预处理后,为数据仓库的建立提供了可靠的准备数据。4.利用日志分析工具Deep Log Analyzer对经过预处理的日志数据进行分析,得到基本的统计数据及图表。接着分析建立点击流数据仓库的必要性。根据MarkSweiger等提供的标准点击流仓库模型,提出适合实例网站的数据仓库逻辑模型,并在此逻辑模型的基础上,建立相应的物理模型。5.最后将上述的数据预处理算法和数据仓库模型应用在实例网站的访问日志中,然后运用SQL Server 2005 Analysis Service中的Sequence Cluster模型分析数据仓库中的数据,并将分析结果应用于网站结构的调整。
其他文献
针对温室大棚数量众多,使用人工控制温度、湿度成本过高的情况。本文设计了基于CAN现场总线的温室大棚自动测控系统。  基于CAN现场总线的温室大棚自动控制系统由硬件和软件
农药施用后雾滴在田间及作物上的沉积分布状况直接影响到农田灭虫除草的效果,本课题研究的目的就是利用数字图像技术对农药细雾的沉积分布进行研究,得出雾滴在棚室内的沉积分
水稻是我国最主要的粮食作物,在农业生产和粮食安全中具有关键性的作用。白背飞虱[Sogatellafurcifera(Horvath)]是目前影响水稻高产、稳产的主要害虫之一,因此,必须对白背飞
摘 要互动教学旨在充分发挥教育者的主导作用以调动学生学习的积极性,让学生能够自主地参与教学活动,主动思考教学问题,全面提高自身素质。互动教学注重学生参与教育学习的过程,更注重教学过程中学生主体地位的充分发挥。在初中英语教育过程中充分利用互动教学模式可以有效地和谐师生关系,继而实现全面提高教学质量的终极目标。  关键词初中英语;互动教学;主体地位  中图分类号:G632文献标识码:A文章编号:100
随着肉制品需求不断增加,肉类食品安全问题越发受到人们关注。在传统生产模式中,由于信息采集方法落后、各环节信息衔接不畅等问题,导致肉品信息记录与肉品本身无法有效关联,
新型冠状病毒肺炎疫情目前进入大范围传播阶段.作为疫情输入地区,要加强疫情研判,及时调整防控策略,研发操作便捷的诊断试剂盒,广泛开展筛查,早发现、早隔离.实施流人人员分
本文采用消失模铸渗技术在ZG310-570表面制备复合层;采用JSM-5610LV型扫描电子显微镜,H-800型透射电子显微镜,EDAX能谱仪研究了铸渗复合层的显微组织、相结构;利用HVS-1000型数显
复合式衬砌由初期支护、防水层和衬砌组成,是中国现行山岭隧道的主要结构形式,而衬砌是保证隧道长期运营安全的关键.衬砌结构的安全性评价一般根据相关的隧道设计规范进行.现