基于XML的Web日志挖掘技术研究

来源 :华北电力大学(保定) 华北电力大学 | 被引量 : 0次 | 上传用户:crylion
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网技术的迅速发展和不断的普及。Web日志资源越来越丰富,如何充分利用这些资源,从中提取到用户所感兴趣的信息数据,是当前计算机领域的一大挑战。Web日志挖掘就是利用数据挖掘的思想对经过处理的服务器日志进行挖掘。本文在研究了数据挖掘的基础上,重点研究了Web日志挖掘的特点、方法和相关的技术。讨论了Web日志预处理的一系列过程及预处理的实现方法。并对现有的预处理的相应算法进行了有效改进。实现了分割日志数据为单独的用户和用户会话过程。有效的利用中粒度法将XML形式的Web日志数据转换到关系数据库中。本文深入研究了关联规则和频繁路径模式的特点,结合两者的优点。改进了关联规则的AprioriTid算法。
其他文献
本文主要探讨了坦克战模拟系统设计和实现。详细介绍用于辅助本系统实现的3个邻节点计算算法,它提高了A*算法效率。同时研究了改进的MVC设计模式,并就基于MVC的坦克战模拟系
机器博弈是人工智能领域一个既古老又具有挑战的问题,为人工智能成果的验证提供了一个良好的平台。非完美信息博弈问题是机器博弈问题的一个重要的分支,由于这类博弈问题具有
医学超声图像的三维重建是医学数据三维可视化研究的主要内容,也是科学计算可视化研究的一个重要分支,具有实时性、无损性、廉价性、可重复性好、灵敏度高等优点。本文通过对大
作为移动计算、移动商务和信息电器的核心技术,嵌入式数据库管理系统是最近几年才兴起的一项新的数据管理技术。嵌入式数据库以目前成熟的数据库技术为基础,针对具体的嵌入式
煤炭是我国重要的能源资源,随着国家对煤矿安全生产工作的日益重视,以及矿务局自身现代化管理的需求,煤矿安全监测系统越来越体现出其重要性。本文针对煤矿井下监控的实际情况,对
下一代网络(NGN,Next Generation Network),是传统的公用交换电话网(PSTN,Public Switched Telephone Network)和基于IP的分组网络融合的产物,它能够提供语音、视频、数据等多种
虚拟心脏是指将现代计算机科学领域的新理论、新方法和新技术应用于人体心脏生理学研究中,通过建立细胞、组织和器官等各级生理学对象的数学定量模型,来描述生理学中各种复杂
学位
应用AOP技术的基于角色权限控制系统的设计与实现访问控制(Access Contr01)是通过某种途径显式地准许或限制访问能力及范围的一种方法。90年代以来出现的基于角.色的访问控制(
随着计算机系统的广泛应用,网络安全问题变得日益重要。同时,在军事上网络战必将成为未来信息战场上新的作战方式,而网络攻击技术则是网络战不可或缺的武器。研究网络攻击技