论文部分内容阅读
数据挖掘是数据库最活跃的领域之一。由于其广泛的应用背景和现实意义,数据挖掘技术的研究和应用都获得了突飞猛进的发展,在国内外的学术界和信息产业界备受关注。 数据挖掘是从大量数据中发现人们感兴趣的、隐藏的、先前未知的知识。数据挖掘技术主要研究结构化的数据挖掘,而Web数据的挖掘是应用于Internet的技术研究,是从半结构或无结构的Web页面中,抽取感兴趣的、潜在的模式。尽管Internet是一个半结构化的系统,很难对它进行处理,但是Web服务器日志记录具有良好的结构,非常有利于数据挖掘的进行。此外,Web日志挖掘是Web使用挖掘的一个分支,它作为Web挖掘的一个重要组成部分,具有独特的理论和实践意义。 本文系统地阐述了从数据挖掘、Web数据挖掘到Web日志挖掘整个过程,重点讨论Web日志的挖掘上。通过对基于Web日志的数据挖掘的讨论,说明如何进行Web日志挖掘及在Web日志挖掘中应采取的数据挖掘技术;然后将Web日志挖掘技术应用到商丘信息港网站,对其Web服务器的日志记录进行挖掘,建立一个Web日志挖掘系统。网络管理人员可以根据Web日志的分析结果改进网站的设计,实现网站的有效管理,保证网络的安全。最后对本文进行总结,并提出进一步的研究方向和将要做的工作。