基于Web挖掘的智能站点个性化服务的研究

来源 :武汉工程大学 | 被引量 : 0次 | 上传用户:a6231423
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet的迅速发展使得WWW已经深入到社会生活的方方面面,网上的数据资源空前丰富。面对着庞大的信息,如何能够让用户及时地发现有用的信息则变得越来越困难,而对于网站,想及时了解自己组织结构的合理性也变得很困难。   Web是一个无结构的动态的分布式的信息系统,直接对它进行挖掘是困难的。然而,Web服务器的log日志却有着完整的结构。因此我们提出“基于Web挖掘的个性化服务”,就是利用Web挖掘技术从服务器的日志文件中获取用户的访问模式,并根据这种模式对用户或页面进行聚类,挖掘出具有相似访问兴趣的用户或相似页面。运用聚类的结果可以方便地向浏览模式相似的用户组推荐其感兴趣的主题相似的页面,从而实现个性化服务,同时还可以优化站点的组织结构,进而提高网站的服务质量。   本文首先对数据挖掘和Web挖掘进行了概述,重点介绍了Web日志挖掘技术的相关内容。接着较详细地研究了Web日志挖掘中的数据预处理过程,并在此基础上,结合某网站的日志记录对预处理过程进行了详细的描述。   然后研究分析了基于聚类的数据挖掘的基本理论和一般方法,并介绍了模糊聚类理论的应用及研究。由于Web使用挖掘,尤其是Web用户聚类和页面聚类,有着明显的模糊特征,为此,一些学者将模糊聚类应用到其中。本文在分析了已有聚类算法不足的基础上,提出了一种新的模糊矩阵聚类的方法:通过构造一个用户/页面(Use-URL)矩阵来表示用户对页面的访问信息,在变换权值矩阵时不但将用户的访问频度作为参数,还把用户浏览时间长度作为用户兴趣度权值的因素考虑进去,更准确地表征了用户兴趣度大小。通过对模糊矩阵的列向量进行相似性分析可得到相似用户群体,对行向量进行度量得到相关Web页面,对后者做进一步处理还可得到频繁访问路径。通过实验结果表明了算法的有效性。   最后,设计了一个智能网站个性化服务的模型。通过对某网站日志的实践证明,采用这种改进的模糊矩阵聚类算法进行挖掘,并将挖掘结果用于个性化服务的思想是有效的、可行的。
其他文献
由于环境的复杂多变,需求的不确定性,致使实现企业核心业务功能的信息系统的开发和维护都处于一种被动的状态,系统开发和维护人员因此承受了巨大的压力。由于开发人员并不十分精
随着数据库技术的飞速发展及数据库管理系统的广泛应用,数据库不仅在数量上快速增长,规模也越来越大。激增的数据背后隐藏着许多重要的信息,对其进行更高层次的分析,能促进信息的
。 本文就客户管理系统中的几个相关要点:客户维系管理、客户挽留管理和离网客户管理等展开分析论述。较为详细地说明了与要点相关的几个功能模块的结构和需求,以及各个环节
XML(ExtensibleMarkupLanguage)是用于表示Web上数据和文档的通用标记语言,在很短的时间内就获得了广泛的认同,已经成为网络环境下主要数据交换的标准之一。目前大量计算机应用
随着经济信息化和全球化,市场竞争越来越激烈,组织机构要想在竞争中求得生存,就必须设法降低经营成本,快速开发和提供新的产品和服务,为了提高企业竞争力,越来越多的企业开始使用工
近年来,随着第三方物流行业的迅速发展,第三方物流企业间的竞争也日益加剧。如何实施客户策略以便在激烈的市场竞争中立于不败之地,是企业目前最为关注的问题。通过对企业客户进
论文综述了中文文本分类中自动分词、文本表示、特征选取和分类模型几个部分的研究现状和研究方法。每个部分都有多种实现技术,不同的实现方法对分类系统性能的影响也不同。如
本文主要研究了在J2EE平台下基于WEB服务的动态电子商务模型及其相关技术。首先对J2EE及其相关技术进行了深入分析,研究了J2EE的架构、组件、容器以及服务技术,重点介绍了J2EE
随着全球证券市场地发展,借助现代的科技手段,交易方式也在演变,原来由交易员场内撮合或者通过场外电子化交易平台手动下单的方式不能快速捕捉交易机会,因此程序化交易应运而生。
分布式交互应用是允许分散在不同地点的多个参与者能实时进行交互的网络系统,它的交互质量很大程度取决于网络延迟。在大规模分布式交互应用中用户位置的广泛分布通常需要服务