基于电子商务日志的Web使用挖掘研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:wmwanll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的日益普及和电子商务的蓬勃发展,基于电子商务的业务也面临着越来越激烈的竞争。由于电子商务站点可为数据挖掘提供极为丰富的数据源,因而如何运用数据挖掘技术对Web服务器上的日志数据和交易数据进行挖掘,从中抽取感兴趣的模式,以便更好地理解客户的访问行为,或改进站点结构和为客户提供更多的个性化推荐服务,已成为众多商家所关注焦点。因此,开展本研究课题有一定的应用价值和意义。本文首先概述了Web使用挖掘。介绍了日志挖掘技术中两大关键技术一序列模式挖掘和聚类分析,并分析了算法的优缺点,为后面的应用奠定理论基础。接着,详细讨论了Web日志挖掘的数据预处理过程,包括数据净化,用户识别,会话识别,Frame过滤,路径补充等。然后,对传统的矩阵聚类算法进行优化,改进为权值矩阵聚类算法。该算法对用户浏览时间和点击次数两个数据的离散化,来得到加权的URL-UserID访问矩阵,应用该算法分别对客户和页面的聚类分析,对客户的聚类来发现相似的客户群体,挖掘潜在客户,对页面聚类来将内容相关的页面归类;接下来,通过对聚类分析后的每一类用户访问日志分析,发现每一类用户的MFP事务数据库,再利用GSP算法找出每一类用户的频繁访问路径。最后把聚类和序列模式挖掘结果应用到电子商务推荐系统中,并给出一个个性化推荐系统PRS的原型。实验表明改进的权值矩阵聚类算法具有较高准确性和良好扩展性。将挖掘结果应用于个性化推荐系统的思想是有效的、可行的。
其他文献
随着互联网(Internet)的不断发展和日益普及,Internet成为人们不可或缺的信息来源,使得人们可以自由地获取全球范围内的各种信息,但同时也导致了网上信息的爆炸式增长。信息的极
在MIS系统开发中对界面设计提出了越来越高的要求。界面设计通常涉及与数据库的交互,从而要求开发人员具备一定的编码基础和多方面的专业知识。传统的设计模式往往又忽略了其
入侵检测系统评估是入侵检测系统研究领域的一个基本问题。本文在改进网络入侵检测系统的系统能力评估方法、探索新的攻击测试案例生成方法、提高背景流量生成方法的真实性和
学位
机器学习、模式识别、计算机视觉等领域中大多数的研究工作都要依赖于集合上距离度量来展开,例如常见的聚类、分类、检索等问题。因而有关度量学习和流形学习的研究具有重大意
电子商务作为网络时代的产物正在改变人们的思维方式、经济活动方式、工作方式和生活方式。电子商务的高效率、低成本为企业的发展带来了新的机遇,也必将成为未来信息社会商
随着互联网技术的迅猛发展,电子商务平台和以大众点评网为代表的第三方点评网站的出现为用户提供了表达商品使用意见的网络平台,用户的评价和评分记录为其他用户进行商品选择提
视频运动目标分析是计算机视觉领域的一个核心问题,在军事、视频监控、等许多方面有着广泛的应用前景。本文主要针对视频运动目标分析应用于智能交通的场景,重点研究了基于注
学位
微粒群优化算法(PSO)是由Kennedy和Eberhart于1995年提出的一种基于迭代的优化算法,系统初始化为一组随机解,通过某种方式迭代寻找全局最优解。该算法与遗传算法(GA)相比,简