面向客户群分析的数据挖掘技术

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:greenranqingiqng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
客户群分析是分析型客户关系管理中最重要、最核心的问题之一。本文从客户群分析过程的全生命周期出发,运用数据挖掘方法,针对客户群分析各个阶段对数据挖掘算法的特殊需求,提出了新的数据挖掘算法并且提取新的数据挖掘问题,以满足客户群分析的应用需求。主要研究工作包括以下几个方面:  1.针对客户分群问题对聚类分析算法的特殊需求,从聚类集成的角度定义了聚类问题的优化目标函数,提出了一种基于聚类集成的多目标聚类分析框架,并在此框架下提出了一个启发式的聚类算法,进行快速有效的聚类分析。提出的框架和算法的特点主要体现在:1)能够处理混合数据,2)能够处理具有不同权重的属性以及3)能够进行多目标分析。上述特点有效的满足客户分群的应用需求,弥补了现有的聚类分析算法的不足。最后,实验结果表明提出的算法优于已有的同类算法,同时验证了算法在实际客户分群应用中的可行性和有效性。  2.针对客户群特性分析问题,研究了基于关联分析的客户群特性分析方法。具体而言,用统计关联替代传统的关联规则,研究了以皮尔森关联系数为相关性度量的强相关项目对的挖掘问题,提出了一个高效的挖掘算法-Tcp算法。此外,提出了一个新的数据挖掘研究问题:Top-k强相关项目对的挖掘问题,Top-k强相关项目对的挖掘结果比基于相关阈值的挖掘结果更有实际意义。在Tcp算法的基础上,提出了一个名为Tkcp的Top-k强相关项目对挖掘算法。实验结果证明了Tcp算法和Tkcp算法的优越性,实证结果表明了提出的算法在客户群特性分析应用中是行之有效的。  3.针对客户群转移分析问题的实际应用需求,扩展了离群点的概念,提出了一个新的数据挖掘问题-类别离群点挖掘。详细论述了类别离群点的概念和分类,提出了两个有效的挖掘算法并且讨论了如何在客户群转移分析中进行应用。分析表明,基于类别离群点挖掘的客户转移分析方法,能够有效的解决客户群转移分析中存在的训练数据集不完备和样本不均衡的问题。潜在客户分析的实验结果证明了该方法在客户群转移分析中较其他方法的优越性,实际企业客户流失分析的分析结果验证了新方法的实用价值。  4.针对面向客户群价值提升的动作规则挖掘问题,从归纳学习的角度,首次对动作规则的概念和研究问题给出了确切的形式化描述,从而使其成为一个新的数据挖掘研究问题,并给出了行之有效的算法。客户数据集上的实验结果验证了提出的定义和算法的有效性和优越性。  5.以供应链中的客户群分析问题为例,设计了一个实用的系统,利用数据挖掘技术进行客户群分析,从而优化供应链系统的性能。特别地,介绍了完成这个任务的C2S系统。最后,给出一个完整的应用案例,验证了本文方法理论。
其他文献
本课题的任务是为LX-1164 CPU设计相应的总线控制器,对于CPU方向设计支持多处理器并行运算的前端总线;对于外设方向将支持Samsung DDR内存芯片。在本设计中采用了WishBone总
移动计算时代,Wi-Fi等无线接入网络的逐渐成熟,移动终端设备功能的迅速强大,使得P2P网络通信在移动环境中的应用遇到了诸多问题。无线数据广播技术能够有效地解决移动网络通信的
纹理采用任意变化的重复图案描述广泛变化的自然现象。计算机图形学的目标之一就是实现真实感的绘制,因此纹理起着十分重要的作用。但是纹理的多样性使得在一个通用框架下描
近年来,Internet迅猛发展,已遍及到社会的各个领域。但是Internet在带给人们极大便利的同时,也充斥着许多不安全隐患。为了安全的使用网络,需要有平台运行防火墙、入侵检测等程序
数据挖掘是目前数据库和决策支持领域的最前沿的研究领域之一。而粗集方法是数据挖掘中的一个重要方法。入侵检测系统(IDS)是一种从计算机网络或者计算机系统中收集信息并分
本文首先简要介绍了微控制器调试的发展和当前常见的微控制器调试方式,以及Freescale8位微控制器对于调试的支持;然后进行监控程序的总体设计;然后以MC68HC908AP64为目标微控制
为提高分布式系统的可用性,研究者大都在系统中引入冗余,组通信技术是应用最广的一种空间冗余技术,是分布式系统的一个重要研究领域。 组通信中的主动复制技术和被动复制
联机手写字符的采集是指运用字符手写输入设备对规定字符进行采集,字符采集实际上是采集字符书写轨迹的坐标,然后将这些字符书写轨迹的坐标的信息转化为字符内码的过程。随着
Peer-to-Peer(P2P)作为以文件共享为初始目的的应用,允许任意终端用户对等体(Peer)间通过Internet完成文件交换。在P2P应用仅有的短短几年发展时间里,它已成为了占用Internet流
随着信息技术的发展及其在金融、交通、军事、生态环境检测、Web等领域的应用日益深入,海量数据大量涌现,向数据库研究者提出了新的挑战。存储介质的价格/容量比的迅速下降以及