论文部分内容阅读
客户群分析是分析型客户关系管理中最重要、最核心的问题之一。本文从客户群分析过程的全生命周期出发,运用数据挖掘方法,针对客户群分析各个阶段对数据挖掘算法的特殊需求,提出了新的数据挖掘算法并且提取新的数据挖掘问题,以满足客户群分析的应用需求。主要研究工作包括以下几个方面: 1.针对客户分群问题对聚类分析算法的特殊需求,从聚类集成的角度定义了聚类问题的优化目标函数,提出了一种基于聚类集成的多目标聚类分析框架,并在此框架下提出了一个启发式的聚类算法,进行快速有效的聚类分析。提出的框架和算法的特点主要体现在:1)能够处理混合数据,2)能够处理具有不同权重的属性以及3)能够进行多目标分析。上述特点有效的满足客户分群的应用需求,弥补了现有的聚类分析算法的不足。最后,实验结果表明提出的算法优于已有的同类算法,同时验证了算法在实际客户分群应用中的可行性和有效性。 2.针对客户群特性分析问题,研究了基于关联分析的客户群特性分析方法。具体而言,用统计关联替代传统的关联规则,研究了以皮尔森关联系数为相关性度量的强相关项目对的挖掘问题,提出了一个高效的挖掘算法-Tcp算法。此外,提出了一个新的数据挖掘研究问题:Top-k强相关项目对的挖掘问题,Top-k强相关项目对的挖掘结果比基于相关阈值的挖掘结果更有实际意义。在Tcp算法的基础上,提出了一个名为Tkcp的Top-k强相关项目对挖掘算法。实验结果证明了Tcp算法和Tkcp算法的优越性,实证结果表明了提出的算法在客户群特性分析应用中是行之有效的。 3.针对客户群转移分析问题的实际应用需求,扩展了离群点的概念,提出了一个新的数据挖掘问题-类别离群点挖掘。详细论述了类别离群点的概念和分类,提出了两个有效的挖掘算法并且讨论了如何在客户群转移分析中进行应用。分析表明,基于类别离群点挖掘的客户转移分析方法,能够有效的解决客户群转移分析中存在的训练数据集不完备和样本不均衡的问题。潜在客户分析的实验结果证明了该方法在客户群转移分析中较其他方法的优越性,实际企业客户流失分析的分析结果验证了新方法的实用价值。 4.针对面向客户群价值提升的动作规则挖掘问题,从归纳学习的角度,首次对动作规则的概念和研究问题给出了确切的形式化描述,从而使其成为一个新的数据挖掘研究问题,并给出了行之有效的算法。客户数据集上的实验结果验证了提出的定义和算法的有效性和优越性。 5.以供应链中的客户群分析问题为例,设计了一个实用的系统,利用数据挖掘技术进行客户群分析,从而优化供应链系统的性能。特别地,介绍了完成这个任务的C2S系统。最后,给出一个完整的应用案例,验证了本文方法理论。