论文部分内容阅读
随着计算机的普及、大容量存储技术的发展,人们在日常事务处理和科学研究中积累了大量的各种类型的数据。这些历史数据背后蕴藏了对决策有重要参考价值的信息,如何充分、有效利用这些历史数据是目前人们关注的问题。数据仓库、联机分析处理和数据挖掘技术已经成为解决“数据爆炸、知识贫乏”问题的有效途径。可视化技术能为数据挖掘提供直观的数据输入、结果输出和挖掘过程的交互探索分析手段,可以在人的感知力、洞察力、判断力参与下提供数据挖掘手段,实现可视化辅助挖掘手段以及挖掘结果的可视化。可视化挖掘手段易于从纷繁复杂的变量关系中理清头绪,找到关键变量;挖掘结果的可视化最终呈现给用户一个直观、易于理解的结果,有力地提高数据挖掘进程的效率和结果的可信度。可视化与数据挖掘的结合已成为必然。如何将数据仓库及数据挖掘的相关技术应用于制造业客户关系管理,是目前制造行业迫切需要研究的领域。该领域包括基于数据仓库的在线分析和数据挖掘关键技术的研究,分析型CRM系统的实现,更加有效挖掘算法的设计和应用以及OLAM可视化等方面。本文探讨了制造行业的客户关系管理系统实施过程中的若干关键技术,同时对客户关系管理的OLAM技术及其可视化实现进行了研究,开发了基于OLAM的客户分析挖掘原型系统。论文研究了数据挖掘(DM)和在线分析(OLAP)结合的OLAM理论,讨论了分析型客户关系管理的核心技术,对某制造业业务分析后构建了客户分析的各主题数据仓库,为进一步分析客户数据、挖掘客户产品销售规律,科学的进行客户细分打下了基础。采用相应算法研究了客户细分的三大指标客户终生价值,客户忠诚度和客户资信的计算;(1)分析客户终生价值的构成,研究考虑支出分配的客户终生价值模型,分析该模型的影响因素;根据客户购买转移的“无后效性”,提出用马尔可夫链研究客户转移矩阵的计算思路,结合案例定量分析了客户支出分配变化对客户终生价值的影响。(2)研究客户忠诚的相关理论,建立预测客户忠诚度的指标体系;鉴于客户忠诚计算的复杂性,作者提出采用模糊神经网络算法预测客户忠诚度;为了保证模型训练效率,提出将属性重要性理论用于模糊神经网络初始权重确定的思路,实验证明有明显效果。(3)研究模糊综合评价法的理论,并将其应用于企业客户、个人客户的资信评价中,建立了两类客户的资信计算指标体系,用优化选择法确定了各指标权重,利用模糊理论确定影响客户资信的指标隶属度,通过软件实现了客户的资信计算。作者提出一种基于客户终生价值、客户忠诚度、客户资信综合因素相结合的CLV/CL/CC客户细分模型,在对各因素指标预测计算基础上,利用K-means2算法进行聚类,并将聚类的结果簇作为加权贝叶斯算法进行客户分类预测的前一步,将两种算法优势互补,有效实现了客户细分,提高了客户分类判别的精度。客户产品销售的购物篮挖掘及在线分析是目前研究的热点之一。论文研究了基于关联规则的OLAM及其多维可视化的若干关键技术,对产品销售的数据进行了序列关联分析并将其可视化,剖析了销售产品之间的关联规律,为企业的促销策略等决策支持提供依据。对产品销售额、订单量等交易数据通过多维度多层次的上卷、下钻、横切、纵切等在线分析,以可视化、可理解的方式剖析了深层的客户属性因素。在全文研究的基础上,将所得结论结合某企业的产品销售,设计并实现了一个基于数据仓库的联机客户分析挖掘系统,将上述的分析模块和算法模型集成到系统中,实现客户的终生价值、资信计算及客户忠诚度预测,对客户进行细分、深入分析产品销售规律,并能实现OLAM的可视化分析。作为一个工具平台,为进一步管理及研究客户提供了有力的支持,为这些领域的分析人员提供了有力的决策支持手段。