论文部分内容阅读
在当今汽车市场激烈竞争的格局之下,传统的营销模式正面临着越来越大的挑战,因此充分利用商务智能技术对大量数据进行整合、针对营销主题进行重新构建,为企业管理层提供多维业务数据分析,并通过大规模的数据挖掘技术为营销决策过程提供信息支持,已成为汽车营销管理的发展趋势。本文利用数据挖掘技术进行客户流失行为预测,是客户关系管理在商务智能方面的一个典型应用案例,以解决企业客户分析、营销预测等具体问题。因此,本文具有很高的市场价值,同时对于数据挖掘技术的方法研究也具有一定的理论价值。本质上,客户流失问题可定性为数据挖掘中的分类与预测问题。本文针对某企业的汽车销售和维修历史记录表,首先在商业理解的基础上对数据进行预处理,然后根据数据不平衡的特点,提出了一种偏袒性集成学习方法,并且将该方法通过与其他算法在25组UCI数据集上应用结果对比验证了其有效性,最后本文设计了针对解决三分类不平衡数据的两层结构,成功将偏袒性集成方法应用于该模型。该模型以05~08年客户的信息为训练样本,预测09年本地个人客户的流失情况。第一层偏袒性集成分类器采用决策树算法作为基分类器,分离出未流失客户;第二层采用支持向量机算法将已流失客户和准流失客户分类。最后本文根据由混合矩阵定义的确认流失准确率以及损失因子来评估该模型,通过与单层的分类算法和两层的其他分类算法在该模型上的应用效果比较,可以证明本文提出的偏袒性集成方法和两层分类结构在该模型上具有非常好的应用效果。本文将数据挖掘理论技术与实际应用相结合,建立了效果良好的汽车客户流失预警模型,该模型对于企业客户流失分析意义重大。同时,本文提出的偏袒性集成学习算法以及两层分类结构对于多分类的不平衡学习也有非常大的理论研究价值。