数据挖掘中决策树算法在客户流失中的应用研究

被引量 : 0次 | 上传用户:sprock
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从大量的数据中抽取出潜在的、不为人知的有用信息、模式和趋势。其目的是提高市场决策能力、检测异常模式、在过去的经验基础上预言未来趋势等等。它致力于数据分析和理解、揭示数据内部蕴藏知识的技术,已成为未来信息技术应用的重要目标之一。经过20多年的发展,数据挖掘产生了许多新概念和方法。特别是最近几年,一些基本概念和方法趋于清晰,它的研究正向着更深入的方向发展。 分类模式挖掘是数据挖掘中的一种非常重要的方法,可以应用于数据预测,可划为决策树学习、贝叶斯分类、遗传算法和粗糙集等等。决策树学习是以实例为基础的归纳学习算法。它着眼于从一组无次序、无规则的事例中推理出决策树表示形式的分类规则。它采用自顶向下的递归方式,在决策树的内部结点进行属性值的比较并根据不同的属性值判断从该结点向下的分支,在决策树的叶结点得到结论。 本文主要是研究数据挖掘中的决策树算法以及决策树算法在具体的小灵通流失分析中的研究与分析。首先对数据挖掘技术的产生和发展现状做了概括性的阐述,介绍了数据挖掘的概念、主要内容、模式和主要问题,以及数据挖掘的应用和发展;接着对数据挖掘中的决策树技术做了详细的描述,介绍了决策树中的经典挖掘算法ID3算法,在分析和总结了ID3,C4.5算法的基本性质、性能和特点的基础上,本文作者对经典的C4.5算法进行了一些改进,并分析了改进后的特点和效果。最后,针对电信业小灵通客户流失的问题,通过数据挖掘技术在大量的历史数据中进行挖掘分析,使用SAS等工具,结合ID3、C4.5以及改进后的C4.5算法对样本集进行分析和比对,进行客户细分,挖掘出不同客户群的业务特征,向公司建议,针对流失倾向较高的群体,并结合这些客户对应的客户群特征,采取有针对性的客户挽留策略。在理论知识商业化应用方面,本论文进行了一次有意义的探索和尝试。
其他文献
<正> 深圳经济特区在我国特区中面积最大,创办最早,发展最快,因而也最具有代表性。本文以深圳特区为分析对象,把着眼点放在目前特区经济存在的问题上,试图对经济特区在对外开
贵广高铁是我国西南地区通往珠三角的大动脉,对疏通西南地区至珠三角交通压力具有无法替代的作用,贵广高铁的开通,实现了从江县高速铁路时代的到来,其开通运营拓展了从江旅游
自20世纪80年代特别是90年代以来,我国学术界出现了大量研究贫困大学生心理的文献,这些文献揭示出经济贫困使一些大学生产生了“心理贫困”、“精神贫困”,贫困大学生与非贫困大
世界已经跨入21世纪,随着经济、科技社会的激烈变革,国民素质日益成为各国在国际竞争中拉开距离的重要原因,成为各国综合国力中的一个核心因素。就我国现实来看,要实现经济社会的
近年来,互联网金融异军突起,正日益成为正规金融体系的补充,引起社会各界的广泛关注。互联网金融在发展的同时也出现了风险、监管等问题,造成金融安全隐患。从当今互联网金融
虚拟仪器技术是计算机技术与仪器技术相结合的产物,代表了仪器的最新发展方向,它把传统仪器中的某些硬件乃至整个仪器都用计算机软件替代,这样不仅可以节省硬件开支,而且缩短了研
杂交鹅掌楸(Liriodendron chinense×L.tulipifera)作为重要的园林绿化和用材树种,近年来广泛受到重视。本文研究了杂交鹅掌楸不同无性系人工淹水胁迫下外观形态、抗逆境有关生理
广场舞作为锻炼身体的一种广泛而通俗的形式,逐渐成为一种喜闻乐见的运动方式而风靡于各大广场、大街小巷,对人们的日常生活产生了深远持久、潜移默化的影响。在20世纪90年代
随着社会信息化程度的不断提高,人们愈来愈重视E-Learning的效果和效率。学习(内容)管理系统的广泛应用,一方面是E-Learning最新进展的标志;另一方面它进一步推动了E-Learning的
延安文学自诞生之日起,一直是中国现代文学界关注的焦点。已有的研究,无论是王瑶、唐弢为代表的经典著述,还是近二十年来“重写”的文学史论述,多以毛泽东发表《在延安文艺座谈会