基于信息熵的改进型支持向量机客户流失预测模型应用研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:dyc56
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
客户流失数据是一类的非平衡数据集,如何有效地对其进行分类学习,其关键是要提高少数类(流失客户)的识别率,少数类是相对多数类而言的一类特殊的子样本,其错分的代价非常高,因此,有效地减少少数类的错分率是一个亟待解决的问题。本文在Veropoulous提出的采用不同惩罚因子数的支持向量机算法基础上,利用样本自身信息熵值来确定不同的惩罚因子,使模型更加倾向于提高少数类的识别精度,并在电信客户流失数据这一非平衡数据集中进行了验证,结果表明该方法较其他方法对流失客户(少数类)的识别率有很大的提高,具有很强的实际应用意
其他文献
现有的关于香文化的研究著述,多为历史脉络梳理或者香的器物使用的概述性简介,而罕有深入探究其中文化动因的成果,尤其是香与人之间的互动关系及其深层含义。在田野调查的现
面对现代科研环境e-Science,知识合作和新知识发现成为严峻的挑战.本文提出了基于共引知识元间语义关联的隐含知识发现方法.该方法将文献单元分解成知识元,以资源描述框架模
为获取中文领域本体的概念提出了基于规则匹配和统计方法相结合的学习模型,充分利用现有的自然语言处理技术和统计学习方法,从领域文本中通过语义串切分、规则匹配、领域归属度
文本情感识别是一个具有广泛应用前景的研究领域,它在信息检索、文本过滤、产品在线跟踪评价、民情民意调查分析、智能教学系统中都有着广泛应用.而汽车情感识别正在成为人们
文章介绍了我国长三角、珠三角等区域科技信息资源共享情况,通过分析湖南省科技信息资源建设现状及区域共享存在的问题,结合现代科技发展对信息需求的特点,阐述了建立科技信息共
传统的知识组织系统评价方式存在缺乏宏观测度,时滞过长,不能动态揭示等缺陷。本文结合复杂网络理论,从基本特性、动态特性和鲁棒性三个角度着手,对汉语科技词系统网络特性进
针对转子系统动静件间发生碰摩时会引起弹性应变而产生声发射,进而可利用声发射来辨识和诊断碰摩故障的特点,首先对碰摩声发射和碰摩振动信号进行了试验对照研究,讨论基于声