基于Logistic回归模型的车险续保率研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:opentv2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:中国目前的车险费率制度,大多数符合“从车主义”,即车险保费多少,主要取决于这辆车本身的各项情况,如车的购置价、座位数、排量、购车年限、上年理赔次数等。该文通过对收集到的数据进行量化处理,运用层次聚类法对量化后的数据进行分析,结合欧氏距离公式与相似系数,即可得到聚类图和垂直冰状图,从而近似得出用户的精准画像。因客户是否续保,服从二项分布,所以可用SPSS构建二项分类Logistic回归模型,并通过回归分析,求出续保率的回归方程,从而实现对续保率的预测。
  关键词:层次聚类法;Logistic回归模型;SPSS;精准画像
  中图分类号:TP311 文献标识码:A
  文章编号:1009-3044(2020)13-0286-02
  1研究背景
  随着社会经济的不断发展,人民的生活水平也在逐步提高,伴随着而来的是汽车数量在逐年攀升,与此同时,人们还想给自己的生命安全买个“保险”,于是便带动了汽车保险行业的发展,其发展形势正在吸引越来越多的关注。对于汽车保险行业来说,如何吸引更多的车主前来投保并且留住老客户已经成了车险行业的一大难题。信息时代的到来,为车险企业提供了一个更加有力的武器,可以通过数字化技术来更加精准地了解客户,提前预测客户的续保率,并制定相应的营销和服务方案。
  2问题分析
  关于车险续保率的问题,需要建立数学模型进行求解。通过对数据的分析,可知影响客户续保的决策因素有很多,比如新车购置价,车龄,NCD等都会影响客户的决定。首先要对客户进行精准画像,将所有可能的影响因素进行归类,然后将这些因素作为是否续保的一个判断依据。但是,经过观察数据之后,我们发现,影响因素过多,因此,我们选择采用层次聚类法进行精准画像,对不同层次的数据集进行划分。然后对各个影响因素进行量化处理,使复杂的数据简单化。再通过建立Lo-gistic模型,进行回归分析,得到每个影响因素的权重,把权重带入回归方程就可以得出續保率的函数方程。通过对续保率的求解,可以对客户是否续保进行预测。
  3续保率
  为了方便模型的求解,需要先将收集到的数据全部进行量化处理,如渠道,续保年,使用性质等,运用SPSS对数据进行量化处理。接着把量化后的数据值带入原始数据表,得到量化后的变量因素表,完成对原始数据的归一化处理。通过量化数据可以大大简化续保率的复杂程度,使得模型求解更加简便。
  数据量化后,就可以采用层次聚类法来分析,将联系紧密的变量归为一类,作为用户画像的一个衡量标准。先把n个样品看成n类,然后把性质最类似的两类归为一类,这样总量就变为n-1类,继续寻找性质最类似的一类,再合并,直到把所有的变量都聚为一类,从而建立层次聚类模型。在层次聚类中,聚类统计量是指能反映样品或者变量之间性质的统计量。这里采用的聚类统计量为距离和相似系数。
  1)距离:主要用于对样品的聚类。常用的距离有马氏距离、绝对值距离和欧式距离,这里选取欧式距离来计算。对于任意两个样品a,b,欧氏距离公式为:
  其中的βo是常数项,也称为截距。βi为回归方程所对应的的偏回归系数。
  2)优势比
  指事件发生的概率(Pi)与事件不发生的概率(1-Pi)的比值,又称为OR值。其中OR值和EXP值是作为衡量权重大小的重要因素。
  3)sig值
  又称作P值,作为衡量自变量与应变量是否具有显著相关性的因素。所得因素,只要sig值小于或等于0.05,即可被认为有显著影响。反之,则不被考虑到影响因素中。
  4)标准回归系数
  因为不同的变量其衡量单位可能不同,所以不能直接采用偏回归系数的绝对值来比较权重的大小,而要使用标准回归系数。但构建回归模型的时候还得通过偏回归系数βi计算出标准回归系数。
  如表1所示,将部分量化后的数据导入SPSS中。根据自变量所对应的Logistic回归方程,选用SPSS软件中的二元Logistic回归方式,得到判断模型正确率的分类表和判断显著性因素与求解回归方程系数的变量表。
  从表1中的分类表可以看出回归模型的正确率为99.6%。根据EXP值,可以得到上述九个影响因素的权重。权重从大到小的顺序是:续保年
其他文献
德纳展览有限公司在金融危机的非常时期,根据行业实际,对广州国际鞋展的举办时间作出了战略性的调整,那么,经过时间调整后的广州国际鞋展将奉献出怎样的一个鞋业盛宴来实现打造专
实验室间能力比对作为重要的外部质量评价手段,被越来越多的实验室所采用,它不仅是质量控制的一种有效方法,也是衡量各实验室间能力的一个重要手段.而半导体器件静态直流参数
摘要:随着传感器技术以及无线通信网络的快速发展,国内外对传感器网络的研究日新月异,本文首先介绍无限传感器网络的定义与特征,其次介绍无线传感器网络现阶段在军事、科研、森林系统、医疗方面主要应用,并对无线传感器网络应用过程中出现主要问题进行分析,最后阐述了不同的改进算法,并描绘了WSN技术发展的美好未来。  关键词:无线传感器;网络  中图分类号:TP311 文献标识码:A  文章编号:1009-30
摘要:时代在科学技术的推移下发生着翻天覆地的变化,大数据时代的到来越来越显示出信息技术在我们日常生活中的重要性,从一开始少部分人的使用到现在渗透到我们生活中的方方面面,为我们的生活学习工作等各个方面带来了诸多便宜,这都是曾经所不敢想象的,原来只能在影视作品中看到的应用技术正慢慢进入我们每个人的生活中。同时在计算机网络技术的发展过程中,其也在一些方面计算机网络技术逐渐加入了人工智能。人工智能的出现,
传统的建筑面积分摊计算基于二维CAD图形进行,该方法工作量大,容易出错.参数化的建筑信息模型(BIM)中参数属性与几何模型相互对应,为建筑模型的分析计算奠定了良好的基础.本
针对贷款欺诈问题,该文使用随机森林对真实信用卡贷款数据进行特征排序,采用逻辑斯特回归构建信用卡反欺诈预测模型,训练获得的模型正确率较高,可应用于贷款欺诈预测系统中。
摘要:传统铁路运行过程中,线路异物侵限时,列车不具备列车自动防护功能,由司机人工驾驶行车,采用混合行车路权方式,因此存在一定的安全隐患。为了防止列车前方出现障碍物或者前后车之间的距离不足时发生撞击事故,特别在大雾和雾霾天气,为了保证行车的安全,车载信号系统必须具备防撞功能。本文对车载防撞系统的关键技术进行了分析,提出了可行的解决方案,进一步提高了行车的安全性。  关键词:列车;防撞;定位;毫米波雷