基于随机森林算法的投诉预警模型优化方法

来源 :电力信息与通信技术 | 被引量 : 0次 | 上传用户:xhajxhaj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高基于随机森林算法重复拨打投诉预警模型的效果,文章从数据、指标、参数3个方面对模型进行优化。在数据处理方面,利用SMOTE算法平衡投诉与非投诉比例,一方面防止了模型出现过拟合;另一方面消除了非平衡数据对模型效果的影响。在特征选择方面,使用基尼系数进行特征选择,从而减少数据的噪声,提高模型预测的准确度。在参数调整方面,使用R语言软件对模型决策树数量参数和最大特征参数进行调整,模型最终的OOB误差率为5.03%,准确率和召回率均超过70%。目前投诉预警模型已经进行试点应用,实现了投诉业务的提前识别,通过采用相应服务策略,减少了服务升级事件,降低了客户投诉率,有效提升了客户感知。
其他文献
论文以中、俄两国作家丁玲和阿赫玛托娃为例,从个人主义的角度考察了中、俄两国知识分子在相似的历史时期的人生选择与创作转向,折射出中俄两国知识分子的根本差异:中国知识分子
针对短、中、长距离光纤通信网络中突发故障情况下难以快速、准确地恢复光缆中每条光纤的首尾端序号一一对应的现状,文章设计了一种基于信道编码技术的48路自动对纤测试系统