基于时间序列模型的异常话务量分块建模和预测

来源 :中小企业管理与科技·下旬刊 | 被引量 : 0次 | 上传用户:mailabc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】论文主要研究利用大数据挖掘技术及最优化算法,为实现既保证呼叫中心服务质量的同时,又能保证人力资源最优的配置提供预测数据,供95598坐席排班参考,并通过与实际值的对比进行验证,结果显示该项研究具有较高的推广和应用价值。
  【Abstract】The paper mainly studies the use of big data mining technology and optimization algorithm to provide predictive data for the realization of not only guaranteeing the service quality of call center, but also guaranteeing the optimal allocation of human resources. It can provide some reference for the seats scheduling of 95598. Through comparing with the actual value, the results show that the research has high popularization and application value.
  【关键词】时间序列;线性回归;话务预测
  【Keywords】time series; linear regression; traffic forecast
  【中图分类号】TN929.5                                          【文献标志码】A                                            【文章编号】1673-1069(2019)01-0160-02
  1 引言
  在电改的大环境下,随着人们对电力服务质量的要求不断提高,南方电网已经把提供优质的供电服务提升到了发展战略的新高度[1]。但随着业务类型的不断增加,运营规模的壮大,排班问题变成了日常生产管理者头痛的问题。话务量是呼叫中心进行客服坐席安排的依据,根据不同话务量需求以及固定的坐席数量,安排相应的坐席人员,才能实现既保证呼叫中心服务质量的同时,又能保证人力资源最优的配置。传统的排班模式,需要经验丰富的排班师对话务量进行提前估计,人为主观因素影响比较大、工作量较大,且无法确保话务量预测准确度,无法满足实际生产需求。因此,如何对话务量进行科学准确的预测早已成为一个亟待解决的问题。
  话务量是一种随机的、动态的时间序列变化过程,受天气、季节、节假日、电力业务特点等因素的影响,呈现复杂的变化趋势[2]。目前,已有一些预测工具被应用于话务量预测中,比如,自回归移动平均模型、多元线性回归模型、Kalman滤波估计、BP神经网络等,都取得了一定的成果。但所有的模型都是针对常规的话务量进行预测,并未考察和分析异常情况下的话务量预测,在建模过程中只是将话务量异常数据进行剔除或者平滑,并未对异常的话务量数据进行单独建模。
  针对以上不足以及话务量自身的特点,我们提出一種基于异常话务量分块建模的分析思路。将话务量分为异常话务量和正常话务量,再根据各自的规律分别建模。最后为了验证模型的有效性,利用相同的方法对总话务量直接建模,以验证异常话务量分开模型的准确性。
  2 模型建立
  2.1 模型思路
  建模的主要思想是通过异常因子相关性建模方法将总话务量分为异常话务量和正常话务量两个部分。并根据各自的发展趋势和规律,建立不同的预测模型,进而得到异常话务量预测值和正常话务量预测值。异常话务量分块建模的基本步骤:首先,找出异常话务量,确定异常因子。从统计分析和建模角度利用多种异常值检验方法、从呼叫中心话单特征角度利用业务探索方法、从外部学习角度利用文献综述法找出引起异常话务量的原因[3]。其次,确定可分析的异常因子。根据影响因子影响力大小、影响因子数据可得性、影响因子是否可预见、影响因子是否存在特定规律等特征筛选出可进行数据分析和建模的话务量影响因子。第三,拆分话务量并分别进行预测。利用相关性分析和建模,从总话务量中分离出异常因子引起的话务量(异常话务量)和正常话务量两类,再分别利用自回归移动平均模型、支持向量机和BP神经网络模型对异常话务量、正常话务量进行分别建模和预测,总话务量预测值=异常话务量+正常话务量。最后,对比验证。
  2.2 话务量影响因素分析
  从整体来看,可以将话务量影响因素分为以下四大类:一是临时扰动事件。临时扰动因素指的是可以预见但不存在特定规律的事件,比较典型的是不定期的检修活动、临时停电活动、异常恶劣天气等[4]。如果能够预见到类似事件,则一定要预估其作用时间及幅度,并相应的修正话务量。二是特定扰动事件。特定扰动因素是指在可以预见且在一定时间内存在一定规律的异常事件,主要包括以下几类,季度检修引起的计划停电、涉及周末和节假日的特定日期因素、夏季电压负荷相关的特殊时节因素以及自身业务特点相关的电费通知发布、欠费通知发布、停电通知发布、执行停电通知发布等因素。三是临时特定事件。临时特定因素是指不可预见但存在一定规律的异常事件,主要包括以下几类,电网设备衰老、用户计电设备老化、电网运行管理等[5]。四是随机事件。此类事件不可预见也不存在规律,如系统故障、意外故障等随机因素。   根据异常话务量数据分析和建模的要求,按照异常影响因子对话务量的影响程度大小、异常影响因子的数据可得性、数据时间前后统一性等要求,将所有影响因子进行排查,最后确定影响话务量的2类因子:业务特点、异常天气。
  利用各类短信通知数与各业务类型每天的话务量做相关分析,找出与短信通知有显著相关的业务类型,将此业务类型的话务量定义为通知类的异常话务量,剩下的业务类型定义为其他话务量。
  2.3 模型建立
  支持向量机和神经网络建模的基本步骤一样,但其中运用的函数不同[6]。支持向量机是以训练误差作为优化问题的约束条件,以置信范围值最小值作为优化目标。即SVM是一种基于结构风险最小化准则的学习方法,其推广能力明显优于一些传统的学习方法。SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的優势,并能推广应用到函数拟合等其他机器学习问题中[7]。
  3 模型结果
  本次话务预测课题研究共分为两个预测小组,两个预测组根据各自的预测方法,分别对2016年11月14日~12月2日连续三周每周的话务量情况进行预测,并将最终的预测结果进行比对,进一步研究下一步的话务工作的优化提升方案。
  在为期三周的话务量预测中,经计算得出设计院三周的预测精度平均为12.75%,原排班组预测系统的平均预测精度为34.08%。原排班组预测系统的最低预测误差为1.7%, 最高预测误差为105.41%,而设计院预测最高预测误差为52.09%, 最低预测误差为0.17%。由三周话务预测误差对比可知,设计院的话务量预测较为平稳,波动不是很大,且与真实值更接近。
  4 结语
  为验证模型有效性,直接利用自回归模型对总话务量进行建模和预测,将预测结果与分块建模预测结果进行对比[8],同时为了验证模型的实用性,与95598呼叫中心的排班组进行为期三周的预测结果对比。实践证明,异常话务量分块建模比传统话务量预测结果精度更好,且异常话务量分块建模为期三周的预测精度均比目前南方电网排班组的预测结果精度更高,未来可进一步落地实现,具有较高的推广和应用价值。
  【参考文献】
  【1】胡宪华,吴捷. 基于时间序列的移动通信话务预测[D].广州:华南理工大学,2006.
  【2】张昊.电力调度自动化系统及电力负荷智能化预测方法的研究[D].广州:华南理工大学,1997.
  【3】胡波,李磊.含野值的中长期话务数据分析方法研究[J].武汉水利电力大学学报,2000(6):33.
  【4】程伟.基于季节变动模型的话务量预测[J].电信技术,2000(10):25-27.
  【5】胡毅,李磊.改进自回归算法在电信话务量预测中的应用[J].计算机工程与应用,2001(3):79-82.
  【6】邓聚龙.灰色预测预决策[M].武汉:华中理工大学出版社,1986.
  【7】谢开贵,周家启.变权组合预测模型研究[J].系统工程理论与实践,2000(27):7.
  【8】任君明.基于数据挖掘技术的移动通信话务预测模型[J].电信工程技术与标准化,2015(6):79-82.
其他文献
【摘 要】随着人工智能和大数据时代的到来,各种数据都变得越来越重要。新浪微博作为国内最大的社交平台之一,因为其拥有大量用户,每天都产生着庞大的数据,所以如何快速获取到这些数据并实现结构化的存储以便后续利用是一个挑战。论文对微博网页端平台进行分析,选用Scrapy框架和Requests、Selenium等工具,提出了对微博数据进行抓取的高可行性方案,该方案能够实现多用户同时抓取,获得微博用户的关系数
环境保护是全球每一个国家、每一个地区、每一个人都应参与的事业。随着环境破坏问题越来越受到重视,人类越来越意识到环境保护的重要性,各国也逐渐加大投入探索污染治理的技
【摘 要】论文从辙叉间隔铁的结构特性和加工要求入手,以辙叉叉心在加工过程中的定位、装夹、稳定性及加工空间等因素作为要点研究并设计了间隔铁加工专用胎型,新设计具有以下特点:首先,胎型采用以心轨的工作边(加工和测量基准)做为定位基准,减小了定位的累计误差;其次,在装夹上采用翻转和旋转等压紧方式,提高了辙叉心轨的装卸效率;再次,压板的样式采用全断面接触式设计,避免了加工过程中辙叉心轨产生位移,提高了心轨
【摘 要】论文利用2002-2017年中关村示范区11个高新技术产业投入产出的面板数据,应用DEA-Malmquist指数法测算了中关村示范区各高新技术产业的全要素生产率增长。通过实证分析得出结论:中关村示范区各高新技术产业的全要素生产率增长不容乐观,但整体技术水平还有着较大的上升空间;中关村示范区各高新技术产业的全要素生产率水平存在着差异,还须继续提高技术进步率。  【Abstract】 Bas
煤矿开采过程中对于顶板岩层、主采煤层、煤层底板岩层都具备较软性质时就可以将其称为是“三软”煤层,此类煤层是软弱岩层煤层裂隙发育,整体构造相对复杂,论文对“三软”煤
论文分析了海南海岛地区港口电气设备在高温、高湿、高盐雾的环境下的使用情况,分析了环境对港口电气设备运行的影响及电气设备设计上的要求,并从“三防”设计及工艺措施、电
【摘 要】随着经济的快速发展,能源需求持续增加,必须引起相关人员的高度重视。针对于石油而言,传统自动化仪表装置已经无法满足实际需求,要加大技术创新才能取得更好的效果。论文先介绍基本内容,再论述具体应用,最后对未来进行展望,从而促进石油产业的更好发展。  【关键词】仪表与自动化技术;石油管道;应用;发展趋势  【Keywords】instrumentation and automation tech
【摘 要】管道泄漏检测技术是保障管道安全生产的重要手段。论文总结了目前国内外常见的检漏技术,以高含硫天然气集输管道为例,在灵敏度、可靠性、准确性等方面进行对比分析,为高含硫集输管道检漏方案的选择提供借鉴。  【Abstract】Pipeline leak detection technology is an important means to ensure safe production of
随着科学技术的不断发展与进步,虚拟现实技术应运而生。由于虚拟现实技术具有自身独特的优势,因此在环境设计中得以广泛的应用,并给环境设计带来了革命性变化。论文首先对虚
【摘 要】论文就当前企业内部的专用铁路运输进行了形势分析,分析了铁路运输在危化品运输方面的优劣势,面临的发展机遇和挑战,进而得出了铁路运输发展形势良好、需要根据企业生产经营实际情况调整运输策略的结论,以促进企业的持续发展。  【Abstract】The paper analyzes the current situation of dedicated railway transportation