基于决策树集成和宽度森林的网络流量分析与预测研究

来源 :南京邮电大学 | 被引量 : 8次 | 上传用户:yanxiant
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,新一代移动通信技术得到快速发展,智能手机、平板电脑等移动端智能设备也迅速普及开来,移动通信网络逐渐构成了当今社会必不可少的基础设施之一,不断影响着人类社会生活的各个领域。面对越来越复杂的网络环境和成倍翻升的网络流量数据,网络管理和运营者们需要花费更多的时间和资源监控并分析出实时的网络流量状况,以应对突发的网络拥挤和堵塞,或者及时关闭不需要的基站以节省能耗,确保网络质量良好。一个好的流量预测模型能够使得运营商提前发现网络异常、网络流量爆发等问题,从而保证网络的稳定性、提高网络的服务质量、节省基站的能耗等。鉴于此,本论文基于基站网络流量采集数据,研究了基于决策树集成和宽度森林的网络流量分析与预测算法。本论文的主要研究工作和创新点如下:首先,在数据预处理中,本文针对采集数据中的缺失值采用了填充处理的方式,建立起有效的缺失值填充方案的评估机制。通过对比多种填充方案,最后选择了基于高斯分布的拟合方法填充缺失值。随后完成数据的特征工程,一方面,本文分别基于时空分布和历史流量数据挖掘了流量数据特征,提出了可变周期移动窗口平均法提取历史流量数据的统计特性;另一方面,本文提出了基于随机森林的重要特征选择算法用于提取与流量值变化更为相关的重要特征,从而为后续的流量预测算法建模打下坚实的基础。接着,本文设计了基于决策树集成的基站网络流量预测算法。鉴于轻量梯度提升决策树(LightGBM)算法有着强大的非线性处理能力、快速建模、分布式处理等优点,本文选用了LightGBM算法模型对基站网络流量进行了建模。接着,本文进一步地使用引导聚集算法(Bagging)优化了LightGBM算法,提出了LightGBM-Bagging算法模型,以提升模型的泛化能力。经理论分析,改进后的模型可以在保持决策树总数不变的情况下,有效降低了模型的时间复杂度。实验结果表明,该预测方法与其他预测方法相比,具有更好的预测性能。最后,本文设计了基于宽度森林的流量分析与预测算法。首先,在宽度学习和深度森林的理论基础上,本文将二者结合,提出宽度森林算法,并推导出其构建过程和增量学习过程以及相应的模型结构。接着,本文将宽度森林算法应用于基站网络流量的分析与预测建模分析中。利用宽度森林的特征层森林直接对流量特征的重要性进行评估,筛选出重要特征,并将重要特征输入到增强层森林作进一步训练,最后将两层森林的预测结果组合成矩阵,取矩阵的伪逆得到最终预测结果。实验结果表明,宽度森林算法进一步提高了流量预测的准确度。
其他文献
目的为了解全省2006年中央财政转移支付结核病项目活动及经费使用情况,发现、分析和解决存在的困难和问题,为今后项目更好地实施提供政策依据。方法根据2006年各市县项目实施
多媒体教学作为一种先进的教学手段走进高职英语课堂,显示了它无与伦比的优势。在对媒体网络环境下,各种教学资源将得到更有效的应用,有利于将学生从被动接受知识的模式中解放出
自上世纪七八十年代中国提出“改革开放”的口号后,国家经济实力不断增强,市场化的程度日益提高。在这个时代背景下,大批农村青壮年劳动力开始涌入城市寻求更高的经济收入来
高度凝练的社会主义核心价值观与中华优秀传统文化血脉相融,实现两者的融通互动具有重要价值。但从实践效果看,还存在学校教育对中华优秀传统文化重视不够、历史虚无主义对中
G公司总装车间从现场实际出发,采用了国内少见的"承载与非承载车身车型完全共线生产"即不同平台车型混线生产方式。新总装线投产后顺利兼容投入的新SUV车型(ASX、CR45、帕杰
重庆认真梳理总结了已开通运营线网中存在的诸如资源共享效率不高、运营组织灵活性较差等问题,在轨道交通第二轮规划线路建设之初,提出了互联互通网络化运营理念,希望借此来优化和完善轨道交通运营组织,提升运营服务水平。根据国家发改委2015年6月下发的《关于下达产业转型升级项目(增强制造业核心竞争力)2015年中央预算内投资计划的通知》,正式在重庆轨道交通第二轮规划线路中推进CBTC互联互通示范性项目。目前