论文部分内容阅读
随着科学技术的发展,各种各样的服务和应用接入到互联网,网络中的数据出现了井喷式增长,且增长的数据以视频流量数据为主。边缘网络是指公共网络的边缘,它即减少了业务时延,又卸载了核心网的负载压力,边缘缓存是其关键技术之一。边缘缓存即将部分资源缓存在边缘侧,当与之相关的业务再次到来时,直接从缓存中获取资源即可,无需再从核心网获取。本文需要对大量数据进行分析,而机器学习在数值分析上有很大的优势,因此本文将机器学习用于边缘网络,以VOD视频业务为例,提出边缘网络环境下基于机器学习算法的缓存优化和缓存替换方案,使边缘缓存充分发挥其优势,最大限度的减小业务时延以及减轻核心网的负载,具有较高的理论研究价值和实际应用前景。本文主要工作如下:一、介绍本文的研究背景和研究意义,阐述了国内外关于边缘缓存的部分研究成果和研究现状,并简要概括了本文的组织结构和主要工作。二、简述了机器学习的发展和在大数据时代下机器学习的应用分类,介绍了几种机器学习经典算法。介绍了本文使用的两种机器学习算法,分别是XGBoost和随机森林算法。三、提出基于XGBoost的VOD业务访问量预测及缓存优化算法。首先,对视频信息按照周模型和日模型进行预处理,并对已有特征进行重要性排名,剔除重要性较低的特征;其次对XGBoost算法中的重要参数进行仿真,从而缩小选取范围;接着对视频样本数据进行建模和预测,并提出新的决策因子,即缓存性价比;然后建立缓存优化模型,使用背包算法求解并提出一种快速求解方法;最后进行仿真验证,仿真结果证明了算法预测的准确性和优化算法的有效性。四、提出基于随机森林的VOD业务访问时长预测及缓存替换算法。首先,对视频信息按照周模型和日模型进行预处理,并对已有特征进行重要性排名,剔除重要性较低的特征;其次对随机森林算法中的重要参数进行仿真,从而缩小选取范围;接着对视频样本数据进行建模和预测,并提出新的决策因子,即缓存替换性价比;然后建立缓存替换模型,使用隐枚举法求解并基于本文环境提出一个隐形过滤条件,即单视频替换;最后进行仿真验证,仿真结果证明了算法预测的准确性和替换算法的有效性。五、对本文的研究工作进行总结,并提出了今后的研究方向。