论文部分内容阅读
在各项因素中,网络流量的预测对于蜂窝网络的优化有着重要的潜在意义。研究表明,当网络中流量的组成不同时,网络表现也会有明显的变化。结合对用户使用业务特征的研究,网络运营商能够找到更好的改善网络表现的途径。在未来的网络中,需要预测用户业务使用行为的部分,指导网络资源的分配,在这个需求下,对于现有预测方法的研究就变成了亟需。在之前的研究中,很多文献探究过用户使用业务的情况,一系列预测方法也曾应用在用户使用业务的预测上,比如线性回归模型、ARAM回归模型、马尔科夫链以及人工神经网络等。随着这些预测方法的演进,流量和业务使用情况的预测精度越来越高,但是人类行为的不确定性仍然是存在的,观测者无法完全获知被观测者的动机和计划,所以也不可能做到预测的绝对准确,那么用户业务使用情况到底可以预测到什么程度呢?本篇论文将主要以熵理论对手机用户使用业务的可预测性进行研究,通过已有移动用户业务使用数据计算其可预测程度。另外还会对移动用户的个人的业务和流量使用行为进行了分析,探寻用户使用不同业务的模式和流量组成情况。首先,本文会介绍当前的互联网存在的问题,以及未来网络中添加预测平台的必要性。其次,本文会介绍用户网络行为的定义、分类和特征,介绍用户行为研究的研究现状和方法论。接着介绍了研究用户网络行为时间序列的预测问题,及其可以使用的预测算法的研究现状。然后,本文会使用熵的方式来分析移动互联网业务的可预测性。将基于已有的移动互联网海量历史数据,寻找用户在历史一段时间内使用业务的记录,计算用户使用各种业务的总数,以此为依据计算用户使用业务的随机熵;根据用户在各个业务的使用停留时间,计算用户的不相关熵;寻找用户之前使用各种业务的所有可能模式的出现的概率,计算用户使用业务的实际熵。通过以上几个熵值,量化计算用户使用业务的随机性,以此确定用户业务行为的可预测性。该方法将从宏观方面探究用户使用业务的随机性在用户行为中占有的比重,探究用户业务行为的可预测性的程度,从宏观上探究现有的预测方法能够达到的预测用户使用业务可能性的极限。另外还会研究已有数据中用户的业务和流量使用情况,给出用户使用模式的直观介绍。最后,本文还介绍了未来使用熵理论来计算用户行为可预测性的方法,介绍了这种研究方法未来的应用。