论文部分内容阅读
随着移动网络的快速发展和智能手机的不断普及,移动互联网的用户规模与日剧增,各类业务应用也层出不穷。移动互联网正逐渐成为人们使用各类网络业务和应用的重要手段。研究和分析移动用户对各类业务的访问特性,对学术界和产业界都有很强的实际意义。但是,由于真实数据获取困难等方面的原因,对移动互联网用户行为的相关研究工作并不多。
本文基于从某移动通信运营商的WAP网关上采集的2010年和2011年部分数据集,分析了移动用户访问移动互联网中各类业务时的行为特性,以及用户行为在时间维度和网络空间中所表现出来的动态性。首先引入复杂网络的研究方法,建立了一个用户-业务加权二分网络模型,然后对现有移动互联网的主要业务应用进行了分类,以分析移动互联网用户对各类业务应用的访问特性。利用该模型从用户访问兴趣、业务点击量特性、业务流量特性、访问关联性等方面分析了移动互联网用户的访问特性,并揭示了用户行为在时间维度上的动态性。结果发现:门户网站、搜索引擎、社交网站和网络文学是用户访问的主要业务类型;用户访问的兴趣范围服从指数分布,用户访问的兴趣强度服从幂律分布;随着时间的推移,用户的兴趣范围有所扩大,兴趣强度也有所增加;点击量大的网站具有流量相似性而点击量小的网站则没有,但当点击量达到一定规模时又会呈现出流量相似性;在访问关联性方面,门户网站和搜索引擎是最容易被关联访问的业务类型,其次是电子邮箱和社交网站。然后,从迁移次数分布、迁移间隔时间分布和网站间迁移频度分布三个方面分析了用户的网站间动态迁移,发现迁移次数分布和网站间迁移频度分布服从幂律分布,而迁移间隔时间分布服从指数分布。最后,利用重启性随机游走模型对移动互联网用户的站内业务间动态迁移进行了建模,并以该模型为基础,给出了一种用户行为预测算法。基于从数据集中提取的“手机新浪网”的日志数据,对该算法的准确性进行了验证。实验结果显示,其能够较为准确的预测用户的站内业务间动态迁移,尤其是对那些较为活跃的多次访问不同业务的heavy用户而言。