论文部分内容阅读
4G移动通信技术的应用为日常生活提供了极大的便利和丰富的内容,随着手机视频等消费的增长,消费者的移动数据通信需求量日益扩大。为满足移动通信服务的信号质量和用户体验的需求,需对移动通信网络进行优化。移动通信网优工程中的站点规划是重要环节,影响着整个网元区域内的通信服务质量,站点一般通过工程师结合传统数据库进行人工规划,由于数据量大,易导致效率较低。因此,移动通信站点规划方法的优化和提升具有现实意义和研究价值。近年来,业界对大数据的研究和应用十分广泛,Spark作为目前十分流行的大数据处理平台,拥有基于内存计算、特色的弹性数据集、与Yarn等兼容性良好的特点,同时拥有MLlib、Streaming等库,使其在机器学习、实时流计算等方面具有扩展性,因此能在众多大数据处理框架中脱颖而出。本文首先讨论移动通信站点规划领域的相关技术与发展现状,接着将对Spark的相关发展和结构进行探讨,包括对Spark的弹性数据集及DataFrame、DataSet和Yarn进行介绍,Spark的Yarn-Cluster模式下工作流程,MLlib库相关内容。同时分类介绍常见的空间聚类算法。然后对站点规划系统的总体架构进行设计,从采集层、解析层、处理层、应用层,自下而上进行展开每层内容的叙述,接着对各层之间的接口与通信进行说明。接下来将对系统的主要功能进行说明,从移动通信数据模块、站点规划模块、大数据模块三个部分对功能进行阐述。最后在本文搭建的系统上,以广州地区的网元数据进行站点规划实验,展示站点规划等方面的实行效果。