论文部分内容阅读
随着信息通讯技术及定位技术的进步,跟踪技术发展迅速,例如GNSS, GSM, WIFI, RFID等定位技术和通信技术相结合,可以实现对物体实时动态跟踪。当前,手机已成为人们日常生活不可或缺的工具,而且很多手机装有GPS等定位设备,可以精确的确定用户当前位置。事实上,在手机上没有安装任何定位设备的情况下,GSM网络为人们提供通讯服务的同时,也记录了人们的地理位置。也就是说,手机用户每天的出行都会在无线通讯服务提供商的信息库中留下电子足迹。伴随着手机使用率和手机定位精度的提高,移动通信服务商积累了大量的用户定位数据,这些数据可以为我们研究居民出行规律提供丰富的数据资源。挖掘这些数据的潜在价值日益引起各领域广泛的关注。本文基于手机定位数据,围绕探索用户出行规律这一主题,开展了以下研究:(1)轨迹数据的表示方法研究居民的出行产生移动轨迹,一般采用离散的定位点连成线来表示。轨迹数据不同于一般的事务数据也不同于地理数据,它是一种时空数据。怎样合理有效的表达用户出行轨迹,使其方便于分析和理解是一个当前还未完全解决的难题。本文在考察已有的轨迹数据模型的基础上,用通讯基站的服务范围代替点位置,即用格网化分地理空间,提出了一种适合于低定位精度下的轨迹数据表达方法。(2)轨迹特征信息提取研究轨迹数据有着其自身的特性,这些特性客观上记录了轨迹主人的出行特点。本文研究了轨迹数据的特性,并针对起源蜂窝小区定位得出的用户轨迹,研究了提取轨迹特征信息的方法。提出了一种提取用户驻留信息的算法,该算法考虑位置和时间因素,对定位点进行时空聚类,提取出对用户有特殊意义的驻留点。(3)轨迹数据的语义化研究轨迹是人出行的历史记录,单一地从轨迹本身研究,不能全面的分析人的出行规律。结合环境语义信息,能深入的挖掘用户出行的模式。因此,文章对如何将轨迹进行语义表达的方法进行了研究,提出了两种地理位置语义化的方法。一种是统计基站小区内的兴趣点POI标签,把占百分比最大的标签类型赋予相应基站小区;另一种是适合于起源蜂窝定位方式的,基于手机话务量地理位置语义化的方法。该方法统计典型语义小区的话务量,用来设计分类器,然后用分类的方法赋予相应基站小区语义。(4)用户出行规律识别算法的研究在手机用户轨迹语义化的基础上,对如何自动识别用户出行规律的算法进行了研究。文章采用Apriori算法,对自动识别用户出行轨迹规律进行了研究。考虑此算法的计算复杂度,在数据预处理中剔除不满足最小支持度的数据,以减小算法的计算量。在以上研究的基础上,对各种算法进行了实现,并结合ArcGIS可视化平台实现了基于手机定位数据的用户出行规律可视化分析。并以一个手机用户长达7个月的手机定位数据作为实验对象,分析了用户的出行规律。研究成果对城市规划、交通规划与管理、疾病暴发控制、甚至灾害管理等有参考价值,同时可以为基于位置的服务提供更多知识。