论文部分内容阅读
随着城市居民收入的不断增加,时间管理意识的不断加强,越来越多的人选择以出租车作为其出行的交通工具,从而引起了出租车的市场蓬勃发展。通常情况下出租车上都配备有GPS的终端,这些终端会定时地向出租车的调度中心发送一些实时状态信息,比如出租车的经度、纬度、出租车的行驶方向和是否载客的信息等。慢慢地随着时间的推移,出租车公司收集和保存了海量的出租车轨迹数据。现如今,越来越多的人投入到挖掘这些数据的行列之中,使其成为了当前城市交通大数据的研究热点之一。以往的出租车载客热点可视化方法,可视化效果不突出,一些关键的热点区域的具体位置不够精准,会导致最终提供给用户的信息有误差,不能很好的为出租车公司与司机所利用。同时可视化界面的设计也有待提升,不能很直观地体现出租车GPS数据隐藏的其他信息。基于上述的问题。本文的主要内容如下:第一:数据预处理和地图匹配:首先处理收集到的GPS数据和OSM地图数据。删除不符合规则的数据并修复丢失的数据。通过几何法地图匹配,修正读取到的出租车载客点,从而校正收集到的原始GPS载客热点,完成数据的准备工作。第二:改进DBSCAN算法:本文根据载客点在道路分布情况选择了基于密度聚类的DBSCAN算法。考虑到实际道路中绿化带、红绿灯等交通限制,设计了一种基于道路限制的DBSCAN改进算法。本文设计的算法把出租车在道路上的行程距离引入到了DBSCAN算法之中,替代了以往DBSCAN算法计算两点欧式距离的相似度度量方式。从而避免了因为参数选择过大而导致聚类效果递减的不足。第三:可视化的功能实现以及结果分析:满足本文的可视化的具体要求,并把大量、多维的出租车GPS载客热点数据转换为供观测者感知的图形、符号和颜色,为出租车公司的规划和居民出行提供了可靠的依据。