论文部分内容阅读
出租车作为城市公共交通的重要组成部分,一定程度上满足了公众定制化出行需求。但是,定制出行需求的微观随机性和宏观规律性并存,有限的出租车资源和出行需求的时空分布给车辆调度造成了较大的难度。出租车公司的区域性车辆调度问题已经成为智能交通领域的热点研究问题之一。随着技术的发展,车辆联网感知技术的出现,为解决这一问题提供了技术手段。在此背景下,本文以出租车车载GPS采集的轨迹数据为基础,研究采用稀疏数据预测出行目的地的方法,从而为有效的车辆调度提供依据。本文使用网上公开的西班牙波尔图市出租车GPS轨迹数据,主要完成的工作如下:(1)针对西班牙波尔图市出租车GPS轨迹数据使用数据的格式,对每个数据特征进行了深入的分析。采用统计分析和可视化方法对数据噪音和冗余的数据进行了清理,得到了170万条清理好的轨迹数据。(2)对比了两种轨迹数据特征提取的方法,包括将轨迹数据转换为图像数据和统一轨迹的长度,解决了原始GPS轨迹数据长度变化大,难以比较的问题。本文基于此方法对比转换了原始的轨迹数据,结果显示,统一长度数据相比转换为图像数据能更加高效的提取数据点信息。(3)对比了四种常用的GPS聚类分析算法,最终选定使用mean-shift方法对轨迹的目的地进行聚类分析。基于此方法,将有对170万个目的地坐标点进行聚类,最终得到了3392个聚类点,并通过可视化点方法对这些聚类点进行了验证。为了解决在构建分类器时,目的地数量多,数据稀疏的问题。本文使用聚类点重新标定了轨迹数据的目的地,将聚类点作为训练模型的目标值。基于该方法,目标点从百万个下降到了3392个,有效的解决了稀疏性的问题。(4)设计了建立分类器的方法,使用两种特征提取的方法,使用了经典的MLP算法和KNN算法,对测试数据中的轨迹目的地进行了预测。并且对测试结果进行了分析对比。结果显示预测值和目的地点Haverisine距离差为2.4,证明本文的模型有效的对目的地进行了预测。本文使用了两种特征提取方法和两种分类模型在真实的波尔图市出租车GPS轨迹数据上进行了验证。在建立模型之后,本文提出的方法能对目的地集性有效的预测,并且得到了较高的预测精度,可以满足出租车公司对于出租车目的地的预测和调度需求。