基于出租车轨迹的出行需求预测方法研究

来源 :长安大学 | 被引量 : 9次 | 上传用户:iamphfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
出租车作为城市公共交通的重要组成部分,一定程度上满足了公众定制化出行需求。但是,定制出行需求的微观随机性和宏观规律性并存,有限的出租车资源和出行需求的时空分布给车辆调度造成了较大的难度。出租车公司的区域性车辆调度问题已经成为智能交通领域的热点研究问题之一。随着技术的发展,车辆联网感知技术的出现,为解决这一问题提供了技术手段。在此背景下,本文以出租车车载GPS采集的轨迹数据为基础,研究采用稀疏数据预测出行目的地的方法,从而为有效的车辆调度提供依据。本文使用网上公开的西班牙波尔图市出租车GPS轨迹数据,主要完成的工作如下:(1)针对西班牙波尔图市出租车GPS轨迹数据使用数据的格式,对每个数据特征进行了深入的分析。采用统计分析和可视化方法对数据噪音和冗余的数据进行了清理,得到了170万条清理好的轨迹数据。(2)对比了两种轨迹数据特征提取的方法,包括将轨迹数据转换为图像数据和统一轨迹的长度,解决了原始GPS轨迹数据长度变化大,难以比较的问题。本文基于此方法对比转换了原始的轨迹数据,结果显示,统一长度数据相比转换为图像数据能更加高效的提取数据点信息。(3)对比了四种常用的GPS聚类分析算法,最终选定使用mean-shift方法对轨迹的目的地进行聚类分析。基于此方法,将有对170万个目的地坐标点进行聚类,最终得到了3392个聚类点,并通过可视化点方法对这些聚类点进行了验证。为了解决在构建分类器时,目的地数量多,数据稀疏的问题。本文使用聚类点重新标定了轨迹数据的目的地,将聚类点作为训练模型的目标值。基于该方法,目标点从百万个下降到了3392个,有效的解决了稀疏性的问题。(4)设计了建立分类器的方法,使用两种特征提取的方法,使用了经典的MLP算法和KNN算法,对测试数据中的轨迹目的地进行了预测。并且对测试结果进行了分析对比。结果显示预测值和目的地点Haverisine距离差为2.4,证明本文的模型有效的对目的地进行了预测。本文使用了两种特征提取方法和两种分类模型在真实的波尔图市出租车GPS轨迹数据上进行了验证。在建立模型之后,本文提出的方法能对目的地集性有效的预测,并且得到了较高的预测精度,可以满足出租车公司对于出租车目的地的预测和调度需求。
其他文献
当前分布对象技术的发展,在为开发高性能、可扩展的分布式企业应用软件提供技术基础的同时,也将软件置于复杂环境中。分布式企业应用软件结构复杂、涉及多种技术,对设计开发人员
组播技术是一种从单个发送端同时传输数据到多个接收端的有效手段,这个优点使它成为当前网络技术中的研究热点。但伴随着组播应用的发展,它的拥塞控制问题变得也越来越重要,
随着图像科学各基本理论的进展,数字图像处理技术在国民经济各部门得到广泛的应用。数字图像处理技术作为计算机科学的一个重要研究领域正在受到广泛的重视,数字图像处理技术已
随着Web服务技术的发展,Web服务相关标准的完善,支持Web服务的平台的成熟,网络中可以实际应用的Web服务越来越多,基于Web服务的应用技术成为当前电子商务的一个主流技术。然而,现
本文主要围绕着开放源码的入侵检测系统Snort中模式匹配算法展开的一系列的工作。 首先,从Snort系统入手,分析此系统工作的原理,介绍特征分析和协议分析。重点对系统中规则的
论文以数字化图书发展过程中面临的困难——异构电子数据资源给读者的使用带来不便为背景,介绍了目前为了实现电子资源的“一站式”查询,而在电子资源系统集成时所采取的通用解
近年来,传统优化方法在解决复杂实际工程最优化问题时的弊端日益暴露,已无法适应多极值、难建模、多约束的问题需求,群智能优化算法在此背景下提出并因其优点得到快速发展。P
随着城市的快速发展,城市化进程中的安全问题也引起社会的重视,尤其是在智能安防、城市交通、公共安全领域,行人安全越来越重要。因此行人检测成为研究领域的一个热门研究方
在充分研究对外加工贸易企业特点、需求,海关监管的各种工作流程和业务标准,以及对现有物料管理系统进行分析的基础之上,结合目前比较流行的J2EE技术,提出了一种基于J2EE的对
客户关系管理CRM是近年来新兴起的理论,它的实施帮助企业增强了自身的竞争实力。在CRM中,数据挖掘理论有着广泛的应用。本文就是将数据挖掘中的序列模式理论应用到CRM的客户分