论文部分内容阅读
随着我国城镇化建设和社会经济的快速发展,交通拥堵已经成为我国许多城市最重的“城市病”之一。伴随交通拥堵而生的资源短缺、环境污染等问题也越来越严重。为了缓解日益严重的城市交通拥堵等问题,交通管理部门制定了一系列的交通需求管理策略,用于调整交通需求的时空分布。这些策略的制定依赖于对居民出行模式和规律的深刻理解。居民出行调查是获取居民的活动-出行行为规律的重要手段,能为居民出行模式的构建提供数据基础。然而,在传统的居民出行调查中,志愿者负担较重、数据精度较低、且无法方便的获取被调查者的出行路径。随着定位技术的快速发展,基于GPS的调查方法为解决这些问题提供了途径。GPS调查能收集精确的位置数据,但无法直接获取出行端点、出行方式和出行目的等信息。因此,探索基于GPS的出行调查方法,并基于GPS数据挖掘出行端点、出行方式和出行目的等出行特征具有重要的研究意义。本文就是在这一实际背景下,针对现有GPS出行调查以及基于GPS的出行特征识别研究存在的不足,考虑到我国智能手机的较高市场占有率和网络的高普及率现状,对基于智能手机和网络调查技术的出行调查可行性做出了详细的分析和讨论,并从出行端点、出行方式和出行目的三个维度,全面比较了现有的出行特征识别方法的优点和缺点,并在基础上,探讨了提高出行特征识别精度的方法。研究可以推动时间地理学在出行行为分析预测领域的应用,丰富和拓展出行行为理论和方法体系,将数据挖掘理论和方法应用到活动-出行行为出行调查领域,丰富活动-出行行为分析的数据来源,拓展精细化出行数据的采集方法。本文从数据采集和数据挖掘两个层面,运用时间地理学、交通工程学、行为科学、管理科学、统计学和信息科学知识,探讨GPS定位技术、网络技术和数据挖掘方法在居民出行调查中的应用,主要内容包括:(1)智能手机和网络调查技术为基础的出行调查技术研究。首先,以采集可用于出行特征识别的GPS数据为目标,提出了智能手机定位软件的开发需求。其次,以满足出行行为建模以及开展基于智能手机和网络调查技术的出行调查为目标,设计了用于采集志愿者个体和家庭社会经济属性的在线问卷。最后,以志愿者负担最小化和出行特征数据准确性最大化为原则,提出了智能手机和网络调查技术相耦合的出行调查方法。(2)GPS出行调查的出行端点识别方法。以基于智能手机和网络调查技术的出行调查采集的GPS为数据源,分析了数据的完整性。在此基础上,按照GPS数据缺失和GPS数据正常记录两种情况,分别提出了以参数网格搜索为基础的出行端点识别方法。再以在出行调查中经验证的出行特征为依据,讨论了参数组合优劣的评价方法。在最优参数组合的条件下,识别方法的准确率达到了96.02%,且错误率仅为4.75%。研究结果表明,基于智能手机的出行调查能对传统出行调查起到有效的补充作用,且可为进一步开展大规模GPS出行调查提供理论和方法指导。(3)基于GPS数据的出行方式识别方法。以各出行方式特征为基础,提出了出行方式识别的两阶段方法。在第一阶段,应用基于GIS空间分析的网格搜索方法,识别地铁出行方式;在第二阶段,应用高斯过程分类器(Gaussian Process Classifier,GPC),识别其他出行方式。在应用GPC之前,利用序列前向选择法选择了用于分类的特征。通过对比经验证的出行特征,两阶段法正确识别了超过97%的地铁出行样本和95.05%的全样本。研究结果表明,数据挖掘方法是促进GPS出行调查大规模普及的有益途径。(4)基于GPS数据的出行目的识别方法。以现有研究为基础,提出了识别出行目的的四种情境。以现有研究应用的特征不全面为出发点,探讨了将活动持续时间和活动开始时间应用到出行目的识别中的可行性和必要性。并在每种情境下,以包括活动持续时间和活动开始时间的特征集为数据源,应用人工神经网络(Artificial Neural Network,ANN)和粒子群优化(Particle Swarm Optimization,PSO)算法识别了出行目的。通过对比经验证的出行特征,ANN-PSO对于训练集和测试集的识别精度分别达到了97.22%和96.53%。研究结果表明,与活动相关的特征(包括活动持续时间和活动开始时间)对出行目的识别具有重要的意义。本文系统探了GPS数据的采集方法和出行特征识别方法,对促进居民出行调查方法的改进具有重要的理论与实践意义。与以往的研究相比,本文的创新点主要体现于:(1)提出了基于智能手机和网络调查技术的出行调查方法。与以往研究不同,本文从尽可能减轻志愿者负担和提高出行特征准确性的角度出发,构建了涵盖个体社会经济属性数据和GPS数据存储以及轨迹数据处理的在线平台,并讨论了调查员参与志愿者出行特征验证的方法。(2)以GPS数据为输入,提出了基于网格搜索的出行端点识别方法。将网格搜索方法应用到出行端点识别中,并提出了以重复路段长度作为识别以接送人为目的出行端点的重要参数。网格搜索方法有效避免了现有研究中以经验作为主要依据的出行端点识别方法的不足,提高了出行端点识别精度。(3)提出了用于从GPS数据中提取出行方式的两阶段法。首次提出将地铁出行和其他出行方式识别分成两个阶段,分别使用基于GIS空间分析和GPC识别出行方式。这种两阶段方法充分考虑了地铁出行与其他出行方式的显著特征差异,为出行方式识别精度的提高提出了新的思路。(4)构建了出行目的识别的多种情境,设计了基于GPS数据的出行目的识别方法。综合考虑现有研究中出行识别情境的不同,构建了出行目的识别的多种情境。并在每种情境下,运用ANN和PSO识别出行目的。ANN能充分描述出行目的与特征变量之间复杂的非线性关系,而PSO能以较大的概率找到参数优化的全局最优解。这些方法的运用为提高出行目的识别精度提供了良好的方法基础。本文的研究内容、研究方法和研究结论是对现有以GPS为基础的出行调查研究的进一步探索和补充,可为今后深入研究此方面的内容提供理论参考,同时也可为居民出行特征采集方法的改进提供理论基础和决策依据。