论文部分内容阅读
交通大数据具有大样本、高质量、低价格、连续观测的特性,它为交通出行行为研究提供了全新视角。随着我国城市居民出行需求的快速增长,依赖于5-10年大规模交通调查的传统模型难以反映真实的城市交通需求状况。因此,有必要对传统交通需求模型的数据基础做出改进,使模型能够对城市交通演变过程进行动态分析和预测。根据数据采集方式,本文把通过主动调查获取的传统交通数据称作主动采集数据(ActivelyCollectedData,以下简称ACD)。相应的,把原本为其他用途采集但可用于交通分析的大样本数据称作被动采集数据(PassivelyCollectedData,以下简称PCD)。
本文旨在将新数据环境与传统模型分析技术融合,通过融合PCD和ACD,使二者取长补短,突破大数据的属性缺失以及传统数据的样本量限制,建立一个数据成本更低、精度更高、解释变量更全、可更新的出行方式选择模型。模型以选择方案抽样法为多源数据融合的理论基础,并引入一个调节系数来修正ACD与PCD的分布偏差,使模型系数估计一致。本研究使用了蒙特卡洛方法验证模型并测试模型效果,结果显示相比于单独使用ACD或PCD的模型,该模型在估计精度和解释变量完整性方面都有了显著提升。
PCD种类繁多,本文选择了较适用于出行方式选择行为研究的地铁刷卡数据和车载导航数据,并分别从这两种数据的原始记录中提取出了通勤出行样本。由于PCD普遍不符合传统模型的数据完备性要求,缺少人口及社会经济属性、实际市场份额等信息,本文使用网络出行调查数据进行补充。为了使样本服务水平属性统一,将TransCAD生成的交通网络阻抗矩阵匹配到ACD和PCD样本中。利用这些出行样本,本文以多源数据视角,对上海市居民的通勤出行、区域出行和公共交通出行特征进行了综合分析。
在模型实证研究中,将实际多源出行数据应用到本文提出的出行方式选择模型中,识别出了影响上海市通勤出行方式选择的主要因素。并进行了弹性分析,量化了各方式服务水平的变化对通勤者出行方式选择概率的影响。
本文旨在将新数据环境与传统模型分析技术融合,通过融合PCD和ACD,使二者取长补短,突破大数据的属性缺失以及传统数据的样本量限制,建立一个数据成本更低、精度更高、解释变量更全、可更新的出行方式选择模型。模型以选择方案抽样法为多源数据融合的理论基础,并引入一个调节系数来修正ACD与PCD的分布偏差,使模型系数估计一致。本研究使用了蒙特卡洛方法验证模型并测试模型效果,结果显示相比于单独使用ACD或PCD的模型,该模型在估计精度和解释变量完整性方面都有了显著提升。
PCD种类繁多,本文选择了较适用于出行方式选择行为研究的地铁刷卡数据和车载导航数据,并分别从这两种数据的原始记录中提取出了通勤出行样本。由于PCD普遍不符合传统模型的数据完备性要求,缺少人口及社会经济属性、实际市场份额等信息,本文使用网络出行调查数据进行补充。为了使样本服务水平属性统一,将TransCAD生成的交通网络阻抗矩阵匹配到ACD和PCD样本中。利用这些出行样本,本文以多源数据视角,对上海市居民的通勤出行、区域出行和公共交通出行特征进行了综合分析。
在模型实证研究中,将实际多源出行数据应用到本文提出的出行方式选择模型中,识别出了影响上海市通勤出行方式选择的主要因素。并进行了弹性分析,量化了各方式服务水平的变化对通勤者出行方式选择概率的影响。