论文部分内容阅读
人群对外出行特性分析是城市对外交通系统规划、运营与管理的关键技术之一。针对现有相关研究仅对特定对外出行行为进行识别以及识别算法研究的不足,本文以昆山市对外交通网络为研究对象,以实际采集的昆山市手机信令数据为基础,采用机器学习技术手段,从对外出行行为识别、对外出行方式判别以及人群类型识别三个主要环节着手,对不同人群的对外出行特性进行了深入有效的挖掘分析。本文主要从以下三个方面展开:
首先,本文基于手机信令数据对手机用户对外出行识别方法进行研究。通过分析手机用户对外出行行为模式,将对外出行行为细化分为异地入境、当地离境、异地过境、当地往返以及异地往返五种类型。再结合用户对外出行时手机信令数据时空分布特性,分别将对外出行行为识别与对外出行方式判别问题转化为手机信令数据时序下状态识别与地图匹配问题,据此提出了一种基于滑动窗口的对外出行行为识别算法,为下文的人群分类识别提供了对外出行相关统计特征。
其次,本文基于改进K-means聚类算法对人群进行分类识别。在将人群分成常驻人群、流动人群以及来访人群三大类的基础上,结合手机用户对外出行频率与职住地分布情况对人群进行细化分类。对于提取出的人群类型识别备选特征集,通过运用无监督的距离熵法进行特征选择,筛选出了由出现总天数、居住时段出现天数、工作时段出现天数以及对外出行天数等七个字段所构成最优特征子集。在此基础上,利用改进的K-means聚类算法对由最优特征子集所构成的特征矩阵进行时空聚类,并根据轮廓系数确定将聚类中心数K设为7时聚类效果最佳。聚类结果表明,人群大致可以划分为过境通行、短期到访、中长期出差、外地居住入境工作、当地居住离境工作、当地工作居住(流动工作地)以及当地工作居住(固定工作地)等七类。
最后,本文对识别出的各类人群对外出行特性进行比较分析。从手机号码归属地、职住地分布等方面着手,对各类人群基本属性进行分析,并结合日期的时间类型,从工作日、非工作日以及节假日三个层面对各类人群的对外出行交通量以及对外出行交通方式选择进行了综合分析。研究结果表明,昆山与上海之间对外出行交流密切,主要集中在花桥地区,而且该区域存在明显的职住不平衡问题,跨境通勤交通发生量较大。此外,来访人群主要通过昆山南站进出昆山,而跨境通勤人群则更偏好于选择地铁与公路出行。
首先,本文基于手机信令数据对手机用户对外出行识别方法进行研究。通过分析手机用户对外出行行为模式,将对外出行行为细化分为异地入境、当地离境、异地过境、当地往返以及异地往返五种类型。再结合用户对外出行时手机信令数据时空分布特性,分别将对外出行行为识别与对外出行方式判别问题转化为手机信令数据时序下状态识别与地图匹配问题,据此提出了一种基于滑动窗口的对外出行行为识别算法,为下文的人群分类识别提供了对外出行相关统计特征。
其次,本文基于改进K-means聚类算法对人群进行分类识别。在将人群分成常驻人群、流动人群以及来访人群三大类的基础上,结合手机用户对外出行频率与职住地分布情况对人群进行细化分类。对于提取出的人群类型识别备选特征集,通过运用无监督的距离熵法进行特征选择,筛选出了由出现总天数、居住时段出现天数、工作时段出现天数以及对外出行天数等七个字段所构成最优特征子集。在此基础上,利用改进的K-means聚类算法对由最优特征子集所构成的特征矩阵进行时空聚类,并根据轮廓系数确定将聚类中心数K设为7时聚类效果最佳。聚类结果表明,人群大致可以划分为过境通行、短期到访、中长期出差、外地居住入境工作、当地居住离境工作、当地工作居住(流动工作地)以及当地工作居住(固定工作地)等七类。
最后,本文对识别出的各类人群对外出行特性进行比较分析。从手机号码归属地、职住地分布等方面着手,对各类人群基本属性进行分析,并结合日期的时间类型,从工作日、非工作日以及节假日三个层面对各类人群的对外出行交通量以及对外出行交通方式选择进行了综合分析。研究结果表明,昆山与上海之间对外出行交流密切,主要集中在花桥地区,而且该区域存在明显的职住不平衡问题,跨境通勤交通发生量较大。此外,来访人群主要通过昆山南站进出昆山,而跨境通勤人群则更偏好于选择地铁与公路出行。