论文部分内容阅读
随着社会经济的发展,许多城区的公共交通设施无法满足人们日益增长的出行需要,合理改进公共交通状况已经成为热门话题。影响公共交通的主要因素是社会经济发展状况,发展公共交通的主要目标是满足社会经济发展的需要,所以通过社会经济发展现状研究公共交通状况是否符合需要,当随着社会经济的发展,公共交通也应该做相应的调节。由于社会经济和公共交通之间的联系复杂,无法直接利用社会经济评价公共交通的发展情况好坏程度,所以本文提出Bagging贝叶斯模型量化地研究社会经济对公共交通状况的影响。公共交通和社会经济数据是分布在地理空间中的矢量数据,由于矢量数据无法满足本文的量化分析的需要,因此需要把这些矢量数据转换成栅格数据。但是这些矢量数据经过栅格数据表达后数据量将会变得很大,为了提高计算性能,采用MapReduce并行计算进行处理。本文主要工作及研究内容如下:(1)提出MapReduce并行计算提高公共交通和社会经济的栅格数据的计算性能。基于MapReduce栅格图像计算分为三步。首先采用一种结构体重新组织栅格数据,以便数据集成。其次是对经过集成的数据进行并行化量化分析计算。最后是计算结果重组成图,以便可视化研地研究社会经济对公共交通的影响。通过实验发现并行化量化分析计算速度明显好于单机计算速度。(2)采用公交便捷度指标去衡量公共交通的发展情况。本文利用聚类方式划分公交便捷度。首先,本文使用主成分分析对公共交通数据去除各数据因子间的数据重叠部分,结果表明去除各因子的数据重叠后聚类质量优于不去除因子的数据重叠聚类。其次使用Calinski-Harabasz去寻找聚类最优聚类个数以及验证主成分分析的好坏。最后使用Kmeans划分公交便捷度。(3)采用Bagging集成若干个贝叶斯(MNB)分类器以改进MNB分类器,从而提高社会经济对公共交通影响量化分析效果。经过分析发现社会经济的一些因子之间存在关系,对MNB分类效果有影响。采用Bagging集成MNB并随机选择社会经济因子,能够消除因子之间的关系。通过社会经济对公共交通影响量化分析实验发现,并行化Bagging贝叶斯分类效果明显好于并行化MNB,不差于BP神经网络分类效果。本文把公共交通发展情况用公交便捷度衡量,从公共交通的影响因素(社会经济)出发,通过并行Baggging贝叶斯(MNB)模型训练表达公共交通和社会经济之间的复杂的关系,并在栅格地图上对公共交通和社会经济关系进行精确的表达,从而细致地在地理空间中研究社会经济对公共交通发展的影响。通过对高新区的社会经济对公共交通影响量化分析实验,发现高新区地铁沿线公共交通没有满足社会经济发展的需要,需要大力发展公共交通建设。