基于数据挖掘的乘客出行行为研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:Liujc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着城镇化建设速度不断加快,我国城镇化率从1978年的17.9%上升到2015年的56.1%,城镇常住人口突破7.7亿[1]。市民的出行需求也越来越大,道路交通流量呈现急剧增长,尤其在“北上广深”这样的大城市,诸如交通拥挤、市民出行不便等问题正在不断的增加,这些问题都严重影响到了城市居民的正常工作和生活,制约着城市的健康发展。公共交通作为城市交通运输重要的一个组成部分,在各城市中得到了很大的发展,然而在多数城市的公共交通的人数出行比占总出行还是偏低,其部分原因是由于公共交通的规划和策略制定与市民的出行之间的关系规律还存在着不一致。数据挖掘是目前智能系统的重要研究内容,它能够从大量的数据中挖掘隐藏在其中的规律和知识。本文基于广东省部分公交线路的历史公交卡交易数据,通过数据挖掘的技术和流程对固定人群在公共交通中的行为模式进行挖掘,分析推测乘客的出行习惯和偏好,最终建立模型预测人们在未来一周在固定公交线路上的出行情况,这对为广大乘客提供信息对称和安全合理的出行环境具有重要的意义。论文首先对数据挖掘技术理论背景和方法做了总体的介绍和分析,基于所有的数据,从实际业务的角度,对乘客在固定公交线路上未来的出行行为存在影响行为规律模式进行了一些探究,提出了一套反应乘客历史行为习惯和偏好的特征工程体系的构造方法。依据所设计的特征工程特点,以及对随机森林(random forest)和梯度迭代决策树(Gradient boosted decision tree)两种组合学习算法的理论分析和应用,建立了一个鲁棒性较好的市民未来出行预测模型,并在此基础上,对两种算法做了一系列分析和对比研究。
其他文献
针对HXN3型内燃机车出现的司机室振动较大问题,展开司机室隔振结构隔振性能分析。通过进行HXN3机车司机室振动试验,明确柴油机一发电机组作为振源的激励特性和振动传递特性。建
利用直接发酵法,控制面粉发酵的程度调制理想面团,排除气泡,选择理想的烘烤方式来制作高标准汉堡用面包。
互联网技术的跨越式发展,使得传统的线下品牌社区已经不能够满足消费者的需求,线上的虚拟品牌社区形式已经逐渐形成。这种模式兼备品牌社区与虚拟社区的特征,吸引了越来越多
目的观察急性等容量血液稀释对丙泊酚靶控输注的影响并探讨给药方式的合理调整。方法28例全麻患者按术中预计出血量分为对照组(预计出血量≤500ml)及稀释组(预计出血量>500ml
由我国著名作曲家吴祖强、杜鸣心联手作曲的舞剧《鱼美人》是1959年为庆祝我国建国10周年献礼而创作的。这是一部专业性很强,又很通俗易懂的大型舞台音乐作品。鉴于舞剧《鱼
[目的]探讨无功能性胃肠胰神经内分泌肿瘤的临床病理特征,并分析影响其预后的因素。[方法]回顾性分析河南省肿瘤医院2004年7月至2012年5月收治的73例无功能性胃肠胰神经内分
<正> 近年来,日本电力系统为谋求企业的活力,实现电力利用的多元化,竞相跻身于农业植物工厂、水耕自控栽培等以农业电气化为目标的开发研究。 最近,日本北陆电力公司开办的吴
从上个世纪八十年代末,台湾《自立晚报》记者李永得、徐璐打破两岸媒介38年的隔离,成为第一批公开到大陆采访的台湾新闻记者至今,海峡两岸的媒介已经陆续交流了27年,虽然中间
近年来,随着城市化的快速发展,城市基底急剧变化,原有的土地利用格局发生了改变,破坏了原有的水文循环过程,导致越来越多的城市频受雨洪灾害的肆虐。因此,如何通过技术或手段
近年来,随着互联网中越来越多的数据能够被感知获取,包括图像、文本、标签、评分在内的多源异构数据蕴含着丰富的用户行为信息及个性化需求信息。但由于这些数据通常具备来源多样、分布不均、结构各异、多维度和规模巨大但有价值的信息相对稀疏等驳杂的特性,传统的推荐算法难以有效的统合利用这些多源异构数据,提取其中的有效信息。深度学习技术在近年来飞速发展,在多种任务中都取得了良好的成绩,在多源异构数据的处理方面有着