基于道路交通状态时空预测的算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:chrisfei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前在我国城市化进程速度加快,城市化人口数量增多,机动车数量也逐年增多的背景下,人们出行成为一个重要的问题,越来越多的互联网公司和研究机构在出行领域投入巨大人力、物力、财力对出行路径规划和道路拥堵情况进行研究,比如百度地图,高德地图,滴滴出行等公司。目前,针对道路交通状态时空预测的研究有很多,本文使用的数据集为滴滴公司提供的2019年7月份西安市城市道路交通状态数据集。数据集存在数据量大,数据维度过多,样本类别分布不均衡的问题,如果直接使用这些数据集训练模型会造成训练时间繁长,普通机器的内存无法容纳,而且在我们更关心少数类样本能够被准确预测的情况下,样本类别不均衡问题对结果的影响会显得更加的突出。在这样的数据分布情况下,如果对数据集不加任何处理就进行模型训练,可能无法对结果做出准确的预测,最后模型的预测结果显然是趋向于多数类样本的,少数类样本被预测错误的概率很大,所以我们对数据集进行下采样处理,使得每种类别的样本数据尽可能分布均衡。为了尽可能使少数类样本能够被准确预测到,我们使用F1函数来衡量模型性能。本文针对道路交通状态时空预测算法做了以下三个方面的研究:第一,选用新的特征组合进行实验。使用原始的、不加任何特征提取的数据集和使用经过特征提取后的数据集分别进行实验,对实验结果进行分析,发现在同等条件下使用经过特征提取后的数据集来训练模型,模型的预测准确性更高。第二,选用不同的算法进行模型融合。我们使用处理好的数据,用传统的机器学习算法和深度学习算法进行模型融合,分别使用机器学习算法中的XGBoost算法、Light GBM算法和深度学习算法中的CNN神经网络、Res Net神经网络,并进行5折交叉验证训练,每次训练完成后预测一次验证集和测试集的结果,最后用一个GBDT梯度提升树模型把上一轮预测出来的验证集当作GBDT的训练集,再对测试集进行预测,实验结果用F1和Accuracy两种评价函数来衡量。结果显示,无论是使用F1还是Accuracy,模型融合方法都要比单模型的预测效果更好。第三,使用果蝇算法对Light GBM和XGBoost的学习率(learning_rate)参数进行调参。为了证明果蝇算法具有更好的调参效果,我们使用了果蝇算法和粒子群算法分别对XGBoost模型和Light GBM模型的学习率(learning_rate)参数进行迭代实验,找到最佳参数。经过实验对比,发现当使用果蝇算法迭代寻优找到的最佳参数要比使用粒子群算法找到的最佳参数具有更好的预测精度。
其他文献
重力勘探可以获取地下不均匀密度分布的综合响应,对大区域数据的精细、高效率密度成像是重力勘探中一个重要需求。然而,反演一个复杂且耗时的过程,它非常依赖于初始模型和使用的约束,并且考虑到计算量和计算时间问题,反演在进行实际数据处理时会面临计算效率的限制。高效计算设备和计算技术快速发展,密度分布实时成像仍具有未开发的潜力。若对调查区域进行整体三维建模,将面临两个主要瓶颈:一是需要大量的计算机内存来存储灵
近年来,伴随着人们在互联网平台上越来越多的中文信息日常交流、获取和存储,互联网上同时出现了大量的不规范的短文本信息,这些短文本大多来源于拼音打字和语音输入,它们缺乏完整的语法结构,存在很多的同音错别字,给数据分析和处理工作带来一定的困扰。因此,如何对这些文本进行及时有效的处理,从中提取出准确的信息,一直都是自然语言处理领域的重要的任务。短文本相似度的计算就是其中的重要课题之一。由于通过人工标记短文
研究背景:林奇综合征(Lynch syndrome,LS)是由DNA错配修复基因(Mismatch repair gene,MMR)MLH1、MSH2、MSH6和PMS2突变引起的常染色体显性遗传性疾病,LS最初是在遗传性结直肠癌(Colorectal cancer,CRC)中被发现,又称遗传性非息肉性结直肠癌综合症(Hereditary nonpolyposis colorectal cance
近些年电商以及经济的高速发展促使我国成为一个物流大国,使得我国公路运输快速发展。不断壮大的公路运输保证了我国经济的快速发展,但公路运输仍有急需解决的问题:(1)商用车司机短缺问题;(2)能源消耗问题;(3)商用车交通事故问题。为解决上述问题,汽车智能化提供了新的解决途径,商用车队列行驶作为其中一种解决途径在近些年逐渐成为研究热点。虽然商用车队列在节能减排、减少交通事故和解决司机短缺方面具有显著优势
随着我国GDP的快速增长,汽车逐渐走进千家万户,在汽车保有量快速扩张的同时,对4S店的售后服务也提出了更高的要求,售后水平的优略高低和维修服务满足度息息相关,因此,保持合理适当的备件库存量就显得尤为重要。基于对ABC分类法的深入研究,分析了汽车4S店备件库存目前存在的问题,对备件进行库存分类并制定相应的订货策略,建立备件库存优化模型,降低汽车4S店的库存成本,提升竞争软实力。
地幔不均一性是当今地球科学领域内的重大前沿问题,对原始不均一性起因的探讨关系到地球起源问题的基础理论。本文通过建立世界主要古老克拉通变质基性岩数据库,结合国内中条山-吕梁山野外采集样品测得的锆石U-Pb年龄及相关地球化学数据,选择合适的古老克拉通进行对比研究,继而探讨原始地球化学不均一现象及其起因,为欧阳自远团队建立的原始地球的两阶段不均一星子堆积模型提供更多成果支持。锆石U-Pb年代学研究显示,
美育是新时代中小学教育科研中的重要课题,如何将美育思想渗透校园活动中,实现全面和谐育人,促进学生个性化发展,在学校活动中将艺术与德育两者有机结合,以艺育德,陶冶学生道德情操,以艺启智,促进学生全面发展。新时代,对中小学美育提出了更高的要求,美育不是机械的,中小学美育不仅仅是传统的音乐教育、美术教育,美育具有特殊性,美育更重要的是培养学生对于人生的态度,提升学生的人生境界。一、新时代,对中小学
期刊
探地雷达(Ground Penetrating Radar,GPR)是一种基于电磁反射信息的非常适用于浅层目标探测的一种无损探测工具。常规的探地雷达大多是单极化雷达,由于采集方式的限制,只能采集到一种共极化信息,得到的信息量很有限,也很难满足某些复杂环境下工作的需求。而全极化探地雷达(Full-polarimetric Ground Penetrating Radar)既能采集到共极化信息又能采集
印度板块和欧亚板块持续不断的陆陆碰撞过程形成了全球规模最大、海拔最高的高原——青藏高原。雅鲁藏布江缝合带是大体沿雅鲁藏布江河谷分布的一条狭长的、经过强烈变形、变质的印度板块与亚洲板块碰撞的前缘结合处,被认为是新特提斯主洋盆遗迹所在,被誉为陆陆碰撞深部构造研究的天然实验室。国内外学者在雅鲁藏布江缝合带附近开展了大量科学研究,然而其下部地壳和上地幔结构仍旧存在较大争议,印度板块岩石圈的俯冲模式仍不清晰
乡村振兴战略是新时代做好"三农"工作的总抓手,产业融合是实现乡村振兴的重要途径。贵州仁怀市以茅台酒为引领,设,从实现产业、文化、生态、人才à、组°织?全面振兴的角度探索酒旅融合发展助推乡村振兴的路径,从政策、机制、资金、人才方面构建酒旅融合助推乡村振兴的保障体系,为我国西部地区城镇反哺农村,工业反哺农业,三产融合发展,县域经济助力乡村振兴,提供现实依据。