基于特征选择与机器学习的列车晚点预测方法研究

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:houyangpeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国铁路列车速度的不断提升,人们对列车运行正点率的要求也越来越高,但从列车实际运营情况来看,列车会由于某些干扰因素而偏离计划运行图的轨迹。当前,在干扰事件发生后,调度员凭借自己的调度经验估计列车晚点时间,进行列车运行图的在线调整。如果能够提前预测列车到站的晚点时间,就能够为调度员提供更精准的信息,进一步提升调度优化效果。本文以列车实际晚点案例为基础,研究了列车在扰动情况下的晚点规律,设计了铁路列车到达晚点时间的预测方法。论文主要内容如下。(1)基于列车晚点案例描述,选择了TF-IDF文本挖掘方法进行关键字提取,结合列车的实际运行分析整理影响列车晚点的因素。参考实际调研与研究现状梳理列车晚点特征,并收集列车运行时刻表与相关线路信息,结合列车晚点案例,对晚点特征进行数值化处理。(2)分析了晚点特征的相关性与冗余性,对于弱相关及冗余特征,提出了基于最大相关-最小冗余(m RMR)的改进特征选择算法。利用最大信息数(MIC)代替原有的互信息作为变量相关性的评价准则,并设计了MIC与斯皮尔曼系数融合的评价标准,改进了原有算法中互信息对离散值不敏感以及使用单一度量准则的缺点。通过与原始m RMR算法所选特征集下的预测精度作对比,证明了MS-m RMR算法在晚点数据集上的有效性。(3)在晚点数据集的基础上,选择了随机森林(RF)算法、梯度提升迭代树(GBDT)算法以及极端梯度提升树(XGBoost)算法,建立了晚点时间回归预测模型。以决定系数R~2为权重对随机森林算法进行加权改进,并在晚点数据集上对比了加权随机森林(w RF)与RF的准确性。使用粒子群算法(PSO)以及网格搜索算法(GS)对模型超参数进行优化,通过对三种优化预测模型精度的比较,得出了最优的算法模型组合。(4)开发了以Django为模型框架的列车晚点预测系统,以最优预测算法组合作为后台预测引擎模块,对论文研究的预测模型进行了具体实现。图35幅,表26个,参考文献78篇。
其他文献
目的:胃肠道间质瘤(Gastrointestinal Stromal Tumor,GIST)是消化道最常见的间质肿瘤,具有潜在的恶变可能。它们通常CD117(c-Kit)的表达呈阳性,主要是通过激活KIT或PDGFRA的
本文从关注浙江筝派代表人物,中国筝坛极具影响力的古筝名家,孙文妍的艺术生活入手,探寻其古筝演奏艺术风格形成原因。本文以田野调查法及比较法作为研究方法,通过孙文妍从接触到学习再到专业从事音乐的意识心理形态和社会功能为标准。将对孙文妍古筝演奏艺术风格的形成,有着重要影响的几个方面,分为全文三个阶段,及一条贯穿全文的线索。分别为:浙江筝派的根基、各古筝流派的影响、以及科学方法的加入这三个阶段,在每个阶段
细梗香草(Lysimachia Capillipes Hemsl.)为报春花科珍珠菜属植物,又名满山香、香排草、毛柄珍珠菜,在江西、福建、浙江、湖南、广东、贵州等地区都有分布,但其主要生长在江西、福建、贵州等。“满山香”药材基源复杂,但细梗香草是唯一的草本“满山香”,满山香药材为细梗香草的干燥全草,于20世纪70年代初在江西省乐安县发现,是江西特色中草药资源。性甘、味平,主要功能是祛风、止咳、调经
目的:观察改良定式易筋经对髋部骨折术老年患者居家康复疗效的影响,为其在临床和居家康复中的指导应用提供依据。方法:术后转入上海第四康复医院的髋部骨折术后患者,住院康复治疗1个月后,回归家庭的髋部骨折术后的老年患者68例,随机分为常规居家康复组和易筋经干预组各34名。常规居家康复组:主要是ROM、肌力、平衡以及ADL的自我功能锻炼;易筋经干预组:居家自我康复锻炼基础上加上改良定式易筋经;干预时间为3个
周期波屏障具有特定频率范围的带隙(衰减域)特性,已经作为一种隔绝地震和环境振动的新型隔振手段受到广泛关注。其中,针对表面波的波屏障可以减小地表处的振动,有效防护目标建筑物。本文基于遗传算法和有限元法,通过拓扑优化对周期表面波屏障进行反向设计和性能研究,以实现对目标衰减域的针对性调控和精准设计。本文主要研究了三种类型的周期波屏障:埋入式波屏障、非埋入式波屏障和空沟波屏障。通过软件COMSOL Mul
为缓解日益严峻的交通拥堵和环境污染等问题,国内各地方政府相继出台了针对货车的时段性限行管制措施,禁止车辆在工作日高峰时段或白天进入城市特定路段或区域,这势必影响城市物流配送的效率和成本。尽管如此,国内外有关该类限行措施下的城市物流配送路径优化问题的研究却很有限。既有的有限研究也忽略了一些关键影响因素(如配送点间子路径的多样性),致使模型及其求解算法缺乏应有的理论和实践参考意义。有鉴于此,本文研究了
二硫代氨基甲酸盐属于超速级酸性促进剂,具有很快的硫化促进速度,在天然橡胶和各种合成橡胶中有着广泛的应用,但是由于很多二硫代氨基甲酸盐都存在着会生成亚硝胺的问题,如二乙基二硫代氨基甲酸碲(TDEC)和二乙基二硫代氨基甲酸锌(ZDC),使得它们的应用受到了限制。在二硫代氨基甲酸盐类分子中引入苄基,能有效的避免这个问题,如二苄基二硫代氨基甲酸锌(ZBEC),但是在引入苄基的同时会使得促进剂的硫化活性和硫
随着我国进入新时代,人民生活水平显著提高,特别是移动互联网、智能家居、新能源汽车这些日益影响生活的技术都离不开电力的支撑。对供电安全可靠的要求日益提升,对于一个城
羧肽酶(Carboxypeptidase)是可水解蛋白肽链C末端氨基酸残基的一类蛋白酶,广泛存在于高等动植物组织及真菌中。在医药和食品等领域的应用十分广泛,虽然目前已有不少关于羧肽酶的研究,但是这些研究大多数集中于微生物产酶及羧肽酶的克隆重组,而对动物,尤其是存在于如南极磷虾等具有特殊适冷特性动物体内的羧肽酶研究相对较少。因此,本课题以南极磷虾为原料,从中分离纯化出一种羧肽酶,并对该酶的酶学性质进
第一部分线粒体氧化呼吸功能对软骨细胞表型影响及相关机制的研究目的:研究线粒体氧化呼吸功能对软骨细胞表型的影响及其相关机制。方法:通过检测SD大鼠膝关节软骨细胞体外培