基于集成树的航班过站关键节点时间特征选择方法研究

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:sabot
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
航班过站时间是由多个航班过站关键节点构成,影响因素众多,对航班过站时间的准确预估能够在航班延误发生后对下一班的航班离港时间作出正确判断,而对航班过站时间进行准确预估的前提,是对航班过站数据进行特征选择,找到影响航班过站关键节点时间的重要特征子集,分析多维航班数据与航班过站关键节点时间的关系。当下航班过站数据特征选择普遍采用传统的数据统计方法,然而航班过站关键节点时间影响因素复杂,采用传统方法筛选特征子集难以取得满意效果。另一方面,在航班数据日益增长的大数据时代,随着民航数据量规模逐步增长,传统的离线数据处理模式也已经不适用于新的航班运控需求,在很多场景下需要在航班数据产生时立即捕获数据进行针对性的业务动作。针对上述存在的两种问题,论文进行如下研究:针对离线航班过站关键节点时间特征选择问题,提出了一种基于Light GBM集成树模型的航班过站数据特征选择方法。对航班过站数据进行研究,针对不同时间跨度的缺失航班数据设计了三种处理方法,并对类别特征进行特征编码,采用随机森林算法进行初步特征选择,基于Light GBM集成树构建航班过站数据特征选择模型,并通过网格搜索法进行参数优化。通过多组对比实验结果表明,该方法在各指标上表现更优,筛选出来的特征与航班过站关键节点时间的关联程度更高,更能反映特征数据与航班过站关键节点的关系。针对在线航班数据实时特征选择问题,设计了一种基于Spark的分布式航班过站关键节点时间实时特征选择方法,通过结合Flume与Kafka能够有效解决航班大数据流的并发采集问题,在Spark集群上使用Spark Streaming与增量Light GBM算法相结合解决实时特征选择问题,为大数据环境下的航班运控效能提升,提供了一个实时处理分析方案。实验结果表明,在保证预测准确度的情况下,该方法处理能力更高,效果更好。
其他文献
近年来,由于互联网和信息技术的进步,网络信息技术被广泛应用到各个领域。网络信息技术推动社会经济发展的前提是网络信息安全,其中计算机软件安全更是网络信息安全的重要一环,因此对软件源代码进行漏洞检测具有重要的现实意义。随着软件功能和开发技术的复杂化,传统漏洞检测方法存在源代码表征方式单一、泛化能力差、检测效果不佳等问题。为解决上述问题,本文对源代码特征提取方法、深度学习技术进行详细分析,并论述深度学习
学位
目的:探讨经颅多普勒超声(TCD)对脓毒症患者脑循环及脑功能的动态评估和预后预测价值,以及对脓毒症相关性脑病(SAE)的早期诊断价值。方法:选择2017年1月至2018年6月在我院住院的脓毒症患者,排除其他可导致脑病的情况。所有患者给予常规治疗,并在入院第1天和第3天接受TCD检查。收集患者年龄、性别、平均动脉压(MAP)、超敏C反应蛋白(Hs CRP)、血PH、血PCO2、血乳酸、白细胞计数、感
学位
随着社交媒体的迅速普及,大量关于表达个人或组织的情绪、意见和态度的文本数据出现在了网络中,这些文本包含的丰富情感信息对个人、组织或者国家都具有重要意义。情感分析起初的研究以基于规则的方法为主,但鉴于问题本身的复杂性及人工智能技术应用的普及,基于机器学习的情感分析方法已成为目前主流的研究方法。情感-原因对提取任务和面向方面的细粒度意见抽取任务是情感分析中两个比较困难的任务,也是本文研究的目标。情感-
学位
行李托运服务是民航运输服务中的重要组成部分,乘客的行李分为随身行李和托运行李。随着托运行李数量的逐年攀升,传统基于人工的托运行李处理方法的弊端开始显现(暴力分拣、行李计数遗漏等)。因此,本文提出了基于目标检测和跟踪的托运行李计数方法和暴力分拣检测方法以帮助规范机场作业流程。本论文基于YOLOv3目标检测算法,建立针对托运行李的目标检测模型,使用目标跟踪算法SORT,解决托运行李检测中目标的稳健检测
学位
目的:既往报道MUC16可以影响胚胎的种植,但是目前MUC16在孕早期的作用尚不清楚。NK细胞是孕早期蜕膜中主要的免疫细胞,Siglec-9受体是NK细胞上与MUC16相互结合的重要的免疫抑制性受体。本文主要探索MUC16通过NK细胞对滋养细胞迁移能力和血管内皮细胞血管新生能力的调节作用。方法:1.收集并比较正常生育力女性胚胎移植后20天,35天和50天的外周血中MUC16的表达水平。2.收集正常
学位
背景:随着全球范围内新型冠状病毒肺炎(COVID-19)病例持续增长与医疗资源短缺之间的不平衡日渐显著,世界卫生组织建议诊断为轻型和普通型(非重症)的患者在家或社区医疗机构进行自我隔离,且患者可以在症状缓解后解除隔离,无需再次进行病毒核酸检测。但是,患者在病毒未完全清除的情况下提前解除隔离会存在传播病毒的风险。本研究旨在探索非重症COVID-19患者的外周血中与病毒核酸转阴时长相关的因素,并以此为
学位
背景:抗程序性细胞死亡蛋白-1(programmed cell death protein-1,PD-1)单抗显著改善了晚期非小细胞肺癌(non-small cell lung cancer,NSCLC)患者的预后。但是,目前临床上缺乏简便可靠的预测标志物。本研究旨在探究NSCLC患者的临床特征和外周血实验室指标与PD-1单抗治疗疗效及生存的相关性,并以此为基础建立相应的预测模型。方法:本研究回顾
学位
随着计算机技术的爆炸性发展,信息系统的结构复杂度呈指数型增长,信息系统包含子系统的数量增多,子系统中业务功能的数量增加,造成信息系统的稳定性大幅下降。发生信息安全事件或者意外情况时,业务功能的中断在系统中极易形成连锁反应,导致其他业务功能相继失效最终波及影响到整个信息系统。在实际应用场景中,具备应急预案以及灾后快速恢复能力成为信息系统不可或缺的要素。对于复杂程度高、子系统繁多、业务间耦合程度高的信
学位
信息技术的进步与发展推动了数字社会的建设,智能设备与应用软件已经成为生产生活中不可缺少的部分,随之而来的是它们所产生的海量数据,如何利用这些数据并从中获取价值是当下所面临的一个新技术挑战。复杂事件处理是一种面向流式数据的处理理念与技术框架,它关注数据间的相互关系,能够实时处理多源异构数据,以领域知识与历史数据为模板,检测数据流中特殊的数据组合模式。因此复杂事件处理技术在决策分析、交通管理、集群监控
学位
背景:急性肺损伤(acute lung injury,ALI)是一种临床急危重症,严重影响患者的生存率,探索治疗急性肺损伤的有效方法一直是该领域的研究热点。有关急性肺损伤的治疗虽有许多研究,但目前仍无特效的治疗药物和方法。细胞周期依赖性激酶(cyclin-dependent kinase,CDK)在细胞增殖、分化、基因转录、功能调节方面起着极其重要的作用。近年来,研究发现,CDK抑制剂可以缓解炎症
学位