基于机器学习的ACARS报文解析技术研究

来源 :西华大学 | 被引量 : 0次 | 上传用户:pppxulan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
ACARS(Aircraft Communications Addressing and Reporting System)报文解析是进行航空大数据挖掘的基础之一,但基于模式匹配的传统ACARS报文解析方式灵活性不高,旧的模板无法解析新格式的报文,也难以利用整个报文中所隐含的模式,需要频繁地根据新报文的特征手动新增解析模板。编写解析模板要求作者在相关领域具有较高的专业知识,且编写好的解析模板的复用率不高,导致ACARS报文的解析效率远低于报文产生的速率,同时日益增多的报文又对其解析效率提出了更高的要求。为此,本文提出了一种基于神经网络的报文解析模型,它能够充分学习ACARS报文中所隐含的模式,既能提升旧报文的解析成功率,又能自适应新报文的解析。ACARS报文中有很多类似转发时间这样的唯一性字段,若直接将其输入神经网络进行训练,会导致ACARS报文的字段词典过大、网络收敛慢、唯一性字段所对应的词条长时间得不到更新等问题,为此提出了一种<映射-还原>优化算法对这部分字段进行转义处理。针对随机初始化的神经网络收敛慢的问题,本文利用word2vec算法将ACARS报文中的格式、结构性信息、字段顺序等上下文数据表示进其结果向量中,并用其初始化解析模型的Embedding层以实现对ACARS报文的知识迁移,从而提升解析模型的训练起点。最终,实验结果表明:本文所设计的解析模型其解析准确率能够达到0.97,相比基于模式匹配的0.85高出0.12;迁移学习的加入可以让解析模型的收敛时间缩短约1/6,同时能够使得报文解析准确率上升至0.98;采用GPU对神经网络的运算进行加速后,其收敛时间仅为采用CPU方式的1/4左右。
其他文献
趋化性是一种由空间中分布不均匀的物质所产生的化学信号刺激细胞或有机体发生定向运动的现象.趋化模型是刻画生物体趋化现象的偏微分方程组,Keller-Segel模型是趋化模型最典型的代表.若考虑细胞自身的繁殖和死亡,在数学模型上体现出来就是logistic增长项的出现.本文考虑以下一类具有logistic增长项的趋化方程组:(?)其中Ω(?)RN(N≥1)是一个具有光滑边界的有界区域,k∈R,μ>0,
近年来随着机器学习与计算机视觉的飞速发展,视觉目标识别领域深受国内外研究者的青睐,其中度量学习是实现视觉目标识别的重要途径之一。度量学习的优化目标是根据一定的规则从训练样本中进行训练和学习来获得一个有效的度量,使得不同类别样本特征之间的距离尽可能增大,相同类别样本特征之间的距离尽可能减小。半正定约束度量学习(Positive-semidefinite Constrained Metric Lear
碳纤维增强复合材料(CFRP)由于其较高的比强度被广泛应用于工程建设和受损加固中。目前,国内外对CFRP约束混凝土短柱和普通碳钢管混凝土短柱方面已有了比较系统的研究,但是在CFRP约束不锈钢管混凝土(CFSST)方面的研究仍处于起步阶段。为此,本文对CFRP-CFSST组合构件受压承载能力进行了系统的研究。由于目前针对CFRP约束矩形不锈钢管混凝土短柱的研究甚少,为掌握CFRP约束矩形不锈钢管混凝
遗传算法是一种常用的启发式优化算法,它具有较强全局优化能力,常用于各种工程实际问题.随着移动通信服务的爆发式增长,未来移动通信系统将面临海量连接设备的挑战.稀疏码多址接入(Sparse Code Multiple Access,SCMA)是一种非正交多址接入方案,能降低时延,同时提供更高的频谱效率.本文主要研究了基于遗传算法的功率不平衡码本设计和改进多用户检测算法,主要研究内容和取得的成果如下:(
秩序与安全是人类社会得以发展的基本前提,社会治安状况体现了国家的治理能力和水平,社会治安综合评价是反映社会治安状况进而改进和提高社会治安状况的有效方法之一.社会治安综合评价借助某些地区社会治安的主要信息,评价主体针对评价指标,依据其专业知识给出各评价指标的评价结果,最终聚合所有评价结果进而对社会治安状况作出综合判断.理论上,社会治安综合评价成为一个多属性决策问题.在社会治安综合评价的过程中,评价主
表面肌电信号(Surface electromyography,sEMG)是肌肉活动过程中产生的微弱生物电信号,其中包含丰富的信息,在手语识别、假手控制和人机交互等领域得到广泛应用,并且每种肢体运动与肌肉的精确活动有关,因此可以用于识别肢体的运动意图和运动状态。虽然当前基于表面肌电信号的手势动作识别已经取得了一些进展,但由于表面肌电信号非线性非平稳的特性,使得在表面肌电信号降噪、活动段检测、特征提
近年来,随着机器学习与计算机视觉技术的飞速发展,字符检测任务已经成为一个重要的研究方向。然而,真实场景下的字符存在着复杂的背景信息,给研究者们带来了诸多的挑战。此外,目前大多数基于深度学习的字符检测算法没有考虑到注意力机制的思想,导致深度卷积网络提取到的特征表达能力弱,不能满足人类社会的真实需求。本文针对字符检测存在的复杂背景和特征表达能力弱的问题,提出了两种改进方法,即基于传统尺度可扩展网络的烟
雷竹笋肉质嫩白、味道鲜美,营养丰富。其富含的膳食纤维有助于肠道蠕动,预防便秘,也可有效抑制糖尿病、心血管脑疾病的发生。作为纯天然无公害的传统森林蔬菜,雷竹笋在当今社会深受广大消费者喜爱。然而,雷竹笋在种植过程中常年施加大量的化肥使得竹林的土壤生态环境遭到严重破坏,竹笋产量和品质下降。本研究以雷竹笋为试验对象,在枯草芽孢杆菌的作用下,从生理生化、分子等方面研究实验雷竹笋品质变化及综合评价、膳食纤维及
由于带有阻尼项的耗散SRLW方程中的两个未知函数u和ρ具有耦合关系,在对其数值方法求解时,一般都建立耦合的数值格式,因此计算量都很大,尤其是非线性的耦合数值格式,还需要非线性迭代求解,计算量更大。本文对一类带有阻尼项的耗散SRLW方程的初边值问题进行了数值方法研究,数值离散时利用外推技巧,在保持二阶理论精度的前提下,首先将方程中的耦合项ρx和ux在时间层同时外推到n层和n-1层,从而在数值求解时以
老鹰茶,又称老荫茶,具有多种生物活性成分,具有潜在的应用前景。本研究以四川老鹰茶为原料,分离不同地区茶类的生物活性物质,分析了其抑菌性和抗氧化性。研发了以石棉老鹰茶为原料发酵的黑茶产品并优化了生产工艺,并研究产品的降血糖作用。主要结果如下:1.老鹰茶主要生物活性物质的提取和测量。选用四川3个不同产地老鹰茶、老鹰茶新鲜植物叶为原料,采用超声波辅助提取技术,分离提取了富含多酚、黄酮的粗提物,测定了其含