基于WEB信息与机器学习的工业物联网设备识别技术研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:caesarsarahluckgirl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,数以亿计的工业物联网设备暴露在公网上。而大多设备制造商因节省成本未优先考虑产品安全性,再加上用户安全意识不高、设备管理不善等因素,大量设备很容易被黑客控制进而引发诸如“Mirai”病毒席卷全球等大型攻击事件,造成不可挽回的损失。因此排查物联网设备存在的安全隐患、防范工业物联网安全威胁势在必行。由于同一类型、同一系列或者来自同一品牌的工业物联网设备往往具有相同或相似的安全漏洞,因此识别网络空间中的工业物联网设备,包括其类型、品牌、型号等信息变得十分重要。因为整体物联网设备在网络空间的分布具有长尾效应,且工业路由器、工业防火墙等设备与常见物联网设备的识别方法是相通的,因此本文提出针对常见物联网设备与新兴工业物联网设备分别构建不同数学模型进行设备细粒度识别的方案。本文从设备的Web管理页面数据出发,针对路由器、摄像头等常见物联网设备类型集中、各类型设备数量众多,且Web首页正文中关于设备型号、品牌等信息较为隐晦等特点,提出基于多特征融合的有监督学习方法进行设备分类的方案。该方案综合了 Web管理页面Banner、文本内容、超链接、以及页面结构等多角度特征,相较于以往工作扩大了特征提取范围,更具有普适性,弥补了单一特征或综合文本特征有时无法进行设备识别的缺陷。本文利用随机森林与改进的CHI文本特征提取算法相结合的方案对常见物联网设备类型进行深刻描述,最终生成的模型针对各类型设备的精确率均在98.3%以上。而对于常见物联网设备的品牌、型号进行识别是在建立字典树形式的设备属性数据库的基础上进行的。由于近年来新兴的工业物联网设备不断出现,造成设备种类繁多复杂且较为零散,而现实环境中可接触的各类型工业设备数量较少,因此不适合采用分类方法进行设备识别。但新兴工业物联网设备Web数据中设备品牌和型号信息较为明显,因此本文提出一种基于Web管理页面的七个关键字段与Apriori算法进行设备细粒度识别规则挖掘的方案,扩大了设备识别范围。最后利用相似度对设备进行规则匹配以生成(类型,品牌,型号)标注。经过实验,该方案的准确率达到了 99.9%,召回率达到了 97.3%。
其他文献
近年来,由于石油价格的不断攀升以及汽车排放污染物带来的严重环保问题,使得节能减排成为全球的新课题,为电动汽车发展迎来了最佳时机。未来城市交通将以电动汽车为主,无论是混合动力汽车还是纯电动汽车都需要公用充电设施外插电源充电。然而,随着电动汽车规模化发展,大量电动汽车在充电时的无序充电将会对电网、充电设施和用户产生不可忽视的影响,电动汽车如何快速高效充电有着重要的研究意义和实用价值。本文在电动汽车,基
广西汽车制造业经过近五十年的发展,在产、销量等方面取得了瞩目的成就。广西成为我国重要的汽车生产基地,汽车制造业亦成为广西的支柱性产业之一。然而在发展过程中,亦显现
三维ISAR成像算法可得到目标的三维ISAR散射点集,相较于二维图像,能反映目标的真实尺寸及形状,从而为目标参数提取及目标识别提供必要的信息支持。但受限于雷达分辨率,单视角的三维ISAR散射点集包含较少的目标特征及信息,难以有效提取目标的各项参数。而不同视角的点集间具有互补性,配准后可得到更完整的点集数据,但不同视角的点集间也存在大量的非重合区域,造成三维ISAR散射点集配准相较于二维图像配准更加
催化脱羧加成是模拟自然生物合成反应途径的碳-碳键形成最有效的方法之一。β-酮酸可以作为酮烯酸类化合物的理想替代物,在反应结束后释放出微量的二氧化碳,因此它与其它有机化合物的脱羧转化,已经被认为是一种高效、绿色的方法来获得羰官能团的分子。由于β-酮酸在酸性、碱性或者加热的条件下容易分解成相对应的酮类化合物,所以如何实现β-酮酸在温和的反应条件下高效率转化、高化学选择、高立体选择成为主要研究对象。我们
全世界范围内海洋渔业资源总量连年减少,海洋鱼类保护和管理工作备受关注。为了合理地、可持续地开发海洋渔业资源,设计出高效准确的鱼类检测识别系统意义重大。传统的鱼类检测识别方法主要依赖人工设计的特征,但通常这些特征是不具有通用性的,并且人工特征的设计需要专家级别的经验。为解决上述问题,本文针对船载电子监控场景中的鱼类识别任务提出了基于深度学习的检测识别方案,主要工作包含以下两个方面:首先,本文提出了一
全(多)氟烷基化合物(Per-and polyfluoroalkyl substances,PFASs)是一类高度氟化的有机物,被广泛应用于各类工业和民用产品,因具有高持久性、生物积累潜力、毒性和远距离迁移
锰氧八面体分子筛(OMS)是一类孔道截面为矩形的分子筛,按其孔道截面的长宽可分为OMS-1~OMS-7,OMS-2(具有2*2孔道结构的锰氧八面体分子筛)作为其中的一员,是一种电导率高(10-2Ω-1 cm-1))、比表面积大(102 m2 g-1)、合成方法简便的分子筛材料,在CO的氧化、苯乙烯的氧化、过氧化氢的分解等催化反应中表现出了优良的催化性能。本文包含两项工作,一为Cu或Ni掺杂的OMS
互联网世界发展日新月异,在线社交网络已经成为人们日常生活中不可或缺的一部分。在线社交网络上涌现出了大量被自动化程序控制的社交机器人,模拟正常人类的浏览行为和活动内容,与正常人类建立信任关系,从而达到发起社会工程学攻击的目的,对网络空间安全造成了不容忽视的危害,在在线社交网络中检测和删除恶意社交机器人已经成为行业和学术界重点关注的领域。现实环境中社交机器人和正常人类用户的数量具有显著差异,目前广泛使
近年来,我国城市商业银行的个人业务发展遇到了很多新的变化和挑战。本文以LS银行LY分行为例,研究了城市商业银行个人客户服务优化问题,研究目的包括三个方面的内容:一是对LS银行LY分行的个人客户服务现状展开调查,全面总结分析存在的问题;二是对LS银行LY分行的个人客户服务满意度情况分多个维度开展实证研究,找出影响个人客户服务体验的关键因素;三是结合发现的问题及其产生原因,提出具有针对性的个人客户服务
随着物联网的规模和复杂度的快速增长,终端的安全性日益成为人们关注的焦点。在终端访问网络的过程中,我们不仅要对其用户进行身份的鉴定,而且还要对其设备的平台进行完整性认证,从而实现终端的可信网络连接过程并保障分布式环境下终端的安全可信。然而,现有的可信网络连接框架是通过集中化的管理模式进行终端访问控制的,该框架无法提供分布式环境下去中心化的可信网络连接服务。为了解决这一问题,我们根据区块链所具有的分散