基于不平衡数据分类方法的排水管道堵塞识别研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:chunguangdong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习被广泛应用于排水管道堵塞状态的识别研究当中,由于排水管道堵塞状态的识别研究的数据具有不平衡分布的特征,传统的机器学习方法在不平衡数据分类应用方面存在很大的困难。因为管道堵塞存在积累发展的时间过程,对堵塞的检测存在一定的滞后性和不适应性,若排水管道堵塞状态的识别出现问题,很容易导致管道判别为正常管道从而随着时间的累计形成安全隐患,所以必须对排水管道运行状态进行准确识别,及时诊断出排水管道的堵塞程度。本文以排水管道堵塞为应用背景,针对城市排水管道正常与堵塞故障状态在数据获取上的不平衡性造成的运行状态识别准确率下降的问题,以重采样算法和代价敏感为基础,分别提出了一种管道堵塞状态识别研究方法,并将其应用于管道堵塞状态识别中,运用实验室模拟数据,进行仿真实验,说明了本文中所提算法是切实可行的。具体的工作有以下几点:(1)阐述了不平衡数据分类以及管道堵塞识别的研究现状,分析了不平衡数据分类相关理论,介绍了不平衡数据分类的典型方法和性能评价指标。利用声学主动检测获得的数据,通过信号处理方法分析声学信号,分析了常见状态识别方法。(2)基于不平衡数据重采样的管道堵塞状态识别研究。针对城市排水管道正常与堵塞故障状态在数据获取上的不平衡性造成的运行状态识别准确率下降的问题,首先采用小波包分解算法对声响应信号进行3层分解,将得到的不同频带重构信号作为特征分量信号。对特征分量信号提取能量熵,然后对不平衡数据集分别采用基于K-MEANS的欠采样方法、基于改进SMOTE的过采样方法和两种采样方法的混合采样方法,得到平衡数据集,最后对四类数据集进行分类识别与指标评价,本方法在数据层面,可有效提高分类准确率。(3)基于FOA优化的CS-SVM的管道堵塞状态识别研究。根据排水管道内各运行状态下采集到的不平衡数据集,首先对原始不平衡数据集经过小波包分解与重构算法得到不同频带的分解系数,其次,提取各个分解系数的能量熵、近似熵指标构建特征向量集合;采用果蝇优化算法(Fly Optimization Algorithm,FOA)对不同类样本惩罚因子Cm和核函数参数g进行优化选取,即对代价敏感支持向量机(Cost-Sensitive Support Vector Machine,CS-SVM)模型优化,将特征集合输入优化后的CS-SVM模型中,对排水管道的正常和堵塞状态识别,本方法在决策层面,提高了识别精度,减少了数据层面解决问题时产生的人为干预误差、过拟合、数据样本冗杂重复等问题。
其他文献
中国是一个具有悠久乡土文明历史的国家。乡村地区的农耕生产传统在数千年以来深刻影响着我国社会文明的发展历程,支撑了整个国家的经济和社会结构。改革开放30多年以来的经
我国作为全球最大的资源消耗国,煤炭消耗占据了一次能源消耗的三分之二,煤炭企业在社会生存和发展中处于至关重要的地位。然而,随着自然资源的枯竭和环境污染的加重,以高消耗和高污染为特征的煤炭企业正面临着前所未有的发展困境。面对这些压力,煤炭企业不得不改变增长方式,调整产业结构,培育新的竞争力,以获得市场竞争优势地位。基于上述背景,为了使煤炭企业不断获得发展动力,增强竞争优势,煤炭企业绿色竞争力的研究显得
星间链路泛指两颗卫星之间建立起的无线链路,支持独立的太空组网,能够有效减少传输时延,是卫星通信发展的重要趋势。星间链路在实现全球快速高效无缝连接,构建天地一体化通信网络进程中发挥着重要作用。毫米波星间链路的工作频段在60GHz左右,频谱资源丰富,且存在较为严重的大气衰减。因此,毫米波星间链路能够提供高速率的数据传输和相对安全的太空通信环境,被广泛应用于军事商业等领域,成为国内外众多科研机构的研究热
教育在我国一直处在重中之重的位置,伴随着人工智能的发展,远程教育呈现出蓬勃的发展之势。随着选择远程教育的学生增多,在线教育平台中产生了大量的日志信息。如何合理利用在线教育平台所产生的数据,提高远程教育平台的利用率,为远程教育平台安全可靠的运行提供理论基础,成为当前的研究热点。本文以在线学习平台中的日志信息作为基础,整理出平台中每小时的在线考试人数,对在线考试人数进行预测,以达到提高系统资源的利用率
近年来,随着无线通信的快速发展,以及频谱需求量的不断增加,导致频谱资源短缺的问题日益严峻。目前,由于具有良好的频谱分配效率和公平性,动态频谱访问(DSA)被发现是一种解决频谱短缺问题的有前景的技术,并且基于此种技术,已经有许多基于拍卖的频谱分配机制被提出。最近,在动态频谱共享中研究人员分析了传统的Sybil攻击,即一种作弊者通过使用两个或多个假身份参与分配以获取更高效益的攻击模式,并提出了抵御此种
随着改革开放的不断深入,我国经济飞速发展,2019年初,我国国内生产总值已达82.7万亿元,年均增长率7.1%,占世界经济比重15%左右,改革开放事业取得巨大成就。金融业是经济的重要组成部分,金融业的蓬勃发展的同时,我国商业银行的个人贷款业务规模不断扩展,贷款余额不断攀升。但由于我国个人贷款业务起步较晚,又经历了2007年美国次贷危机和2018年中美贸易摩擦以及国家对房地产业的宏观调控,个人贷款业
在科学与工程计算领域,很多的重大课题都需要海量的计算,这远远超出了微处理机的计算能力。因此,大规模并行计算机系统应时而生,并且逐渐成为高性能计算的主流。随着大规模并行计算机系统规模的越来越大,系统中的处理机和物理连线变得越来越多,处理机和物理连线发生故障是不可避免的。只有及时识别出系统中的故障元素并替换掉它,才能保证计算机系统的可靠性。系统能够自我识别的故障处理器的最大数目称为系统的诊断度。在计算
本文从倏逝波原理出发,以熔融拉锥技术为主要制备方法,系统开展了基于多模/少模微光纤的模式干涉仪研究。探究了微光纤的折射率(RI)敏感特性,开发了微光纤辅助(MA)结构的微腔应变传感器。主要研究内容如下:(1)基于倏逝波原理,研究了单模微光纤的基本结构与光传输原理,分析了基于微光纤的模式干涉仪的工作原理。利用光束传播方法(BPM),仿真研究了单模、多模微光纤的模式激发与模式耦合特性。分析了拉锥参量设
工业行业作为经济发展的主导产业,工业增加值占GDP的比重一直维持在三成以上。但是,受经济新常态和供给侧结构性改革的影响,近年来中国经济发展由高速增长转为中高速增长。因此科学有效地评估工业发展状况以及进行产业结构的调整升级至关重要。数据包络分析(DEA)作为一种数据驱动的效率评价工具,能够有效应对复杂系统内决策单元(DMUs)多投入和多产出的情况,被广泛应用在相对效率评价方面,目前已有众多学者将DE
越来越多的企业在面对激烈竞争和内外部压力下,选择实施ERP(企业资源计划)增强自身的核心竞争力,通过改进管理模式和流程控制,提高经营业绩和盈利能力。H集团公司加快数字化转型步伐,推进产业转型升级和高质量发展,统一规划和部署集团信息化建设,将ERP系统作为重点建设对象,保障集团的管理模式得以贯穿各级公司,实现集团价值最大化。但在ERP推广实施过程中,在计划制定、进度控制等方面存在一定的问题和风险,如