【摘 要】
:
异常检测任务主要致力于在众多正常的数据样本中检测出异常的样本。该任务针对能够获取的数据样本进行建模并且挖掘出偏离正常模式的样本。由于医学影像,工业质检,金融系统,公共安全等广泛领域的需求和应用不断增加,异常检测技术发挥着举足轻重的作用。近年来,随着深度学习的发展,基于神经网络的异常检测方法获得了广泛研究与关注。但是,异常检测任务仍然存在着巨大的挑战。异常检测任务是一个二分类问题,与传统的分类问题相
论文部分内容阅读
异常检测任务主要致力于在众多正常的数据样本中检测出异常的样本。该任务针对能够获取的数据样本进行建模并且挖掘出偏离正常模式的样本。由于医学影像,工业质检,金融系统,公共安全等广泛领域的需求和应用不断增加,异常检测技术发挥着举足轻重的作用。近年来,随着深度学习的发展,基于神经网络的异常检测方法获得了广泛研究与关注。但是,异常检测任务仍然存在着巨大的挑战。异常检测任务是一个二分类问题,与传统的分类问题相比,其存在正常数据和异常数据数量不均衡,缺陷类别样本搜集不全,存在未知的异常样本等挑战。针对这些挑战,大多数先前方法采用半监督的学习方式只需要对正常类别样本进行建模并且希望学习到的样本分布充分拟合真实数据样本的分布。但是在构造正常样本的隐空间过程中会遇到来自对抗样本攻击的鲁棒性问题,正常与异常样本之间缺乏判别性特征问题,正常样本模式丢失问题和构建隐空间过程中网络训练不稳定性问题。此外,多场景下从真实数据的隐空间中学习到的特征分布存在过拟合问题。本文将聚焦于这些问题提出一系列隐空间优化技术,形成的贡献点可归纳如下:(1)针对异常样本中存在对抗攻击样本问题,本文提出了一种对偶自编码器框架。异常检测器不仅要发现分布外的样本,还需要提供足够抵御对抗性攻击者的防御。本文提出了基于对偶自编码器的对抗网络同时优化图像重建空间和特征隐空间以提高性能。其中,互信息估计器被视为特征空间正则化器。该正则化器对隐空间进行优化,其主要来提取目标类的最独特信息。在分布外样本检测任务中,本文的模型与最先进的半监督异常检测器相比具有明显的优势。在对抗攻击样本检测任务中,为了在更复杂的对抗性攻击场景中进一步评估所提出的方法,本文提出的数据集中分别使用FGSM、BIM和DeepFool对抗攻击方法生成了三个基于停车标志图像的对抗性攻击数据集。与其他方法相比,面对这些更加复杂的对抗攻击样本,本文提出的模型依旧表现出较高的鲁棒性。(2)针对构造隐空间过程中正常样本与异常样本特征判别能力低问题,隐空间模式丢失问题和构造隐空间过程中网络训练不稳定问题,本文提出了三个解决策略。1)针对隐空间特征判别能力低问题,本文提出了一个对比学习网络旨在通过互信息估计“学会比较”进行隐空间优化。在这过程中,直接通过使用数据增强策略构造难负样本,以此帮助生成网络获得更具辨别力的隐空间特征表示。2)针对隐空间模式丢失问题,本文提出了一个使用间接生成过程和最近邻策略的新框架。该框架旨在确保对于每个训练图像都至少存在一个候选生成图像,训练过程中最近邻候选生成图像的分布逼近对应的训练图片的分布,从而避免了训练样本模式丢失问题。3)针对训练不稳定问题,本文提出了一种新颖的解码器-编码器-解码器框架。为了稳定训练,本文采用自编码器来作为鉴别器。与典型的二分类逻辑损失相比,自编码器基于重建的输出提供了更多的梯度信息。丰富的梯度信息促使模型更快地搜索最优梯度方向,获得稳定的训练过程。与最先进的异常检测方法相比,三个解决策略在DCASE数据集上提高了 1.1%AUC指标。(3)针对多场景下从真实数据的隐空间中学习到的特征分布过拟合问题,本文在视频监控场景和工业质检场景中,根据原始数据和网络特性,分别提出了基于多细粒度的隐空间约束。1)针对视频监控场景下,本文提出了一种具有三个一致性约束的新型双向预测网络架构。该框架从三个角度促使学习到的分布逼近真实数据分布,其中包括前后向预测约束,跨模态关联约束和时间序列完整约束。实验表明,本文方法与最先进的异常检测器相比,在UCSD Ped2、CUHK Avenue 和 ShanghaiTech 数据集上分别提高了 1.0%、0.7%和3.3%AUC指标。2)针对工业质检场景下,本文提出了一个基于隐空间特征匹配的知识蒸馏框架。该框架从两个角度促使学生网络学习到的特征分布逼近原始数据在ImageNet数据集隐空间中的特征分布,利用整体特征分布匹配和中间各层特征独立匹配相结合的方式将无缺陷样本在ImageNet数据集的隐空间特征表达充分传递给学生网络的隐空间。在实验部分,本文证明了该框架的有效性,并且表明与MVTecAD异常检测数据集上的最先进方法相比,该框架获得了优越的工业产品异常检测效果。
其他文献
研究蛋白质-小分子、蛋白质-蛋白质以及蛋白质-核酸相互作用对于理解生理过程、解释疾病和设计新药均具有重要的指导意义。虽然不少实验手段可以为蛋白质与配体之间的相互作用提供一些信息,但实验过程常常需要花费许多人力物力与财力。与此相比,理论计算在计算机能力高速发展的当下,越发地在科学研究领域中显示其优越性。分子动力学模拟、量子化学计算和分子对接等方法已经建立,对蛋白-配体复合物结合细节的预测,已具有一定
胰腺癌是目前最致命的恶性肿瘤之一,5年生存率仅为9%,是全球癌症相关死亡的第七大主要原因。胰腺癌的传统治疗方法包括手术切除、放疗和化疗等,但临床上患者易复发、易耐药。此外,由于胰腺癌的免疫原性较低,现有的免疫检查点阻断剂等免疫治疗效果并不理想,因此亟需寻找新的更有效的治疗策略。重组免疫毒素(recombinant immunotoxin,RIT)是将抗体可变区和细菌外毒素融合表达的重组蛋白,结合了
双孔钾离子K2P通道是一类由KCNK基因家族编码的,具有四次跨膜和两个孔道(4TM/2P)结构的离子通道。在静息状态下,K2P通道能够形成背景电流或漏电流,从而维持细胞的静息膜电位水平,控制细胞兴奋性。K2P通道在神经系统中广泛表达,并参与多种生理病理过程,包括疼痛、抑郁、神经保护、癫痫和局部缺血等。目前关于K2P通道家族公认的门控机制包括C型门控,此外K2P通道还受到胞内结构域的调控影响,电压、
固液界面核心热力学参量及其变化规律的物理本质的获取,对先进金属制造凝固过程控制技术的革新至关重要。由于原子尺度固液界面的实验表征十分困难,近年来研究致力于发展“计算机实验”技术进行探究。然而,现有研究偏重性质计算和测量,对于局域粒子堆积结构,在两相竞争环境下如何受晶格类型、晶面取向、原子间相互作用的共同影响机理认识不够充分,致使本领域一系列科学问题亟待解决:如,界面结构本质(弥散或尖锐)的界定长期
土壤作为自然界的重要组成部分,其各种属性的时空变化对农业生产和生态环境有重要影响。因此,了解其时空分布状况、特征及其影响机制对农作物提质增产和生态环境可持续发展有重要意义。当前的相关研究中,区域尺度的土壤属性时空特征分析主要是基于首尾时间的空间分布数据进行,缺乏对时空连续变异过程的分析,无法完全表达土壤属性的时空变异特征。另外,目前的研究中,普遍缺乏对土壤属性未来分布状况的时空预测。基于以上考虑,
香菇(Lentinula edodus)在我国食用菌产业中具有重要地位,是年产量最高的人工栽培食用菌。香菇料袋或菌棒感染木霉菌(Trichoderma spp.)是导致香菇大幅度减产、产业效益下降的主要因素之一。木霉菌不仅可污染已灭菌的培养料,与香菇菌丝竞争营养和生长空间,还能在香菇菌丝培养、转色和出菇等阶段感染菌丝体而引起菌袋污染或菌棒腐烂。尤其是香菇菌棒受到高温伤害后生长衰弱,更易受到木霉菌感
细胞质雄性不育(Cytoplasmic male sterility,CMS)系统是甘蓝型油菜杂种优势利用的重要途径。利用该系统易于获得全不育群体,降低杂交制种的成本,有利于杂交种在生产上普及应用。从萝卜中发现的Ogu CMS具有不育性稳定、彻底,被成功转育到甘蓝型油菜后,被认为是油菜杂种优势利用最理想的细胞质不育类型。但该类型胞质不育的恢复源仅存在于萝卜中,而直接利用萝卜转育甘蓝型油菜Ogu C
绝大多数的公钥密码方案(包括认证加密方案)依赖于能生成完美随机数的随机数源,以保障方案安全性。然而,错误的算法实现、恶意颠覆以及其他各种原因都会导致随机数源产生不良的随机数。这些情况下的随机数源我们称其为随机数后门攻击下的随机数源。目前已有较多抗随机数后门攻击的方法被提出,典型方法包括对冲公钥密码学(hedged public key cryptography,HPKC)及其变体基于 nonce
马铃薯(Solanum tuberosum L.)是全球第三大口粮作物,在保证粮食安全、消除贫困、增进人类健康等方面具有重要的作用。但马铃薯在生产中易受50余种病毒的侵害,其中,以马铃薯Y病毒(potato virus Y,PVY)危害最为严重,特别是在二次侵染或复合侵染时会导致马铃薯减产超过85%。病毒病无法实施有效的化学防治,加之我国缺乏完善的种薯认证体系,解析病毒的侵染机制,发掘和利用寄主重
陆地生态系统呼吸是全球碳循环的重要组成部分,其微小变化会引起大气CO2浓度的明显波动,从而进一步反馈全球气候,因此准确量化陆地生态系统呼吸有助于理解全球碳循环与气候变化间的反馈机制。然而现有的生态系统呼吸估算方法忽略了关键生理参数的昼夜差异以及水分对呼吸的影响,其结果存在较大的不确定性,导致当前对全球生态系统呼吸的时空变化格局和潜在机理仍缺乏足够的认识。因此,为了探究近三十年来全球陆地生态系统呼吸