基于深度学习的视频异常事件检测算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:BenBenBenBen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异常检测是计算机视觉中一个活跃的领域,已经广泛应用于众多场景,尤其是在视频监控中。目前,智能化视频监控系统可以实时检测出异常行为,减小异常事件带来的损失。然而,在许多真实的场景下,获取和标注异常样本是一项费时费力的工作,对此,基于无监督或者半监督学习的异常检测不失为一种有优势的方法。这类异常检测算法主要利用输入空间和输出空间的特征差异来检测异常,然而它们既没有利用高层次和潜在空间中的特征信息,也没有充分考虑正常模式和异常模式的多样性。为了弥补以上的缺陷,本文采用基于深度学习的方法提出三个无监督异常检测模型,具体内容和研究成果如下:首先,本文回顾了异常检测的研究现状,对当前的研究方法进行归纳分类,指出现阶段亟待解决的问题;同时,介绍异常检测的深度学习基础和两种常用的异常检测框架:自编码器和生成式对抗网络。接着,针对目前的方法忽略潜在空间的特征信息这一缺陷,本文设计了一个通过对抗训练的潜在特征自编码器,提出加权特征一致性损失和特征判别损失。潜在特征自编码器利用自编码器和判别器潜在空间中的特征信息,在CIFAR-10和CIFAR-100数据集上的AUC分别取得85.1%和80.6%,并且在UCSD Ped2数据集上的检测速度能达到每秒60帧,充分体现了潜在空间特征的重要利用价值。然后,为了结合潜在空间特征和时间特征信息,本文研究了基于预测的视频异常检测算法,提出一个内存模块自编码器和内存三元组损失。内存模块自编码器的输入是连续的视频帧,输出是未来帧,结合预测损失和多规模结构相似性度量来检测多视角、多规模的异常,在UCSD Ped2数据集上的AUC和检测速度能达到97.2%和每秒75帧,可以应用于真实的智能化视频监控系统中。最后,在以上方法的基础上,本文研究了基于事件补全的视频异常检测算法,并提出一个多模态事件补全自编码器(MECA)。该算法利用目标检测算法和梯度图像生成不完整的视频事件,再结合外观模态和运动模态的特征对不完整视频事件进行补全,可以同时利用潜在空间特征、时间特征、运动特征和高层次的语义信息。MECA在UCSD Ped2和CUHK Avenue数据集上的AUC分别达到97.8%和90.8%,在多个数据集数据集上的实验结果证明了MECA的有效性,并且优于内存指导自编码器(MNAD)、内存扩展深度自编码器(Mem AE)、视频事件补全(VEC)等主流方法。
其他文献
学位
21世纪以来,在消费者需求驱动下,越来越多制造商从产品销售向“产品+服务”销售转变。C2M模式通过“短路”分销商和品牌商,帮助制造商向下游延伸服务能力,成为众多制造商转型升级的首要之选。然而,受限于资金和数据,大部分制造商无法实现与消费者的直连。C2M团购模式的兴起为制造商摆脱这一困境提供了可行方案,如社交团购通过平台赋能制造商实现了制造商和消费者的直连,社群团购通过支持消费者以“团”的形式主动向
学位
近年来,手机、电脑、数码相机等电子产品更新迭代速度加快,我国废旧电子产品存量剧增,专注于废旧电子产品回收的第三方回收平台以其便捷性和安全性成为消费者回收的新选择,并在近五年快速发展。但我国“互联网+”回收行业现阶段缺乏透明的定价标准和完善的估价系统,随着消费者公平意识的增强,消费者与回收平台之间的价格争议屡有发生,不同回收平台间的价格差异及回收平台的恶意压价行为容易使消费者产生不公平感,从而直接影
21世纪对人类来说是地下空间的世纪,其中地下隧道作为地下空间开发利用的重要组成部分,在国民的经济建设中发挥着重要作用。事实上,上世纪六七十年代修建的大量人防工程隧道,由于当时的建设标准落后,以及年久失修、疏于维护管理等因素,这部分防空隧道大多都被废弃。为了满足工程后续规划及地下空间再利用要求,发挥这些废弃隧道的作用,就需要对其内部进行测量,获取其精确的三维结构信息。而对于建成时间久远的隧道,其施工
学位
学位
学位
学位
B2C电子商务模式快速发展导致各平台间竞争日剧激烈,平台通常依靠更低的商品价格水平来吸引顾客,然而“价格战”非长久之计,客户体验才是平台可持续发展的前提,精细化的用户运营可以满足消费者更个性化的客户体验需求。因此面向消费者的“免费+付费”服务定价策略受到平台重视,它不仅能够有助于提高消费者的忠诚度还能成为平台新的盈利增长点,为此本文基于平台差异化服务内容研究客户体验与其感知价值,分析影响平台定价策