【摘 要】
:
图像分类是计算机视觉领域中非常经典的任务,在图像检索、医疗诊断、智能安防、自动驾驶等领域具有重要的理论意义和实用价值。近年来,由于深度卷积神经网络的应用,图像分类的性能取得了质的提升。但是,目前良好的分类性能大都是在清晰图像上获得的。然而,在许多实际应用中,比如自动驾驶、视频监控、可穿戴相机和医疗成像,获得的图像并不总是清晰的,相反,它们往往包含各种各样的退化。因此,对低质图像的研究是亟待解决并且
论文部分内容阅读
图像分类是计算机视觉领域中非常经典的任务,在图像检索、医疗诊断、智能安防、自动驾驶等领域具有重要的理论意义和实用价值。近年来,由于深度卷积神经网络的应用,图像分类的性能取得了质的提升。但是,目前良好的分类性能大都是在清晰图像上获得的。然而,在许多实际应用中,比如自动驾驶、视频监控、可穿戴相机和医疗成像,获得的图像并不总是清晰的,相反,它们往往包含各种各样的退化。因此,对低质图像的研究是亟待解决并且具有实际意义的问题。目前,图像复原和图像分类任务基本上是单独进行研究,现有的低质图像复原方法一般只考虑视觉效果,很少考虑该如何服务于图像分类任务。目前的图像分类方法大都是针对清晰图像,很少针对现实生活中更加常见的低质图像。本文以低质图像的复原与分类为主要研究对象,把图像复原与图像分类任务联系起来,使得两者之间相互促进,即图像复原任务能更好地服务于图像分类任务,图像分类任务能引导图像复原任务,对低质图像复原与分类具有非常重要的启发意义,有助于促进图像复原和图像分类领域的发展。总之,该研究不仅具有非常重要的理论意义,而且具有非常广泛的实用价值。本文的创新工作主要包括:(1)针对清晰图像上获得的好的分类性能在低质图像上是否能保持这一问题,本文分析了图像质量下降对基于卷积神经网络的图像分类性能的影响。具体来说,首先,研究了九种不同类型的合成低质图像以及从网上收集的真实雾霾图像对基于卷积神经网络的图像分类性能的影响,实验结果表明,随着图像质量的下降,图像分类性能急剧下降。然后,提出了提高低质图像分类性能的方法,一是通过在相同低质类型相同低质水平的低质图像上进行训练和测试,二是混合相同低质类型不同低质水平的低质图像,组成混合的训练集进行训练。虽然分类性能有所提高,但是和清晰图像的分类性能相比还存在一定的差距。最后,从特征层面分析了低质图像分类性能比较低的原因可能是图像质量的下降,导致图像模糊、颜色扭曲等。(2)针对应用图像复原预处理,图像分类性能是否能显著提高这一问题,本文研究了图像复原对基于卷积神经网络的图像分类的影响。具体来说,以图像去雾霾和图像去运动模糊为例,首先,利用现有的不同图像复原方法,来复原对应类型的低质图像;然后,分析图像复原对基于卷积神经网络的图像分类的影响;最后,分析了图像复原和图像分类的相关性。研究结果表明图像复原对提高后续图像分类任务性能的帮助不大。原因是现有的大多数图像复原方法只是处理输入的图像,而没有为图像引入新的信息,并且图像复原过程中可能导致图像的部分信息丢失、图像的结构被破坏等,因此对分类性能帮助不大。(3)现有的低质图像复原方法往往只考虑视觉效果,而忽略了后续的高层视觉任务,例如图像分类,并且人工标注大量的带类别标签的数据既昂贵又不切实际。为此,本文提出了一种自监督图像分类任务驱动下的图像复原方法。具体来说,首先,利用像素级的均方误差损失函数训练图像复原网络。其次,利用对图像旋转角度进行分类来学习有利于识别图像的特征,来进一步帮助图像复原,进而使得复原后的图像能够有助于图像分类。为此,引入图像旋转损失函数,即复原后图像和清晰图像的旋转角度特征之间的距离,来约束图像复原网络。最后,同时利用上述两种损失函数对图像复原网络进行训练,来进一步提高图像复原的性能。在雾霾图像、低分辨率图像和运动模糊图像上的实验结果表明了该方法的有效性,有效地解决了现有图像复原方法的不足。(4)基于清晰图像训练的分类模型通常包含丰富的有用信息,但是现有的低质图像分类方法忽略了这些有用信息,导致低质图像与清晰图像之间的分类性能差距比较大,进而使得基于低质图像的类别分布、特征分布和视觉注意通常与清晰图像的相关特性不一致。为此,本文提出了一种端到端的一致性引导网络用于低质图像分类。具体来说,首先,提出了类别一致性损失来指导模型学习更加符合清晰图像的类别分布。其次,提出了语义一致性损失来指导模型学习更加健壮的特征表示,使其与清晰图像的语义信息更加一致。最后,提出了视觉注意对齐损失,可以对清晰图像和低质图像的语义信息区域进行对齐,从而提高低质图像的分类性能。该方法具有通用性,适用于各种类型的低质图像,在六种低质图像上的实验结果表明了该方法的有效性。
其他文献
多式联运作为一种综合的现代化运输方式,是我国未来交通运输发展的主要方向。集装箱铁水联运结合了集装箱运输、铁路运输和水路运输的多重特点,能够在提高运输效率、降低物流成本的同时,降低排放、减少污染。随着我国交通运输结构性改革,进港铁路建设的不断加快,“公转铁”的趋势越发明显,我国铁水联运也进入高速发展期。集装箱铁水联运的有效开展不仅需要依靠完善的基础运输网络和先进的装卸转运设备,还需要科学的集装箱集疏
安全是轨道交通向前发展的先决条件,列车安全是轨道交通安全最关键的一环。轮对轴承起着支撑列车的关键作用,是列车的核心部件,其重要程度不言而喻。因此,轮对轴承健康状态实时在线监测,及时准确地发现轮对轴承的故障对于保障轨道交通列车运行安全显得尤为重要。但我国现有的列车轮对轴承监测技术仍旧无法满足这一需求。为了保障列车轮对轴承的实时在线监测,本文从轮对轴承振动数据感知和健康状态的识别设计研究思路和框架。首
跨入新发展阶段,我国老年教育要运用均衡化思维解决好发展不平衡问题。老年教育均衡发展是社会相对于当前现实存在的学习需求与教育供给不均衡、教育发展水平和服务质量差异过大而提出的发展模式。老年教育均衡发展要坚持保障机会均等、提升教育服务质量、优化公共服务体系的目标脉络,在"时间-空间-技术"维度框架上注重老年教育均衡化实践的动态性、生态性和能动性,以保障老龄群体终身学习权建立政策目标,以扩大老年教育服务
运营速度200 km/h的中速磁浮是一种服务于城市圈内大流量、高密度客流的新型轨道交通方式,具有广泛的应用前景。为了提升中速磁浮商业运营竞争力,需要在规划和运营阶段,以运行效率和运行能耗最优为目标,研究中速磁浮系统运行策略优化问题。为此,本文探讨中速磁浮运(运行层)、控(列控层)、电(供电层)3个层次的一体化优化策略(即列车运行图、列车目标速度曲线、直线电机控制策略),使中速磁浮列车高效、节能运行
随着信息技术的发展,数字多媒体越来越广泛地出现在了人们的生活中,其中,图像与视频无疑占据了数字多媒体数据的主要部分。由于原始的图像和视频的数字表示需要占据巨大的空间,因此,许多的编码算法被开发出来,用来有效地压缩图像和视频,以便于其存储和传输。然而,随着各种数字表示格式以及各种应用需求的不断增加,数字多媒体信号的存储和传输仍面临着巨大的挑战。本文针对三维视频中多视点+深度的表达格式,以提高虚拟视点
人类活动范围的不断扩张增加了对于地面移动系统的需求,各类无人地面移动系统正发挥着越来越重要的作用。当前,无人地面移动系统已经被广泛应用于资源勘探、物资运输、灾难救援军事侦查与作战等众多应用场景。为克服不同应用场景中的地形与行走工况,移动系统对地形越障性、可靠性与续航能力具有较高的要求。与传统的轮式与履带式移动系统相比,足式移动系统与地面离散接触的特性带来相对独特的行走特性与移动性能。本文以单自由度
用历史制度主义的分析范式,检视老年教育政策的历史变迁与逻辑演变,是解读老年教育政策的一个新视角。改革开放以来,我国老年教育政策从初步探索到体系逐渐形成,呈现多元化和特色化的发展趋势。通过历史制度主义分析框架,采用扎根理论编码方式,梳理我国老年教育政策文本,审视我国老年教育政策的逻辑演变,可以发现,老年教育政策的发展受到教育实践定位、宏观制度环境、内生动力机制、教育发展理念、主导强化机制和关键时间节
具有纳米层状结构的三元化合物MAX相陶瓷由于其块体材料所表现出的高温氧化行为、高损伤容限和抗热冲击性等与摩擦学特性相关的特殊性能,使其有望应用于摩擦领域。已有研究表明,典型的MAX相如Ti3Si C2、Ti3AlC2等在干滑动摩擦条件下与低碳钢盘高速对磨时,摩擦学特性表现优良,这主要与其摩擦面上形成的由Ti和A位元素(Si或者Al)混合氧化物组成的摩擦学薄膜有关。本文利用钛铝碳的A位元素氧化物摩擦
随着综合交通运输体系的逐步完善和“一带一路”重大倡议的提出,多式联运已成为我国货物运输发展的必然趋势,铁水联运依靠低成本、大运量、衔接便利、安全可靠等优势成为多式联运体系的重要环节,同时,我国经济的“新常态”发展对交通运输总体能耗提出了新要求。铁水转运的作业时效性、有效衔接度、和高效低能耗发展更是未来我国交通运输调整结构、转型赋能的重点方向。集装箱铁水联运港站作为联运体系中的重要节点,其内部作业组
移动边缘计算(Mobile Edge Computing,MEC)是一种在网络边缘配置计算和存储资源的新兴计算范式,弥补云计算的不足,为攻克设备计算和存储资源受限无法满足新兴应用计算需求的难题提供新的解决方案,引起国内外相关业界的高度重视。设备通过计算卸载将计算密集型应用传输至边缘服务器执行,满足业务计算和低时延需求。然而,相比于云计算中的计算卸载,MEC的计算和存储资源有限。因此,在MEC的计算