基于深度卷积神经网络的真实场景物体检测算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zhuav
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物体检测技术旨在识别并定位图像中的物体,是机器视觉领域中的一个核心研究问题,同时也是人工智能的一个重要组成部分,一直是学术界和工业界的重点研究课题之一。虽然经过了几十年的发展,目前的物体检测算法大多仅是在实验室摆拍图像上的检测效果表现良好,但是在复杂世界的真实场景中,需要依赖有标注信息的图像来训练一个物体检测网络,其检测效果远远不能令人满意。同时,对于真实场景下的小物体(面积小于32*32像素)检测问题,尚处于对特定问题设计特定算法的阶段,对真实场景下复杂多变的工作环境的自适应能力较差。针对上述问题,本文围绕稀缺/稀疏训练数据驱动下的物体检测算法、小物体特征提取方法以及小物体检测算法框架等方面展开研究,对如何提高物体检测算法对环境的自适应能力、灵活性以及如何提高物体检测的准确性提出了新的方法和建议,对物体检测技术从实验室到实际应用起到了一定的推动作用。本文的主要研究内容概括如下:
  (1)针对已有基于深度卷积神经网络的物体检测算法都依赖大型数据集训练检测网络的问题,而构建大型数据集是一个费时耗力的巨型工程,提出了一种基于伪真值搜寻法的弱监督物体检测算法。其中,针对现存相关算法存在的定位不准确、检测精度低的问题,提出了一种从弱监督到全监督的物体检测架构,其中伪真值搜索(PGE)算法可以为每个物体产生一个较为准确的伪真值边界框。同时,还提出了伪真值自适应(PGA)算法来进一步优化PGE所产生的伪真值。最后,利用产生的准确的伪真值训练一个物体检测网络,来实现真实场景的物体检测任务。实验结果表明,本文提出的算法可以克服实际应用中训练数据稀缺的问题,同当前先进算法相比可以大幅地提高物体检测的准确率。
  (2)针对弱监督物体检测算法与全监督物体检测算法相比存在检测效果较差的问题,提出了一种基于增量式学习法的丢失标签物体检测算法。首先,研究了训练图像中丢失标签对于一般物体检测算法的影响,在此基础上,对在有限的人力物力下如何构建一个大型的数据集给出了具体方案。其次,通过引入人为标注小部分训练数据的方法来提升弱监督物体检测的准确率,且把此任务看成一个丢失标签的物体检测问题。然后,利用所提出的增量式学习框架为丢失标签的物体由粗略到精确逐步地找到一个位置标签,进而结合少部分人为标注的位置标签来训练一个物体检测网络。实验结果表明,本文提出的算法可以利用小部分的标注信息就可以达到较高的物体检测准确率,缩小了与全监督型物体检测算法之间的差距,解决了稀疏数据驱动下的物体检测问题。
  (3)针对目前的卷积神经网络对小物体特征提取困难的问题,提出了一种新的基于多通道高分辨率特征提取法的真实场景多尺度物体检测算法。该算法中所设计的并行卷积层结构可以提取小物体的高分辨率深度特征,其中包含了可以表达小物体各种特性的细节信息特征,克服了现存算法利用浅层特征来实现小物体检测中存在的低语义信息问题。为了进一步地实现多尺度物体检测任务,提出了一种层级间特征融合方法,通过将富含细节信息的高分辨率特征与具有强语义信息的低分辨率特征相融合的方式来构建高质量特征,进而在获得的高质量特征上实现多尺度物体检测。实验结果表明,本文所提出的算法能够更好地适应真实场景下物体的多尺度特点,可以提高小物体检测的准确率。
  (4)针对已有的物体检测算法不能解决小物体自身细节信息不足情况下的物体检测问题,也不能解决遮挡、光照、模糊等自然因素对小物体检测的影响,提出了一种新颖的端到端的基于生成对抗网络的小物体检测架构。该算法首次将超分辨技术成功地应用到小物体检测任务中,首先利用生成对抗网络(GAN)来学习产生低分辨率物体图像对应的高分辨率图像,然后在清晰的高分辨率图像上实现物体检测任务。进一步地,为了促使网络产生更为清晰的超分辨率图像,设计了几种新的损失函数。实验结果表明,本文所提出的小物体检测架构可以克服小物体自身细节信息不足而带来的检测困难的问题,降低了真实场景下的物体检测算法受自然因素的影响,提高了真实场景下小物体检测的准确率。
其他文献
当代社会节奏较快,较大的生活和工作压力导致许多人睡眠存在问题,其中睡眠呼吸暂停综合征是一种常见的、危害较大但又难以被诊断的睡眠疾病。目前,睡眠呼吸暂停综合征临床上通过多导睡眠图诊断,但该方法诊断设备庞大且昂贵,只能在专门的检测室进行检测,检测时在被测试者身体上连接多根电极和导线会给被测试者造成不适。因此研制一款便携式、结构简单、成本低廉和无线传输信号的呼吸功能监测系统具有重要意义。
  呼吸鼻气流与周围环境存在30%湿度差异,是呼吸动作最直接的反映,用于呼吸功能监测具有信号处理简单、成本低和结果可靠
摘要:中韩自建交以来,双边经贸关系发展迅速,在贸易总量、规模、效益等方面都得到不断扩大和显著提高。但日益扩大的逆差成为制约中韩两国贸易持续发展的主要原因之一。青岛市作为国内对韩贸易最为活跃的城市之一,在对韩贸易方面具有显著的代表性。本文以青岛为例,客观分析青岛市对韩贸易逆差形成的主要基因,提出逐步缩小贸易逆差的主要路径,尽快形成对韩贸易的良性发展态势。  关键词:中韩贸易逆差;成四分析;青岛市;对
期刊
摘 要:终极控制人控制下的上市公司形成金字塔控股结构,该结构下终极控制人采用的治理模式各有差异。本文在总结国内外关于金字塔治理结构研究的基础上,从财务政策选择的视角,研究了上市公司多元化投资与财务政策选择的关系。结果显示:多元化程度低的上市公司较多元化程度高的上市公司更倾向于采取负债经营政策;多元化程度高的上市公司其多元化程度与负债经营政策呈正相关关系,但都不显著。  关键词:终极控制人;金字塔结
期刊
摘要:加快新疆城镇化进程在未来一段时问是加快新疆经济发展和改善恢复生态环境的有效途径。为准确把握新疆城镇化发展的趋势,本文应用Logistic模型分析、预测新疆城镇化水平的发展规律,探讨Logistie模型在预测新疆城镇过程中的合理性,并为新疆城镇化发展提供了相关建议。  关键词:城镇化;Logistic模型;发展趋势  中图分类号:F293 文献标识码:A doi:10.3969/j.isn.1
期刊
摘要:西部矿产资源型产业开发对我国经济发展有重要意义,但片面地强调矿产资源型产业的快速发展也引发了一系列社会、经济、生态环境问题。本文结合当前低碳经济时代背景,在详细分析西部地区矿产资源开发利用现状、存在问题的基础上,通过对产业组织模式比较分析。对不同的资源产业生产组织模式数学论证,从集群组织模式改建、清洁生产模式改建、重构产业生态化模式三方面,提出了产业生态化的构建策略。本文对正确评估西部地区矿
期刊
摘 要:一项政策是否能产生满意的效果,主要取决于政策是否合理、落实是否到位以及民众是否积极配合。杭州市垃圾分类政策已实施多年,为了解其实施效果,本文从居民的配合程度、政策落实的满意程度以及政策的有效性3个方面展开了调查,并对数据进行了分析,得出了各个方面的实施效果以及存在的问题,并相应地提出了合理的建议。  关键词:垃圾分类;政策效果;问题分析  中图分类号:X705 文献标识码:A
期刊
摘 要:“煎饼果子”是北京大学校园中的流行食品,深受同学们喜爱。本文以问卷调查得到的数据为基础,对北京大学2011级学生的煎饼果子市场需求进行实证分析,研究市场需求的总体情况、需求曲线、需求弹性以及影响需求的核心因素。结果表明,因商品价格较低,饮食开支的多少对煎饼果子需求的影响非常小,偏好是影响煎饼果子需求的重要因素,性别与煎饼果子需求量大小有关。煎饼果子需求量与价格的关系符合需求定律,根据拟合曲
期刊
在机载下视目标识别领域,由于场景多变,目标尺寸多样,小目标较多,传统的检测算法对机载下视目标识别效果差,但基于深度学习的目标检测算法在该领域能取得优异表现。深度学习目标检测算法计算量大,而航电嵌入式系统功耗低,计算和访存资源不足。因此,本文研究基于航电嵌入式平台的深度学习目标检测系统,在计算和访存资源受限条件下快速准确地实现识别机载下视目标识别任务。
  针对嵌入式平台计算和存储资源受限而难以适用于常规深度学习网络的问题,本文基于ARM+FPGA的异构计算平台,设计总体加速方案,实现机载下视的目标识
机械设备是一个由多个部件构成的组合体,在动力源驱动下,各部件间相互协调工作,能够完成一定的工作任务。滚动轴承是机械设备中最为常用的机械部件,在实际的运行过程中发生故障的频率也较高。滚动轴承能否稳定的工作不仅决定着机械设备的工作效率和产品质量,而且还影响着工业生产过程的平稳、安全运行。因此,深入分析滚动轴承在设备运行过程中常见的故障,在故障发生初期能够及时预警,并进行维修与维护是保证设备正常运行、延
随着光运算、光通信、光纤传感等领域的迅猛发展,光波导耦合结构被广泛应用在这些领域。在光运算领域,为实现更高效的运算,需进一步增大非线性效应。在光通信领域,基于对信道高隔离度的要求,需要光分插复用器实现可调谐滤波。在光纤传感领域,需要传感器将外界物理量变化调制为光强或频率变化。球形光波导被广泛用于满足上述需求。例如,球形光波导光学诱导透明引入了四波混频效应,实现了对信号光“开”和“关”的控制。利用球形光波导良好的谐振选频特性,实现了光分插复用器的可调谐滤波。多种基于球形光波导的光纤传感器,实现了将外界物理量