基于RetinaNet的行人检测算法研究

来源 :大连理工大学 | 被引量 : 1次 | 上传用户:dongmeizi1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测任务作为一项传统的计算机视觉任务,广泛应用于智慧交通和智能监控等方面,对于保障智能化设备的安全工作有着重要作用。卷积运算具有局部连接、权重值共享等特点,使其在计算机视觉任务中得到广泛的应用。在卷积神经网络兴起后,行人检测任务取得了突破性的进展。但由于行人目标距离拍摄装置的距离不同,行人在图片中的大小尺度也不相同,这为行人检测任务增加较大难度。对于多尺度目标的检测,卷积神经网络中的特征金字塔结构一直备受研究者的青睐。RetinaNet便是一种利用该结构来实现多尺度目标检测的卷积神经网络算法,但利用特征金字塔提取的特征缺乏足够的边缘纹理特征,以及存在一定的混叠效应的问题,从而影响检测精度。本文在RetinaNet的基础上做出相应的改进,具体的研究工作包括:(1)RetinaNet作为通用目标检测网络,与行人检测任务存在参数不匹配的问题。因而本文利用INRIA数据集训练改进的RetinaNet,分别确定其主网络结构、预选框的尺度和宽高比以及Focal Loss的权重系数和聚焦系数。除此之外,本文还利用多尺度训练的方法,使不同批次的训练图片的分辨率互不相同,从而提高神经网络对不同尺度的行人的检测能力。(2)本文提出了双特征金字塔的特征融合架构来提高多尺度行人检测精度,该方法通过引入更浅层卷积特征来解决各层特征尤其是深层特征缺乏边缘特征信息的问题。在INRIA数据集,IOU分别为0.5和0.7时,相较于特征金字塔结构,该方法的漏检率分别降低0.23%和1.03%,在Caltech数据集大尺度检测实验中,漏检率降低3.22%。为了进一步提高多尺度行人检测精度,本文还在该框架中加入了扩张卷积模块,从而提高深层卷积特征的感受野,强化深层行人类别特征,通过特征融合来提高各卷积特征的多尺度行人检测精度。(3)本文采用特征增强方式,通过建立卷积特征通道之间的相互依赖性来对特征重新校准,从而选择性地强调有益行人特征。通过改进预测模块来进一步整合和调整融合后的特征以使其更适合行人检测任务,以及在后处理过程中利用弱化的非极大值抑制来代替非极大值抑制算法,从而来提高拥挤状态下行人检测的精度。在Caltech数据集的检测实验All的漏检率达到56.65%,INRIA数据集IOU为0.5和0.7的漏检率分别达到5.19%和9.65%,在与其他算法的对比中,改进的RetinaNet综合性能较为优异。
其他文献
固体氧化物燃料电池(SOFC)是新一代的高效能源发生装置。其阳极材料是SOFC三个重要构件之中最为关键的组成部分,阳极催化性能的优劣直接决定了电池对外做功的能力,故探索寻求良
科技创新和商业模式创新融合对转变经济发展方式意义重大,探明两者融合的影响因素是推动两者有机融合的关键。文章运用扎根理论,以湖北省装备制造业为例,挖掘提炼出影响科技
十八大以来,党中央针对干部工作中长久存在的能上不能下、能进不能出问题,提出要全面从严治党、从严管理干部,并对解决能上不能下问题作出具体规定。作为高校干部人事制度改
比较邻里中心在新加坡和苏州工业园的历史建设经验,探索总结新一代邻里中心的发展趋势和发展特点,结合设计实践,分析新一代邻里中心在角色定位、用地规模、空间布局、功能业
企业文化建设是一种有效的公司管理手段。保险公司历来很注重企业文化建设,但很少把风险管理作为企业文化建设的内容和目标之一。风险管理是保险公司经营管理的核心,有效的风
为了构建从设计元素到顾客感性的映射知识,引入混合Logit回归的方法到感性设计领域。在处理无序响应变量时,在较好地设置参数分布形式的前提下,相对于常规Logit和常规Probit模型
日本的“言文一致”运动始于1887年。当时,日本近代文学创始人之一的二叶亭四迷用「だ体」发表了小说《浮云》,开创了“言文一致”文体的新纪元。现代文体的建立使句尾表达形
目的:通过流行病学调查方法分析632例高血压病患者的中医症状与证候要素的相关性。方法:对632例高血压病患者进行横断面调查,整合高血压病证候要素为虚、瘀、火,采用SPSS21.0
目的:研究老老年原发性高血压病(EH)患者中医证素分布特点,为临床中医辨证论治提供更多的依据。方法:选择2013年7月-2014年7月中国中医科学院广安门医院心内科住院的年龄≥80
文章应用AVL Cruise软件对某载货车进行了动力性和燃油经济性分析,通过优化动力总成匹配,在确保整车动力性前提下,达到降油耗目的,并与试验结果对比分析,其仿真分析结果与试