【摘 要】
:
视频监控应用于生活的各个方面,给政府维护社会安全带来了便利。但也存在问题,即在发生突发事故后,海量的监控视频需要耗费大量的人力来搜索关键视频片段。随着人工智能的快
论文部分内容阅读
视频监控应用于生活的各个方面,给政府维护社会安全带来了便利。但也存在问题,即在发生突发事故后,海量的监控视频需要耗费大量的人力来搜索关键视频片段。随着人工智能的快速发展,应用在视频监控上的技术也越来越成熟,使得自动识别定位成为可能。而视频中的行人是监控的重点,服装是行人最显著的特征,若能进行有效的服装属性识别,则有利于行人的自动识别跟踪。不仅能提高工作人员的效率,对行人行为解析也具有重要意义。本论文基于深度学习,对行人服装识别方法开展研究,本文的主要工作如下:(1)介绍了行人服装属性识别的研究背景及意义,对目前国内外深度学习、行人检测和服装识别方法的发展现状进行了概述。阐述了卷积神经网络的相关知识,其中主要有:组成卷积神经网络的单元层和单元层组合的宏观结构、损失函数、正则化方法、神经网络参数优化方法和16层视觉几何群网络模型。(2)构建了一种单步多框的行人检测算法(Single Shot Multi Box Pedestrian Detector,SSPD),在保证实时的情况下可以达到较高的精度。在该算法中,底层的特征层负责检测图片中占比例较小的行人,高层的特征层负责检测比例较大的行人。该方法有助于提高行人检测的召回率,尤其是比例较小的行人。同时,设计了一种新的长宽比先验框(0.41:1)用于降低错误率和加快行人检测速度。然后,通过优化原始SSD损失函数以便更适应行人检测,这样不仅可以消除分类器的干扰还可以降低时间复杂度。仿真结果表明,本文提出的算法在帧率达到20 fps的情况下,行人检测准确率达到了88.12%。与其它算法的比较结果表明,本方法是适用于实际行人检测的最佳模型,是一种在精度和速度上能够达到平衡的算法。(3)构建了一种多任务分步迁移深度学习网络模型(Multi-Task Stage Transfer Deep Learning,MTST),可在户外行人服装数据集严重缺乏的情况下,识别户外无约束条件下的行人服装属性。该方法使用了像人类学习一样由易到难的分步学习策略,先对电商网站带有标签注释的源图片进行特征提取,设置的损失函数有利于提取更多区别属性的特征,然后将学到的属性迁移到无约束条件下的目标图片中。结合本文提出的行人检测算法,将行人检测模型中提取到的前景框输入该模型,综合属性识别准确率达到了64.8%。将该方法与其它典型的服装属性识别深度学习模型进行了比较,在训练集少于4000张图片的情况下,比目前公认最好的FashionNet方法高出约6%。结果表明,MTST识别服装属性的准确率有了一定的提高。
其他文献
随着世界各国的交流不断加深,翻译起着不可替代的作用,其中,法律文本翻译也是一个重要媒介。本翻译实践报告选取了笔者为苏州小火箭文化发展有限公司所翻译的《竞争法》为例,在目的论视角下分析法律文本翻译实践的难点并给出相应的翻译策略。根据目的论,所有翻译遵循的首要法则就是目的法则,翻译行为所要达到的目的决定整个翻译的行为过程。目的有三种解释:译者的目的、译文的交际目的和使用某特殊翻译手段所要达到的目的。除
听说读写作为英语学习的四项基本技能,听、读属于语言综合发展的输入的阶段,说、写属于语言综合发展的输出阶段。在本行动研究中,笔者力求探索出将词块理论应用于英语写作复习教学的有效的方法。目前高中生背英语词汇仍处于“死记硬背”的状态。英语教学更多地重视阅读和语法,写作教学多以督促学生背范文为主。如何为英语写作教学找到新的思路,如何把师生从目前的困境中解脱出来,是当前亟待解决的问题。Becker是第一位提
商务合同翻译工作者在商务活动中扮演着不可或缺的角色,因此合同翻译的质量对于国家间的商务合作有着广泛而深刻的影响。本翻译实践报告的素材为巴马丹拿集团国际顾问有限公司与独立广场设计咨询服务公司签订的商务合同英译汉翻译。译者从2016年6月至2018年10月在济南金榜翻译公司实习,主要负责商务合同类文本翻译。根据目的论三大法则,译文内容应当与原文保持一致性,即译文必须符合忠实性法则。此外译文必须符合译入
激光熔化沉积(Laser Melting Deposition,LMD)技术基于快速原型制造基本原理,根据设定的加工路径,使用高能量的激光热源,熔化同步送给的金属粉末,快速凝固液态金属,通过逐层沉积,直接成形金属零件,应用前景十分广阔。然而,LMD成形是激光局部作用的非稳态过程,产生的温度场和应力场复杂,特别是针对大尺度构件,更易导致构件产生较大残余应力,引发裂纹等缺陷,影响构件性能。本文以LMD
在我国,高速铁路因其输送能力强、安全舒适、速度快等优点得到迅猛发展。十九大报告中提出交通强国的目标,也提出区域协调发展战略,都将高速铁路的发展放在重要位置。本文从溢出效应的角度研究高速铁路对沿线城市的影响。在理论分析方面,对高速铁路如何影响区域产生正负溢出效应的演变机理进行剖析。高铁作为一种快速、高效的运输方式,对区域经济发展具有明显的促进作用,可以使不同地理位置上的经济活动与经济资源得到更好的流
碳酸盐岩致密油是柴达木盆地油气勘探的重要领域,该类储层特征的研究是勘探工作有效开展的基础。本文以柴西地区始新统云质岩为研究对象,从岩石学特征、物性特征、孔隙结构特
为提高海南粗榧(Cephalotaxus mannii)悬浮培养细胞次生代谢产物三尖杉酯类碱的产量,本研究选取新型诱导子β-环糊精(β-cyclodextrin,β-CD)及DNA去甲基化剂5-氮杂-2’-脱氧
近些年来,随着科学技术的飞速发展,人工智能的热度越来越高,其中人们对物体识别领域的关注度也越来越高,特别是在动态识别的需求越来越多,实时性成为识别技术追求的一个重要的特性。当前出现了各式各样的识别算法,在精确度和速度等方面也有了很大的提升,被广泛应用在嵌入式处理系统上实现物体识别,但在实时性方面仍有不足之处。所以研究一套动态物体实时识别系统具有很高的研究意义和商业价值,在智能监控、车辆识别、人脸识
天然生物活性肽为多肽类药物研发提供了丰富的天然活性肽库,特别是来源动物体内的肽类与抗生素,如:蛇毒,蝎子毒,蜘蛛毒,芋螺毒素等,在镇痛,抗炎,抗肿瘤,神经痛等疾病治疗有良好的效果,但由于其本身固有的特性存在缺陷,如半衰期短、稳定性差、生物利用度低等,必须通过基因工程或化学修饰等手段部分或全部解决此类药物的缺陷,赋予其合适的药物开发特性。本课题以芋螺毒素TxID为模型,合成获得芋螺毒素TxID的线性
在环境污染和化石能源危机的大背景下,大力发展新能源汽车产业已成为国家的战略性规划,电动汽车由此进入了快速发展的新阶段。采用轮毂电机直接驱动,是电动汽车的未来发展方向。轮毂电机驱动系统凭借在结构紧凑、传动高效、控制灵活、车载空间利用率高等方面突显出的显著技术优势,使其被认为是未来纯电动汽车最理想的驱动方式。本文以设计高功率密度轮毂电机为目标对其进行了结构设计、电磁场分析、损耗计算、温度场仿真和冷却系