【摘 要】
:
随着人工智能时代的来临,人类对人机交互方式的自然化、多样化方面的要求愈加强烈。手势是人类最古老和自然的表达方式之一,研究基于手势识别的人机交互技术既十分重要又较为迫切。本文因此对两项有关关键技术即手势检测和手势分类进行了研究,具体工作主要如下:
(1)首先,深入调研了国内外手势识别的研究现状,归纳总结了基于卷积神经网络的主流目标识别算法,并对比了传统的手势识别和基于卷积神经网络的手势识别算法性能差异。
(2)本文深入研究了YOLO(You Only Look Once)系列算法原理和实
论文部分内容阅读
随着人工智能时代的来临,人类对人机交互方式的自然化、多样化方面的要求愈加强烈。手势是人类最古老和自然的表达方式之一,研究基于手势识别的人机交互技术既十分重要又较为迫切。本文因此对两项有关关键技术即手势检测和手势分类进行了研究,具体工作主要如下:
(1)首先,深入调研了国内外手势识别的研究现状,归纳总结了基于卷积神经网络的主流目标识别算法,并对比了传统的手势识别和基于卷积神经网络的手势识别算法性能差异。
(2)本文深入研究了YOLO(You Only Look Once)系列算法原理和实现机制,对YOLOv3的多尺度检测进行了改进,提出了四尺度检测的网络模型,结合FPN网络结构,提升了小目标手势的检测效果。在牛津大学人手数据集上,本文改进的YOLOv3比原始YOLOv3的AP(Average Precision)提高了3.4个百分点。识别速度超过23FPS(Frames Per Second),满足实时检测的要求。
(3)为了在移动端部署手势识别算法,论文详细地研究了轻量级分类模型MobileNet,并对其进行调整,使其能够应用于本文的手势识别任务。此外,本文制作了包括10种手势的数据集,在此数据集上采用迁移学习训练模型,使得模型精度达到94%。
(4)论文研究了安卓开发平台和移动端深度学习框架,并在Android Studio平台上完成了相关文件及功能的配置。通过编程将PC端训练的手势分类模型成功移植到安卓手机上,最终在手机端实现了手势分类功能。
其他文献
【摘 要】领导魅力是领导者在领导活动中表现出来的品格、才能、学识、情感等对被领导群体所产生的一种非权力影响力。而领导干部脱稿讲话水平的高低,在一定程度上成为人们评定其领导魅力和领导素质的重要方面。本文援引大量实例,从“独善其身、厚积薄发”, “不落窠臼、开拓创新”,“情系百姓、与民共舞”,“丰富语言、独具特色”四个维度深入剖析,致力于通过增强领导干部脱稿讲话的能力进而提升领导魅力。 【关键词】领
微光机电系统(Micro-Opto-Electromechanical System,MOEMS)是微机电系统的一个重要分支,是指由微光学和微电子技术交叉而成的一种新型微机电系统,集微传感器、微执行机构和信号处理电路于一体的微型器件。
MEMS微镜是一种典型的微机电系统,具有集成度高,体积小以及功耗低等优良特性,已经逐渐应用于食品检测、医疗设备、光通讯以及消费电子等领域。作为一个新兴的研究领域以及其良好的应用前景,关于MEMS微镜系统的控制研究受到学者的广泛关注。
本文以电磁驱动微镜作
随着移动设备的普及和基础通信设施的建设完善,尤其是5G通讯的商用,互联网,物联网,云计算将得到高速发展,伴随而来的是数据量的爆发式增长。大量的有价值的信息湮没在了没用的冗余数据中,远远超出了大众用户的所能承受的数据量,严重阻碍了信息的有效传播。由于数据的信息过载,要为用户找到相关的、吸引人的和有用的内容变得越来越困难。作为解决信息过载的有效手段,推荐系统受到了大量研究人员的广泛关注。近年来,广大学者提出了许多的优秀的推荐算法模型,在推荐效果上有一定的提升。传统的推荐算法简单易行,但是偏好预测的精度不高,很
无人驾驶技术能够给交通出行带来很大的便利,实现无人驾驶的首要技术便是无人车环境感知。基于图像的视觉感知是实现无人车感知的一个重要途径,无人车在白天场景下能够依靠可见光相机很好地感知外部环境,但在夜晚或者黑暗无光的情况下可见光相机不能对周边环境进行感知,红外热像仪通过感受环境的热量分布成像,在非常规环境(夜晚或者黑暗无光的场景)下有着出色的表现,但红外图像相比于可见光图像有纹理度低、噪声多、无颜色信息等劣势。为了使无人车能够在夜间也安全行驶,针对红外图像的目标检测与跟踪研究尤为重要。
本文主要针对
【摘 要】本文结合全国最大的易地安置暨保障住房项目——民生尚都,开展工程档案管理实践为例,着重分析了工程档案在民生重点项目实际应用的现状、存在的问题,提出了相应的对策,得出民生重点项目应加强工程档案管理的结论。 【关键词】民生;重点项目;工程档案 工程档案作为项目建设全过程原始、真实的记录,是宝贵的信息资源,更是一种潜在的生产力[1]。通过对它的管理、开发和利用,可极大地推动以民生重点项目为代
当今社会信息越发多元化以及复杂化,对于大脑负荷水平的研究能够帮助人对于心理精神状态有更好的把控,比如监测驾驶员大脑负荷水平能防止车祸;监测高危行业工作人员的注意力集中程度能防止重大安全事故的发生。目前通过脑电信号(EEG)进行认知负荷的监测是最常用的手段。在深度学习成为热点之前,基于CSP(共空间模式)的算法是较为流行的分类认知负荷的方法。随着人工智能方法的普及,通过将神经网络应用于大脑认知负荷领域,分类准确率得到了很大的提高。本文运用深度学习的方法对EEG进行了特征提取以及分类。研究工作及创新点主要分为
【摘 要】由于我国地域辽阔,各地区的地形、地质差异较大 ,管材的应用各不一致,新型管材也不断在发展 ,形成目前市场给水管材品种繁多,让选用者眼花缭乱。管网叠压供水是我国近些年来迅速发展的二次加压供水方式,工程建立了完善的质量管理体系,对于管材从出厂——运输——保管——埋设——运行整个过程进行了严格的把控和掌握,确保了每一条管道的质量可靠,其对于破损管道的修复处理措施,也对类似的工程具有借鉴意义。
近年来,为了满足新的通信需求,实现移动设备之间低时延、高速率和高可靠性连接,第五代(Fifth-Generation,5G)移动通信系统在数据信道和控制信道中引入了新的编码技术。低密度奇偶校验(Low-Density Parity-Check,LDPC)码由于其性能非常接近香农极限,已被确定为5G标准中的数据信道编码方案。因此设计一种高速率、高纠错性能的LDPC译码器对工程实践具有重要意义。
在LDPC码的置信传播(Belief Propagation,BP)译码算法中,同一类节点更新时可以并行
计算机视觉的应用场景十分多样,涵盖了国民生活的很多领域。诸如视频监控、人机交互、自动车辆控制和人类行为分析等任务都大量利用目标检测与跟踪并从视觉系统中受益。现阶段,已有的一些较为优秀的跟踪算法在实际应用中仍然无法同时满足高精度、高成功率、高实时性等要求,更无法适用于多种多样的目标或者环境。因此继续研究拥有更高跟踪性能的算法仍然是一个有着重大意义和很大挑战的课题。
目前,针对非线性和非高斯系统中的目标跟踪,粒子滤波(PF)是相对较好的选择,但是PF在利用序列重要性重采样方法解决粒子的权值退化问题时
计算机视觉中最重要的分支之一就是视频中的目标跟踪,它被广泛地应用于现实生活中。但由于照明变化、遮挡、背景杂波、快速运动和目标移出视图等外观变化,导致尽管近年来视频中的目标跟踪技术取得了重大进展,却依然存在着许多难点。尤其是在视频多目标跟踪中,需要对视频中的每个目标进行编号,需要对不同帧之间的目标进行匹配,需要解决目标间的互相遮挡、相似外观等更为复杂的问题。因此研究出成功率和精度都更高的视频单目标和视频多目标跟踪算法具有十分重要的理论意义和实用价值。
在视频单目标跟踪领域中,粒子滤波的优势在于处理