【摘 要】
:
随着人工智能的不断发展,便捷和智能的人机交互技术也在我们的生活中得到广泛的应用。基于摄像头的手势交互方式因其方便性和快捷性,摆脱了鼠标键盘和控制台等硬件设备的限制,更加贴近智慧化的人机交互方式,成为当今学者研究的热门课题。目前,基于视觉的手势识别算法受计算机计算能力的限制,在保证识别准确率的情况下不能完全达到实时性的动态手势识别要求,在动态手势识别中依然存在时间序列特征难以提取、手势轨迹不明显导致
论文部分内容阅读
随着人工智能的不断发展,便捷和智能的人机交互技术也在我们的生活中得到广泛的应用。基于摄像头的手势交互方式因其方便性和快捷性,摆脱了鼠标键盘和控制台等硬件设备的限制,更加贴近智慧化的人机交互方式,成为当今学者研究的热门课题。目前,基于视觉的手势识别算法受计算机计算能力的限制,在保证识别准确率的情况下不能完全达到实时性的动态手势识别要求,在动态手势识别中依然存在时间序列特征难以提取、手势轨迹不明显导致识别准确率低等问题。针对这些问题,本文提出一种基于yolo(yolo v3)网络和改进TCN网络的双流网络模型用于识别视频数据的动态手势识别方法,并在动态手势数据集Jester数据集上进行训练与验证。通过与其他网络模型方法进行比较,在完全训练时本文准确率相比提高了2.76%,在减少一定训练量时由于本文网络收敛更快,准确率相比提高了5.68%,并且本文研究方法在动态手势识别上的速率为33fps,满足实时性要求。在数据集处理方面,针对手势视频数据中存在的光照、肤色、背景等复杂的干扰信息问题,本文将视频数据通过三帧分割法的方式将视频数据调整为帧序列,在空间通道利用卷积神经网络yolo网络提取动态手势的空间特征,相比原网络,利用yolo网络降低了网络模型的复杂度,加快了手势识别的效率,起到提高实时性的目的。针对卷积神经网络不具有对长时序特征的学习能力,双流网络在时间通道利用时序网络提取动态手势的时间轨迹信息,时序卷积网络对时序任务具有更优的学习能力,经过改进的TCN算法融入了注意力机制,对动态手势的时间轨迹特征具有更好的提取效果,并采用光流法提取视频手势的时空轨迹信息。通过利用13种手势测试在自然环境下的动态手势识别准确率,本文方法总体平均识别率达到91.6%,验证本文网络模型在实际应用中具有较强的可用性和较高准确率。并且根据实验结果显示,本文的手势识别方法对轨迹不明显的动态手势依然具有良好的识别效果,在实时性上也有较大提升。
其他文献
乳腺癌被称为“粉红杀手”,是全球最常见的癌症。被确诊为乳腺癌的患者大多数伴有一定程度的焦虑、抑郁症状,加之放化疗带来的生理疼痛加剧了其自信心的丧失,导致自我效能感低下,严重影响患者自身及其家庭的生活质量。本文选取潍坊市某三甲医院乳腺外科围手术期女性乳腺癌患者作为研究对象,采用质性研究与定量研究相结合的研究方法,在优势视角、认知行为理论和社会支持理论的指导下,以医务社会工作中的个案和同伴支持小组方法
伴随我国社区化进程的推进和社会现代化的发展,“村转居”社区是我国快速社区化背景下出现的特殊社区类型,近年来我国“村转居”社区数量大幅增加。在这样的背景下,“村转居”农民的社会适应和社区营造的问题理应得到社会关注和学者研究,以便更快、更有质量地提高农民村转居后社会适应和社区营造水平,构建共建共治共享社会治理新格局。本文以再社会化、社会互动和文化认同理论为基础,运用参与观察法、深度访谈法和农村工作实务
伴随着中国城市化进程加快和人民消费理念升级,我国餐饮市场连续几年扩张,行业收入也不断增长。想要在进入白热化阶段的餐饮行业中站稳脚跟,企业选择采用合理适当的竞争战略应该成为首要关心的问题。考虑到顾客对餐饮公司的产品及消费的重视程度,如果餐饮公司想要拥有核心竞争力,就需要在人员、服务、产品、推广渠道等层面进行提高,差异化战略成为比较合理的选择。所以对于餐饮公司来说有必要研究竞争战略的实施坏境以及分析其
时间序列预测是以历史数据为驱动进行的一个领域。时间序列预测是使用统计和建模方法来分析时间序列数据的过程,能够为实际应用场景中数据的使用和分析提供参考。时间预测步数的增加往往伴随着预测误差的增大,致使相同输入特征情况下多步预测相较于单步预测更困难。时间序列预测步长的增加会导致预测的每一时间步的误差累积从而影响预测准确性。由于传统深度学习模型在复杂时间序列数据的预测精度低于预期,本文提出了一种使用数据
食品安全问题已经慢慢成为我国老百姓最为关注的话题,就在最近央视的3.15晚会上,又曝光了一个非常严重的食品安全事故,“土坑酸菜”已经刷爆了各大社交网络平台。而且近几年时不时就有一些食品物资受到新冠病毒的影响被紧急召回,如果能够快速查询到该食品的去向信息,就能最大程度的降低损失。当下,建立一个更加安全的食品溯源系统是十分有必要的。区块链技术因为其去中心化的特点使得数据不能被轻易修改,它区块式的结构非
近场辐射热传输可以超过黑体辐射极限,并且在近场热显微镜、近场热成像、辅助磁存储、热光伏器件方面具有重要的应用前景,因此近十年来引起了国内外研究人员的广泛关注,调控和增强近场辐射热传输是此研究领域的一个重要方向。除了利用新材料调控近场辐射热传输外,人们也提出了通过改变材料的结构来实现对辐射热传输的调控,其中具有代表性的就是利用由三块相互平行的平板组成三体系统来实现对近场辐射热传输的增强。另一方面通过
当今社会网络购物越来越普遍,数不胜数的公司和个体经营户纷纷进驻互联网平台,包括众多餐饮服务经营者也在利用互联网售卖食品。互联网发展促进了食品多元化的发展,也极大方便了食品的营销及配送。虽然餐饮行业进驻互联网后极大地促进了该行业的发展,但是也暴露出来许多问题。因在互联网上营销的食品具有非直观性、跨地域和流通环节多等特点,对其的安全监管较线下营销食品更加复杂和困难,仅仅依靠政府部门的力量很难保障监管的
随着5G的快速发展以及移动设备的不断普及,以视频为媒介的信息交流方式正越来越被大众推崇。这就导致人们对于视频质量、视频安全、视频传输速度的要求越来越高。从视频编码角度而言,自1984年起,人们对于视频编码的研究就从未间断过。在这整整38年的编码技术发展历程中,研究人员制定出了诸多适用于不同领域的视频编码标准。其中,应用最为广泛的H.264/AVC(Advanced Video Coding)以其优
岩心作为油气田宝贵的实物资料,是认识和评价地层地质特征最直观、最真实的第一手资料,从早期的油气勘探到后期的油气田开发都具有不可替代的作用。本文所用岩心图像由荆州市华孚信息技术有限公司研发的岩心扫描仪扫描得到。但是由于扫描摄像头视域有限,单次只能对一个视域内的岩心进行扫描,而筒次岩心长度通常大于一个摄像头视域,故需要先对单筒岩心进行多次分段扫描,再对片段图像进行拼接,得到完整的筒次岩心外表面图。最后