论文部分内容阅读
随着计算机视觉技术的发展,视觉跟踪技术得到了广泛的应用,基于视觉的人机交互技术是人工智能、机器人技术等领域近年来的研究热点。基于视觉跟踪的人机交互技术也出现了很多新的方法,但是其中很多方法只能处理简单背景下的跟踪交互,不理想的跟踪结果严重影响了人机交互过程,易出现延迟、目标丢失等问题。目前,实现复杂背景下视觉跟踪交互是一种研究趋势,对人机交互技术的发展也起到了重要作用。因此,开展基于视觉跟踪的人机交互技术研究具有重要意义。本文针对视觉算法改进和人机交互平台构建进行了以科普展品为背景的关键技术研究与系统实现。首先,在视频对象分割算法设计方面有三方面的改进:第一,在对视觉交互特点进行全面分析的基础上,采用帧间差分方法获得运动目标,实现自然人机交互;第二,鉴于帧间差分方法分割效果不理想,本文在水平集分割方法中引入内部约束能量项和局部自适应能量函数,解决了重新初始化的问题,提高了水平集方法的适应性;第三,针对视觉交互图像干扰性强,轮廓模糊,易造成目标边缘分割不清楚和过分割的问题,提出了基于信息融合的水平集分割方法,克服了传统方法漏分割和过分割的缺点,获得良好的分割效果。其次,在跟踪算法设计方面有两方面的改进:第一,针对TLD(Tracking Learning Detecting)算法中跟踪器采用的LK光流法无法捕捉较大运动问题,本文采用金字塔光流法,实现了较大运动的目标跟踪;第二,针对随机森林无法进行随机分裂问题,本文采用极端随机森林方法的思想,引入混合样本比,构成极端随机森林在线学习模型,提高了分裂能力,进而提高了分类精度。最后,在平台构建方面,本文基于仿人机器人NAO搭建视觉跟踪交互平台,将本文研究的跟踪算法应用于NAO机器人,通过交互信息识别,实现人机交互。实验结果表明,改进的分割算法速度快、分割效果好,跟踪算法精度高,实时性好,可应用于人机交互系统,实现自然实时交互,系统具有较好鲁棒性和较高精度。