基于音频辅助信息的目标抗遮挡跟踪方法研究

来源 :兰州理工大学 | 被引量 : 4次 | 上传用户:yuehungulei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪是人机交互领域中的一个重要课题,但在实际跟踪中,目标容易受到遮挡等问题的影响,本文在分析总结已有工作的基础上,以提高遮挡等复杂环境下跟踪系统的性能为主要目标,从视频跟踪和音视频联合跟踪这两方面对此问题进行了研究,提出了基于特征置信度的抗遮挡融合跟踪方法,改进了模型更新方式。主要的研究工作和贡献如下:1、研究了视频跟踪下目标受到光照、阴影以及相似物遮挡时容易造成跟踪失败的问题,针对此问题本文提出了一种基于特征置信度和相似度的融合算法,能对不同环境采取不同的融合方式,提升系统的抗干扰能力,该算法利用前一帧的相似度动态调节加权和融合和乘性融合的权重,同时利用特征置信度调节加权和融合中各特征的权值,使融合结果更加接近真实状态,并将该置信度运用到遮挡检测当中,克服了相似物遮挡时,相似特征相似度过高,对遮挡判定不准确的问题。同时也对目标模型的更新方式做了改进,在目标未发生遮挡时,模板更新结合了初始模板、前一帧模板和当前模型的信息,能反映出起始和当前的状态,使目标模版能够更好地适应复杂环境的变化;当目标发生遮挡时,本文采用了前一时刻的目标模型,也就是未发生遮挡那一刻的模型,这样能更好保留准确信息,减小背景噪声的融入,为遮挡恢复后的目标匹配提供依据,保证跟踪的准确性。实验结果表明,该算法对光照、相似物遮挡等环境具有更好的跟踪性能,同时也能满足实时性的要求。2、目前目标跟踪中运用较多的还是单模态跟踪方法。音频跟踪具有定位范围广、计算复杂度低和实时性好等优点,缺点是定位精度差,容易受到背景噪声影响;视频跟踪精度高,但容易受到光照、阴影和遮挡等复杂环境的影响,且视角受限于摄像头的角度。由于音视频信息之间具有良好的互补性,本文在粒子滤波的框架下提出一种基于特征置信度的异类信息融合方法,以克服单模态跟踪的缺陷,选择TDOA到达时间差特征和颜色直方图特征,利用置信度对二者进行融合,充分发挥两种类型信息间的相关性,提高跟踪精度。由于采用了单一的颜色特征,所以本文利用置信度来辅助检测遮挡,以解决相似度遮挡检测错误的问题,最后利用改进的模型更新方法来更新目标模板,充分发挥各类信息的优势,保证模板信息的准确性和实时性。实验结果表明,改进后的双模态跟踪算法具有比单模态跟踪算法更好的性能。
其他文献
目前,世界正处在经济全球化与信息技术高速发展的时代,汽车产业也随之爆发式增长,汽车正越来越成为大众消费品。与此同时,越来越多的交通阻塞、交通违规、交通事故等问题使得交通
信息技术的飞速发展使信息资源的过度膨胀和用户查询的多样化需求逐渐成为一种不可缓解的矛盾,各种信息检索技术应运而生。存在着更大研究价值和广泛应用前景的文本检索技术
如何在海量文本环境下提供有效的信息服务,已经成为国内外学术界与工业界关注和研究的重点问题。为了帮助人们从语义层面上快速理解文本内容,各种主题模型被相继提出。同时,文本
蝙蝠(Bat Algorithm, BA)搜索算法受蝙蝠回声定位行为的启发,由剑桥大学YANG Xin-she教授于2010年提出的一种新型搜索优化算法,蝙蝠算法目前应用于分类类别、模式识别、分布
本文的研究内容来源于国家自然科学基金面上项目“基于异构服务网络分析的Web服务推荐研究”。当前,随着信息技术与电子商务的发展,推荐系统逐渐成为电子商务技术的研究热点,其
随着信息时代的到来,网络上的信息资讯呈现爆发式增长。其中,微博以其交互性、实时性、原创性等特点迅速成为信息资讯传播的重要平台。在社会热点事件发生和传播的过程中,微博等
当前处理图像信息常基于PC机完成,但PC机体积庞大,不方便携带,且使用过程中,配套的电力设施、环境及其他资源要求较多,因此,在野外实时处理图像数据具有一定的难度。因此,本
随着互联网技术的迅速发展,视频点播、远程会议、在线教育和网络游戏等实时多媒体服务运用的越来越广泛,人们对网络应用的服务质量(Quality ofServices,缩写QoS)要求也随之增高。
无线传感器网络(WSN,Wireless Sensor Networks)的提出,是基于环境监测和目标追踪等一系列的实际应用需求。作为一种新兴的对环境和目标进行感知与探测的技术手段,如何提高WS