【摘 要】
:
视觉目标跟踪是计算机视觉领域的重要课题。面对跟踪过程中来自自然场景多种复杂变化的干扰,当前视觉跟踪算法由于其普遍采用的模型驱动模式的固有缺陷,算法的准确性和鲁棒性
论文部分内容阅读
视觉目标跟踪是计算机视觉领域的重要课题。面对跟踪过程中来自自然场景多种复杂变化的干扰,当前视觉跟踪算法由于其普遍采用的模型驱动模式的固有缺陷,算法的准确性和鲁棒性与实际应用需求还有较大差距。分析了基于模型驱动的视觉跟踪算法框架,通过实验发现视觉跟踪各阶段由模型生成的数据对于外在的场景变化和内在的目标形变有直接体现,以此为基础,研究了数据驱动在视觉跟踪中的可行性和实现方法,区别于模型驱动中数据的被动模式,数据驱动方式利用数据流对系统当前状态的反映,通过定义一系列基于基本数据流的质量指标,为模型构建和更新提供真实可靠的判断依据,通过模型驱动与数据驱动的结合,实现跟踪模型对复杂变化的动态调整,从而提高跟踪算法性能。以基于中层特征的视觉跟踪算法为研究对象,实现了数据驱动与模型驱动相结合的视觉跟踪算法。从局部特征的自适应选择角度出发,针对传统特征选择算法基于历史帧的信息滞后问题,提出了基于当前帧信息的自适应子块选择的跟踪算法ASST。在ASST中用于表观描述的子块在跟踪过程中根据判别性和唯一性进行筛选,动态组合参与目标定位。实验证明ASST的自适应子块选择机制有效避开了跟踪中不利于目标定位的区域,保证了跟踪结果的准确性和应对长时遮挡和局部形变的鲁棒性。从特征权重和学习率的自适应调整的角度出发,针对特征选择潜在的描述信息过少问题和模板更新阶段的动态性缺乏问题,提出了自适应权重的动态表观跟踪算法AAMT。AAMT将ASST中子块是否参与目标定位的“硬阈值”改为以可变权重控制的“软阈值”,并制定了基于模板变化率和允许更新率的动态模板更新策略,赋予表观描述更具“弹性”的控制。实验表明,AAMT算法的自适应权重的动态调整机制在应对快速遮挡、光照、形变等复杂变化时具有良好的适应性。
其他文献
在当今计算机和Internet产业的发展中,嵌入式系统成为一个重要的发展领域,而嵌入式实时操作系统(RTOS)在嵌入式系统软件体系中起着越来越重要的作用。μC/OS-Ⅱ是一个公开源
排序是信息检索的核心问题,因为一个搜索系统的好坏主要由它的排序结果的正确率来评价。信息检索中提出了许多排序模型。直到最近,被称为“排序学习”的机器学习技术被深入应用
随着Internet的飞速发展,Web的信息量越来越大,通用搜索引擎将面临信息采集、检索等方面更大的挑战。随着电子商务的蓬勃发展,网上商品的交易越来越频繁,更多的消费者通过搜索引
短文本分类问题是短文本应用领域中亟待解决的问题,也是具有挑战性的关键问题之一,具有重要的应用前景。由于短文本自身长度较短的特点,其描述概念能力弱,缺乏一定的语义关系
VoWLAN(Voice over WLAN)是当前VoIP(Voice over IP)和无线局域网研究中的一个热点,它结合多媒体通信、计算机网络、无线传输、嵌入式系统开发等研究领域,主要研究基于无线局域
随着计算机和网络技术的快速发展,远程会议、视频点播和网络教育等实时多媒体应用日益广泛。这些实时多媒体应用要求将同样的数据从一个源点同时传输给大量的目的节点,促使了多
网络的广泛运用推动了分布式计算的快速发展。网格作为分布式计算的重要支撑技术受到广泛的关注,它不仅突破了单个计算机计算能力的限制,而且将分布的资源组织起来,协同地解决大
随着互联网的迅速发展和普及,网络已成为人们生活中不可缺少的一部分。网络中存在着各式各样的信息,这些信息以网页为载体,呈现在用户面前。网页中蕴含的丰富信息为企业竞争
彩铃业务是移动运营商的一项重要增值业务。当前由于彩铃用户普及率趋向饱和,用户活跃性降低,运营商为吸引用户使用和更新彩铃,经常开展各项彩铃营销活动向用户推荐铃音,但由
基于内容的图像检索技术(Content-based Image Retrieval,CBIR)是从20世纪90年代开始兴起的一种新的检索技术,它自动提取图像的颜色、纹理和形状等视觉特征作为索引来进行检