基于空间相关性的视觉词语映射加速算法

来源 :北京大学 | 被引量 : 0次 | 上传用户:woai2010ni
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图像“字袋模型”(Bag of Visual Words)的迅速发展及其在物体识别、场景分类、图像检索等计算机视觉领域的广泛应用,如何快速有效地将图像特征映射成视觉词语成为提高系统性能的关键所在。视觉词语的映射是通过高维空间的最近邻查找完成的,传统的映射算法按照视觉字典在特征空间的分布来构建索引结构,图像特征点依次独立地进入索引结构中进行最近邻查找。本文在已有算法基础上将图像特征点之间的空间相关性引入索引过程,加速了视觉词语的生成。   论文的主要贡献在于:   1.提出并构建了空间近邻表。通过为视觉字典中的每一个词语训练其近邻视觉词语集合,并存储到一个二维表格中,用以记录视觉词语之间的空间相关信息。在此基础上,提出了基于空间相关性的视觉词语加速算法。   2.提出了利用空间近邻表的直接映射算法。首先对查询特征进行快速近似的初始映射,通过限制最大节点比较次数控制初始映射的时间和精度,之后利用空间近邻表对原始结果直接进行更新,在一定程度上提高了映射效率。   3.设计并实现了利用空间近邻表的间接映射算法。将空间近邻表融合到索引结构中,把近邻集合的相关信息转换成索引概率的大小,通过概率加权来优化搜索路径。   在牛津建筑物图像库上的实验表明,利用空间相关信息显著地提高了视觉词语的生成效率。
其他文献
NAND Flash存储器以其体积小、功耗低、启动快、价格低廉和抗恶劣环境等优点,已被广泛应用于嵌入式领域作为数据存储设备。同时,基于NAND Flash存储技术的固态盘已被看做传统磁
语音增强技术用于减小含噪语音中的噪声干扰,提高语音的质量和可懂度,因此在语音通信、语音识别、助听器等领域具有重要的作用。本文针对语音增强中的噪声估计和噪声去除这两
随着移动通信以及空间定位等技术的融合和发展,移动通信领域中产生并积累了海量的、动态变化的时空数据。这些信息中蕴藏着丰富的用户行为规律。利用数据分析及数据挖掘等技
在嘈杂的室内环境中,听者对特定目标语音的加工会受到周围背景噪声和其他说话人语音的干扰。听觉系统如何从接收到的混合声波中有效地识别和理解目标语音至今尚未得到充分的
图片搜索引擎是以图片作为主要检索对象的搜索引擎。由于图片搜索引擎的结果通过直接引用图片的原始地址来展现内容,如果图片变为无效链接,则在结果中无法展示。无效结果通常为
随着信息技术的高速发展,互联网已经完全融入了人们的学习、工作和生活,成为人们获取信息的一个重要途径。互联网上日益丰富的图片资源,使得图片被越来越多地应用于信息的承载和
计算机科学技术的不断发展,使得计算机在科学研究和工程实践领域得到广泛和深入的应用,科学研究和工程实践领域需要借助于并行计算来解决大规模计算问题,并且随着研究工作的深入
在现今信息时代中,因特网的迅猛发展促使了许多网络信息处理技术的产生,其中应用最为广泛的就是协同计算。一般地,在网络协同计算中,各个计算参与方需要提供各自的秘密信息作为输
伴随着丰富的标注资源的建立以及多次国际评测的开展,语义角色标注任务得到了较全面的研究,其中最主流的研究方向是基于句法成分的、使用机器学习方法将任务转化成分类问题来解
应用程序二进制接口规范定义了一套用以编译程序并确保程序正确运行的系统级接口。目前在MIPS、ARM和PowerPC等体系结构上,均有针对不同处理器或不同应用场景的ABI规范。在这