增强量化的Bag-of-Features模型及其应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:hongchaozhang88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Bag-of-Features(BoF)模型在多媒体和计算机视觉领域的很多问题中都有着广泛的应用。BoF的核心思想是将图像局部特征描述符量化到视觉单词,使得一张图被表示成视觉单词的直方图。通常,我们首先利用聚类算法将局部特征描述符聚合成一些类簇。在量化过程中,局部特征描述符参考类簇中心被映射到一个或多个视觉单词。在这篇文章中,简单的使用类簇中心来表示视觉单词可能会得到不理想得映射。更理想的方法应该是在量化时进一步捕捉类簇的大小来表示视觉单词。为了达到这个目的,我们介绍了一种简单而有效的量化算法,称为有效半径编码(ERC)。在我们的方法中,类簇的有效半径和中心共同代表视觉单词。为了有效的估计有效半径,我们通过计算许多支撑类簇的锚点来捕捉类簇大小。我们还利用有效半径拓展了传统的k-means方法来提升视觉单词的生成过程。此外,我们还提出了一种新的基于有效半径的软分配编码方法(ERSC),在保证编码效果的前提下大大提高了编码的效率。实验结果证明了我们提出的算法提高了Bag-of-Features模型,领先于现存最先进的技术。
其他文献
图像放缩是图像处理、可视化、计算机图形学和虚拟现实等领域的基本问题,应用背景十分广泛。通过图像放缩改变已有图像的大小,并呈现出较好的视觉效果,是图像处理、模拟仿真
随着Internet的迅猛发展和日益普及,网络文本信息急剧增长,如何有效的组织和管理这些海量信息,并能够快速、准确、全面地获得用户所需要的信息是当今信息科学技术领域面临的一大
Web缓存技术被认为是减轻服务器负载、降低网络拥塞的有效途径之一,其基本思想是利用客户访问内容的时间局部性(TemporalLocality)原理,将客户访问过的内容保存在缓存中,当该内
近年来,随着多媒体业务的种类越来越广泛,如网络电视、在线直播、视频会议、远程教学等等,多媒体数据传输已经成为网络中数据传输的重要组成部分,同时,伴随着网络用户的不断
近年来,随着互联网和Web2.0技术的不断完善,各种社交网络服务层出不穷,人们越来越习惯于在在线社交网络平台上进行互动交流和信息发布。社交网络因此成为人类知识共享、交互
本质上,入侵检测是一个模式识别和分类问题。支持向量机(SVM)对不平衡和非线性数据具有独特优势,因而尤其适合入侵检测分类器的设计。基于SVM的入侵检测方法已经取得了良好的效
随着互联网技术的飞速发展,Deep Web网站上拥有着海量的数据,并且在快速地增长,使Web成为一个巨大的数据源,这些信息要通过查询接口在线访问其后端的Web数据库。尽管Deep Web
人脸表情识别是一个图像模式分析、模式理解和模式分类的问题,它为模式识别、图像处理、人机交互、人工智能、计算机视觉、神经计算和心理学等众多学科提供了很多的具体问题
随着移动网络和定位设备的飞速发展,各种移动应用中的数据成井喷式增长,致使大数据普遍存在。同时,由于各种公司和研究机构对数据的分析与挖掘。因此,只要存在数据的地方,就
树木运动和降雨均是常见的自然现象。随着计算机图形学的发展,树木运动和降雨的模拟在游戏、影视、广告、虚拟现实等领域得到了广泛应用。能否逼真而实时地生成树木运动和降雨