基于三维模型的地标建筑分类和识别关键技术研究

来源 :中国科学院研究生院中国科学院大学 | 被引量 : 0次 | 上传用户：yidao

【摘要】

：

随着社会化媒体分享网站(如Flickr,Facebook和YouTube)的发展,人们将越来越多的观光图像和视频分享到互联网上,并被很多的人浏览和使用在这些观光图像中,地标建筑图像经常能

【作者】

：

肖宪

【机构】

：

中国科学院大学

【出处】

：

中国科学院研究生院中国科学院大学

【发表日期】

：

2012年期

【关键词】

：

三维模型地标建筑图像分类识别尺度不变特征

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着社会化媒体分享网站(如Flickr,Facebook和YouTube)的发展,人们将越来越多的观光图像和视频分享到互联网上,并被很多的人浏览和使用在这些观光图像中,地标建筑图像经常能够吸引人们的眼球。由于网络上的绝大多数地标建筑图像是没有被标注过的,因此互联网用户在搜索这些图像的时候,就要付出很多的时间和精力。对这些未标注的地标建筑图像进行分类和识别,能够有效地解决以上我们提到的问题。　　近年来,随着地标建筑信息的分析与人们的生活日益相关,地标建筑相关研究逐渐成为一个热点研究问题。目前,有些传统的图像分类和识别方法被用在地标建筑图像上,然而,在实际应用中,传统的图像分类和识别方法以及分类识别结果表现方法由于地标建筑本身的唯一性和多样性(图像被拍摄时的光照,角度,镜头拉伸以及遮挡情况的不同,使同一个地标建筑在不同的图像中的形态可能会大不一样),使得传统的图像分类和识别方法很难获得正确的分类和识别结果。此外,在地标分类和识别结果的展示上,传统的方法仅能展示二维图像或者文本,很难给用户展示生动的地标建筑的形象。　　为了解决以上的问题,本文提出了一种利用三维模型进行地标建筑分类和识别的方法,并最终利用三维纹理模型对识别的结果做了展示。主要的研究工作如下:　　 1)我们提出一种降低三维重建过程计算复杂度的方法。当前的很多方法都是构建整个场景的三维模型。然而,大多数情况下,人们往往仪关心那些引起他们注意的区域。在用这些方法构建三维模型的过程中,大量的时间被浪费在重建那些人们不感兴趣的区域上。我们通过获得每张图像的视觉关注区域,然后仪利用视觉关注区域之中的特征信息来重建三维模型,从而节约了三维重建中的计算量。我们提出的利用视觉关注度来降低三维重建计算量的方法在视频和图像的三维重建中都能适用。　　 2)我们提出了一种通过二维图像创建三维模型以及三维模型到二维图像投影的方法来提高地标建筑图像的分类结果的方法。我们首先从标注好的图像集合中,选出代表性图像来进行地标建筑的j维重建。然后,重建好的三维点云模型被投影到代表性图像中,并获得这些代表性图像中的地标建筑区域。我们利用这些地标建筑区域中的尺度不变特征(SIFT)来为每一个地标建筑创建一个K维搜索树。通过比较未标注的图像与每个K维搜索树之间的匹配数量,我们将未标注的图像分类为拥有最多匹配数的地标建筑中。最后,对于卜述的分类方法,我们又提出一种改进方法,通过将每个地标建筑中的热门区域(经常被人们拍摄的局部区域)图像添加到训练数据中,进一步提高了地标建筑图像分类的准确率。　　 3)我们提出一种直接利用二维图像和三维模型进行匹配的地标建筑识别的方法,并将三维模型作为识别的结果进行展示。此方法分为离线和在线两个模块。离线模块中,我们为每一个地标建筑创建一个三维模型和一个三维识别器。在在线模块巾,我们为每一张被识别出来的图像,提供一个三维纹理模型和对应于这张图像中的地标区域的三维模型。我们的方法提高了地标建筑图像识别的效果,并且为用户展示了一个更加生动的三维模型。　　 4)我们将提出的地标建筑识别方法应用在手机端地标建筑搜索中。我们提出在手机端仅将图像压缩到较低的分辨率,传输到服务器端处理,而不是在手机上提取特征,从而减少手机端的计算量,节省手机电量和流量消耗。存服务器端,与之前的方法不同,我们不是为每一个地标建筑构建一个三维识别器,而是将所有的地标建筑特征融合在一起,构建一个地标建筑三维模型。最终,于机端拍摄的照片的识别结果能够以三维模型的方式,返回到手机端。　　总的来说,本文的研究工作,对于地标建筑的分类识别和结果展示做出了有益的探索。

其他文献

无线传感器网络分簇路由协议算法的研究

无线传感器网络(Wireless Sensor Networks, WSNs)是近年来研究的热点领域。它为人类提供了全新的信息获取和管理平台,使人与自然能远程交互。相对于传统网络和AdHoc网络,无

学位

无线传感器网络路由协议能量均衡非均匀分簇

视频2D/3D转换关键技术研究

近些年来,3D电影逐渐普及,相对于传统电影,3D技术可以提供更加身临其境的逼真效果,已经成为了当前发展的一种趋势。然而3D电影从题材的选择、拍摄、剪辑、洗印到发行放映,都

学位

2D/3D转换深度图视频转换系统结构重建技术

模糊控制技术在喷码机油墨压力控制中的应用研究

连续式喷码机是一种广泛应用于工厂流水线上，以非接触方式打印产品标识的一种喷印设备。其供墨系统油墨压力的稳定直接影响到喷码机的喷印质量。油墨压力控制是具有滞后环节及

学位

喷码机油墨压力模糊PI控制FPGA技术AD转换

基于WPF的三维可重构粮情检测系统的研究与实现

目前的粮情检测系统主要把重点放在了传感器采集到的数据上，但是对于储粮环境以及传感器本身的关注度并不高。针对上述问题，本文提出一种基于WPF的三维可重构粮情检测平台的设

学位

粮情检测系统无线传感器网络视窗表现基础虚拟三维场景重构技术WPF平台

智能保险柜测控系统研究与功能实现

随着科学技术水平不断发展,“智能”的概念逐渐进入人们的视野,智能产品也随之受到人们的广泛关注和青睐。由于嵌入式系统体积小、功能强大、系统稳定等特点,成为近年来智能

学位

智能保险柜测控系统嵌入式LinuxMiniGUIMySQL

车载网络与触控人机交互系统的设计与实现

车辆的智能化控制分为两个方面：车辆本身的智能化与车辆系统的智能化。前者要求车载设备间的网络化信息交流和智能控制，后者需要远程服务器与车际之间实时信息的交互、管理和干

学位

车载网络人机交互通信网关UART接口软件设计

机器视觉在印刷品检测系统中的关键技术研究

机器视觉在一些科技领域中卓有成效的应用,引起了学术界和工业界的极大兴趣和重视,其应用领域也逐渐扩张。机器视觉可以大大提高生产效率和自动化程度。因此,在当今的自动化

学位

机器视觉印刷品在线检测系统条码定位数字识别

基于探索性分析的作战能力分析方法研究

学位

钢丝绳在线检测系统的改进设计

钢丝绳在实际生活中有着广泛的用途，它作为提升设备的关键部件起着重要作用，因此钢丝绳的失效将导致严重的后果。因此，设计一套可以在线检测钢丝绳损伤情况的检测系统有重要的意

学位

漏磁检测LabWindows语言EMD方法磁偶极子模型钢丝绳在线检测系统改进设计

视频中的人体跟踪和行为识别方法研究

随着互联网的飞速发展,视频数据的爆炸式增长和内容的多样化给分析、处理视频数据提出了新的挑战。人体跟踪和行为识别是视频分析的核心问题,也是目前计算机视觉和模式识别的

学位

半监督鉴别跟踪行为识别稠密轨迹运动边界特征融合视频数据

基于三维模型的地标建筑分类和识别关键技术研究

其他学术论文