基于学习的自然场景中文字标牌检测定位方法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:xyfall533
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景中存在很多路牌、警示牌、广告牌、站牌、交通标志、门头和有商店、街道、公司名称的文字标牌。自然场景中的文字信息直接的反应了周围环境,在人们理解场景的过程中发挥着重要的作用。自然场景中的文字信息提取由文字检测、文字定位和文字识别三部分组成。自然场景中出现的文字在大小、形状、字体、颜色和排列上的多样性,以及受到复杂背景、光照变换、几何失真和污染模糊的影响,使得准确的文字检测、定位和识别就变得很困难。文字检测和定位的准确性会直接影响文字的识别率,所以,很多算法都致力于文字的检测定位问题。  本文提供了一种基于学习的自然场景中文字标牌检测定位方法,该方法是以视觉词袋模型(BOVW,Bag of Vistlal Word)为基础进行文字标牌检测定位。BOVW模型的主要思想是把图像看作由不考虑空问信息的无序局部特征所构成的集合,再带入训练好的分类器进行类别判定。一般说来,BOVW由下列4个模块构成:局部特征提取、字典学习、特征量化和分类。特征、字典和分类器的选择对BOVW的类别判定性能影响很大,因此,本文的主要研究内容集中在文字标牌的强区分性特征提取、街景自适应性目标分类的字典学习方法和鲁棒的分类器选择几个方面。  首先,针对自然场景中的大规模数据,本文采用了能够自适应决定目标种类个数的自生长和自组织神经网络(SGONG,Self-Growing and Self-Organized Neural Gas network)用于BOVW模型中的非监督字典学习,解决了传统聚类方法的类别个数需要人为定义和计算复杂度过高等问题。其次,在文字标牌分类器监督学习时的特征选择上,一方面选用对旋转、尺度和颜色变化有强鲁棒性的SIFT特征在SPM模型下的直方图表示作为文字标牌的“形”特征,该特征同时具备形状和空间信息;另一方面为了消除不同颜色文字标牌的描述差异性,对HSV色彩空间的“HS”分量的直方图进行极大值移位操作,得到一种颜色不变性直方图特征(CIHS Histograms)作为对文字标牌的“色”描述。把“形”特征和“色”特征融合得到一种强区分性特征—Shape&Color特征,解决文字检测器中存在的特征描述不全面问题。最后,选用ADABOOST级联分类器进行文字标牌的多尺度检测。  实验结果显示,本文提出了基于学习的自然场景中的文字标牌检测定位方法有着良好的检测定位性能。Shape&Color特征+级联AdaBoost算法训练所得文字标牌检测器,对文字标牌检测的准确率可以达到90.05%,误检率为5.45%,相对SVM分类器,取得了更高的检测准确率和更低的误检率。
其他文献
如何向用户提供具有服务质量(QoS,Quality of Service)保证的服务且最大化网络资源利用率是异构网络融合系统的热点课题。本学位论文以蜂窝(Cellular)网络和无线局域网络(WLA
偏振高光谱遥感在高光谱成像的基础上,引入了偏振信息。高光谱图像具有丰富的光谱和空间信息,使得其在遥感、医学等领域中得到广泛的应用;而偏振特性在低照度目标、植被覆盖等情况下都有显著的优势,所以近年来也受到广泛的重视。然而,由于现今偏振高光谱遥感尚未得到广泛应用,所以缺乏相应数据而无法进行数据的定量分析,从而制约着偏振高光谱的研究和发展。鉴于上述问题,论文从仿真的角度来分析偏振高光谱的成像模型,研究影
500米口径球面射电望远镜(FAST)的主动反射面是由2400余个索网节点组成,FAST要顺利完成观测任务,需要对2400个节点完成实时动态定位控制,因此主动反射面控制系统需要对下拉索
卫星导航技术在各国的军事、经济和人民生活方面具有越来越重要越来越广泛的应用,如导弹制导、工程测量控制、船舶车辆导航等,各国也越来越重视卫星导航技术的研究和发展。目前
语音交互式智能化舰用灯光通信系统是采用高亮度LED显示设备,通过DSP进行实时通信语音识别和LED点阵编码图形识别的新型灯光通信系统。系统以语音或键盘方式输入通信指令,经
无线激光通信(Wireless Optical Communication,WOC)是利用激光束作为信息载体,实现信息传输的无线宽带通信技术。激光信号在大气中传输势必会收到大气湍流光强起伏的严重影响,
得益于其低功耗、低复杂度和高传输速率等优点,超宽带无线通信技术受到越来越多的关注,并被认为是最具发展前景的短距离高速无线传输技术之一。   本论文提出了一种基于数
车牌识别技术在智能交通领域发挥着重要作用。作为车牌识别技术的关键环节,车牌定位一直被广泛研究。在采集车辆视频图像过程中,由于周围环境变化等不可控条件的作用,都对车
近年来,最佳视点的选择问题已成为体绘制领域的重要研究内容。由于体绘制成像速度较慢,在海量规模的体数据面前,寻找体绘制的最佳视点或一组有效的视点集合,对于分析和理解体
电力资源是国民经济的命脉,国家各类产业的快速发展离不开电力系统的安全稳定运行。21世纪以来,我国的城乡一体化建设进程不断加快,电网规模逐渐扩大。与此同时,外力破坏导致电网停运的事故频繁发生,其中绝大多数是因大型工程机械违章施工等行为导致的。为了预防外力破坏事故,工作人员采取了人工巡视、架设红外传感器、搭建激光雷达探测装置等方法,但这些方法存在漏警率和误警率高,易受环境影响等缺点。近年来,国家电网公