基于统计学习的视频文字检测与定位研究

来源 :河北工业大学 | 被引量 : 2次 | 上传用户：mdtuyen

【摘要】

：

视频文字是除了视频中的图像信息以外的一种能够准确概括视频内容的有效方式,人们可以单单从视频文字来了解视频的主要内容,省去了大量观看视频本身的时间,同时文字信息为视

【作者】

：

李丹

【机构】

：

河北工业大学

【出处】

：

河北工业大学

【发表日期】

：

2011年01期

【关键词】

：

视频文字检测视频文字定位特征提取最小最大概率机梯度离散余弦变换模糊支持向量机

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

视频文字是除了视频中的图像信息以外的一种能够准确概括视频内容的有效方式,人们可以单单从视频文字来了解视频的主要内容,省去了大量观看视频本身的时间,同时文字信息为视频的检索提供了有利的依据。视频文字检测决定了视频中是否含有文字,为定位起到了筛选的作用,可以提高定位的速率以及准确率;视频文字定位可以帮助减少视频数据的存储量,也为视频内容的理解和检索提供了线索。因此,视频文字检测与定位研究具有重要的意义。统计学习是一种研究小样本分类、回归和预测的理论,其最有指导性的理论结果是推广性的界。在统计学习理论的基础上发展出了最小最大概率机、支持向量机等机器学习方法,它们在解决小样本、非线性及高维模式识别问题中表现出特有优势。本文利用统计学习方法实现视频文字的检测与定位,具体研究内容如下:(1)基于最小最大概率机的视频文字检测研究。读取视频信息,对视频帧进行离散余弦变换,提取视频帧的纹理特征作为样本,训练最小最大概率机分类器,得到离散余弦变换块数分布,结合阈值条件以及文字本身所具有的特征,利用分布出现突变处判断视频帧中文字出现或消失的帧。实验结果表明,最小最大概率机算法对于视频文字的检测是可行的,准确率达到约95.2%。(2)基于梯度离散余弦变换的视频文字定位研究。为了在视频帧中定位出笔画简单的文字,更进一步地研究文字的纹理特征,将梯度计算引入离散变换,在特征提取过程中,突出体现了文字的边缘信息;对初步划定的候选文字区域,进行滤波和形态学处理等操作。实验结果表明,通过对视频帧进行梯度离散余弦变换得到的纹理特征可以作为文字与背景区分的有利依据,并且与仅使用离散余弦变换算法相比,对于较少笔画的漏检率降低了2.4%,运行时间缩短了2.2s,该算法同样适用于视频中的静态和动态文字的定位。(3)基于模糊支持向量机的视频文字定位研究。为了在复杂背景中准确定位出文字,降低定位的虚警率,在提取出上述纹理特征的基础上,结合视频帧的灰度和边缘信息,将其作为三维样本,选取适当的参数和核函数,训练模糊支持向量机分类器,利用视频文字本身所具备的特征进行后处理,用文本框精确标识文字区域。由于模糊支持向量机存在着隶属度,能够对样本属于不同类别的程度进行合理地区分,因此,较运用经典的支持向量机算法进行定位时准确率提高了6.2%,虚警率降低了1.5%,对于视频中的静态和动态文字的定位该算法同样适用,且准确率较高。

其他文献

IMS(IP多媒体子系统)接入机制的研究

AKA机制是由因特网工程任务组(IETF)制定、并被3GPP应用于3G无线网络的鉴权机制。IMS的鉴权机制沿用了这种机制的原理和核心算法,故称之为IMS AKA机制。用户在接入IMS网络的

学位

IMSAKA认证

绿色通信网路由规划技术研究

节能是当前社会各个领域内人们共同关注的热点问题,性能、成本和能源已成为通信网规划设计中的主要考虑因素。基于节能目的的绿色通信网技术在无线领域已经比较成熟,有线领域

学位

通信网规划能量感知线性规划业务流搬迁节能

基于JPEG2000的ROI编码技术研究与实现

多媒体和网络技术的不断发展,在有限的空间和带宽资源下需要存储、传输更多的图像,且能够根据用户的实际需要,提供不同分辨率或不同质量的重构图像。基于感兴趣区域的编码技

学位

JPEG2000小波变换感兴趣区域编码率失真优化系数移位

基于强化学习的动态频谱分配算法的研究

认知无线电的智能核心在认知引擎中,认知引擎执行在通信系统重构中必须的模拟、学习、最优化过程。认知引擎必须具备学习能力,是认知无线电区别于传统无线电的关键部件。本文

学位

认知无线电频谱接入多用户协作学习黑板模型融合算法

基于DSP的永磁同步交流电机矢量控制系统研究

永磁同步电动机与其它电机相比,它具有简单的结构,小损耗和高效率,与直流电机相比,永磁同步电动机在机构上省略了电刷和换向器;与异步电动机相比,它不需要励磁装置,所以功率因数高,力矩惯量比大,且各参数可测,容易控制。永磁同步电机矢量控制系统可以实现动态响应速度快,精度高,调速范围广,因此在交流伺服控制领域引起了国内外学者的广泛关注。本文所设计矢量控制系统选用TI公司生产的电机控制专用的TMS320F2

学位

永磁同步电动机矢量控制DSP

LTE系统信号检测技术研究

自无线通信出现以来，信号检测技术在不断的发展。然而，传统的信号检测技术，由于其较高的误比特率或者较高的运算复杂度，很多已不适合在要求高速率，高可靠度，低时延的LTE系统中使用，

学位

LTEMIMO空时编码信号检测自适应分组

基于特征的多源遥感图像配准研究

图像配准将不同时间、不同传感器、不同视角及不同成像条件下获取的两幅或多幅图像进行匹配和叠加,是图像分析和处理的关键技术,是信息融合、图像分析、变化检测的必要前提,在遥感图像处理、计算机图形学、摄影测量学和地理探测等领域有着广泛的应用价值和研究意义。对两幅图像进行配准也就是建立两幅图像之间的对应关系,确定相应几何变换参数,实现对其中一幅进行几何变换的过程。换言之,通过构造一种最佳的数学模型来模拟图像

学位

图像配准特征提取特征点虚拟特征点遥感图像

基于VEP脑机接口系统的应用设计与研究

脑机接口(brain-computer interface,BCI)是一种不依赖人的肌肉和外周神经等正常输出通道的新的通信系统。运用工程技术手段可以让人的思维直接转化为外部设备的控制命令。目

学位

脑机接口稳态视觉诱发电位编码调制视觉诱发电位

基于工况环境下绝缘子污秽微波辐射特性的研究

本文根据微波辐射理论，主要研究了工况环境下绝缘子污秽的微波辐射测量方法。首先，分别在晴朗天气和云雾气象条件下，试验研究了XP-70 型绝缘子辐射的天线温度(TA)与等值盐密（ESDD

学位

OFDMA系统资源分配算法研究

在未来的宽带无线通信系统中,存在两个最严峻的挑战:多径衰落信道和频谱效率。由于正交频分复用(OFDM)技术在抗多径衰落和高速传输等方面的强大优势,使该技术成为第四代移动

学位

OOOFFFDDDMMA自适应资源分配均衡容量公平性

基于统计学习的视频文字检测与定位研究

其他学术论文