文本图像版面分析关键技术研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:ivan_wongxc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息科技、网络技术和通信技术的迅速发展,电子文档是如今信息传播和分享的主要载体。信息的不断膨胀对电子文档的存储产生巨大压力,因此需要对这些信息进行分层压缩。分层是把文本图像分离成前景层和背景层,然后采用不同的压缩编码技术,而文本图像的版面分析是分层过程中非常重要的一个环节,版面分析包括版面分割和区域识别。在文本图像摄取和采集的过程中,容易产生图像倾斜和多余的边缘信息,需要先进行倾斜校正和边缘剪裁,然后再进行版面分析。对于倾斜的文本图像,需要先进行倾斜校正,通常采用Hough变换的检测方法,但是该方法的计算量大。本文提出一种改进的Hough检测方法。首先对图像进行缩放重采样,减少待计算像素点个数,同时对Hough变换中正余弦值进行预存储,减少计算时间。然后使用二次Hough检测,缩小检测范围并减小角度增量,不仅可以减少计算量,还能保证检测精度。实验结果表明,该方法相对于标准的Hough检测方法,平均计算效率可以提高20倍左右。对纸质文档进行拍照时,容易拍到多余的边缘信息,需要去除这些信息。首先,本文给出一种基于投影的边缘剪裁方法。该方法对多个方向进行分段投影,统计边缘信息并确定边界位置,但是对于边缘信息较复杂的情况适应性弱。因此,提出一种基于轮廓的边缘剪裁方法。首先对不同区域进行轮廓提取并计算出外接矩形,去除部分边缘信息,然后设置一个判定策略确定边界位置。实验结果表明,该方法对于边缘信息混乱、无规则的情况适应性较强。版面分割是版面分析中非常重要的一步,首先将文本图像划分为多个子区域,然后进行区域识别。考虑自顶向下方法的效率优势,本文提出一种分列投影的版面分割算法。首先将文本图像划分为N列,然后对每一列进行水平和垂直方向投影,通过多次投影将文本信息划分为多个子区域。实验结果表明,该方法继承了投影法本身计算速度快的特点,同时还可以避免图像弧度对版面分割的影响,并且对排版较复杂的文本图像也有很好的适应性。
其他文献
在PLC的编程规范——IEC61131-3中,介绍了用于PLC编程的五种相关语言,分别是:梯形图(LD)、功能块图(FBD)、顺序流程图(SFC)、结构化文本语言(ST)和指令表语言(IL)。其中ST语
数据挖掘作为一个新兴的多学科交叉应用领域,正在各行各业的决策支持活动中扮演着越来越重要的角色。在这个信息时代,面对海量数据的出现,如何有效地利用大量的原始数据分析现状
随着人类社会的发展,社会的不安全因素也随之增多。国际上的每一次恐怖主义袭击事件都为各国的安防部门敲响了警钟。因此,许多国家越来越重视采用视频监控技术对重要部门、敏
随着软件技术的发展,软件工程领域中对软件大小、复杂度、资源利用等特性的认识越来越深入,针对软件系统能耗问题的研究越来越受到重视。本文以嵌入式软件系统能耗为研究对象
窑炉控制系统的研究在国内起步较晚,发展并不完善,多数是基于工控机,缺少智能化技术。目前,嵌入式控制系统已经成为工业控制的主要应用,而ePLC(embedded PLC)更是嵌入式控制
系统负载是衡量互联网应用可用性的一个重要指标,如何降低中心服务器在应对大规模资源请求时的系统负载一直是研究热点。传统上业界采用内容分发网络,即CDN技术来减小中心服
自动规划是人工智能中的一个重要研究领域,在机器人的动作规划,货运码头调度,以及工厂的车间作业调度,现代物流管理以及宇航技术等领域中都有着广泛的应用,因此受到了研究者越来越
随着计算机技术不断发展,软件的变化特性越来越受到广泛关注。特别是在动态异构的网络环境成为主流软件运行环境之后,网络的动态性和开放性使得硬件资源与客户需求更加频繁地
随着大规模集成电路、多媒体数据压缩、高宽带网络和大容量存储器件等技术的发展,目前视频应用领域在系统应用、数据压缩、传输和存储等诸多方面的瓶颈限制已被逐个打破。这
汽车交通事故是当今全球性公害之一,从全世界的统计数字来看,每年因道路交通事故而死亡的人数己高达40万人之多,伤1000万人以上,财产损失超过500亿美元,由汽车交通事故导致的