论文部分内容阅读
当我们使用数字相机采集文本图像时,自然场景中的书本在图像中往往存在三维透视形变,而且这种形变对于文字信息的提取,特别是对后期的计算机OCR(Optical Character Recognition)产生非常大干扰。为了解决自然场景中的这个难题,本课题通过深入研究提出一种基于三维数据的扭曲恢复方法。本课题算法从三维点数据出发,运用三维扫描仪采集书本的三维模型信息,经过本文方法处理,基本上可以完成有书本自身厚度引发的文字视觉扭曲还原,恢复出书页辗平的逆向效果。本文首先介绍了目前文本形式的图像扭曲矫正算法的大体情况,从维度上说,可以分为二维算法和三维算法。然后研究当前主流二维算法和三维算法的优缺点,通过对比分析并提出了一种基于三维数据的扭曲文本图像校正算法的研究思路。然后,本课题详细讲解了三维书本模型和三维纹理的知识点以及处理办法。三维书本模型样本是运用eva扫描仪扫描书本水平平摊桌面上的情况。完成采集后再将纹理图片与三维网格顶点数据相对应上,最终达到书本弯曲矫正。随后,按顺序对采集到的弯曲模型做预处理工作,空间Z轴方向校正,曲面微分,计算XY平面的曲面拉伸系数,三维倾斜平面坐标到二维平面坐标的映射转换,辗平后的多个小平面的拼接。预处理可以去除页面边缘点运数据中的边缘噪点,空间Z轴方向校正有利于后期坐标变换,利用微分将曲面近似为平面,通过对每个微分后的小曲面进行拉伸辗平,最后对它们做拼接处理,从而达到页面扭曲恢复的效果。最后,根据本文算法设计并实现了本文的三维扭曲恢复算法。通过试验数据对比结果表明,本文算法可以在书本正常平放状态下有效辗平书籍处的扭曲。