论文部分内容阅读
随着多媒体信息技术的膨胀,传统的检索方法已经不能满足发展的需求。自1992年基于内容的图像检索的概念提出之后,已经得到了国内外信息领域科技人员的广泛重视和研究,成为多媒体和数据库技术中的研究热点之一。 本文所研究的是一种特殊的图像——证书图像。证书图像本身有一般图像所具有的颜色、形状、纹理等底层特征,同时证书图像中包含的文字信息对于检索也有重大的意义。本文首先介绍了基于内容的图像检索以及光学字符识别(OCR)的研究背景和意义、国内外研究现状;然后介绍了其所对应的相关技术。利用计算机视觉、模式识别、图像处理与数据库等相关技术,针对证书图像检索所涉及的部分问题展开了研究,取得了一些有意义的研究成果。主要内容包括:通过颜色聚类获取证书图像中的颜色特征,通过边缘特征与区域特征结合的方法获取图像的形状特征,通过OOR获取图像中的文字信息,并可以通过对三种特征的一种或者多种融合来进行证书图像的检索。 多媒体信息检索的另一个研究重点是系统的检索效率,由于多媒体信息特征的维度较高,普通的索引结构在维度增高的情况下,效率会急剧下降,这种现象也称为“维度灾难”。VA-File是目前可以证明的对高维数据进行索引的唯一有效的索引结构,这种索引结构通过维持一个近似向量文件使得顺序检索的效率大大提高。本文即采用VA-File对图像特征进行索引,并在其基础上进行了多方面的改进:提高近似向量的逼近程度,改变近似向量的组织结构,从而提高其原有的检索效率。