数字图书馆图像资源检索框架的构建与实现

来源 :现代情报 | 被引量 : 0次 | 上传用户:f6012000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘要]图像检索为数字图书馆的发展提供了技术支持,图书馆应重视数字化发展以提升服务质量。本文提出一种数字图书馆图像资源检索框架,并对系统的实现过程做了详细的分析。同时,在提取图像特征时提出了一种基于非下采样的con.toudet变换图像检索算法(NSCT),能够在大量图像数据中挖掘有效的特征信息。该算法首先对图像进行多尺度、多方向分解,然后计算低频和高频中不同方向的子带系数的标准差和均值作为图像的纹理特征。实验结果显示,本文提出的图像检索框架具有可行性,能够为用户提供更优质的搜索服务,并且与同类特征提取算法进行比较,该算法具有良好的检索性能和较高的查准率、查全率。
  [关键词]数字图书馆;图像检索;框架构建;非下采样conlourIet
  DOI:10.3969/j.issn.1008—0821.2017.06.009
  [中图分类号]C250.76 [文献标识码]A [文章编号]1008—0821(2017)06—0055—06
  随着计算机技术、网络技术及多媒体技术的快速发展,人们进入了“读图时代”,大量图像源源不断的产生,而且图像本身具有生动性、直观性和易懂性的特点,满足了人们对信息的需求,成为信息处理领域中的主要处理对象。尽管数字图书馆图像采集技术以及存储技术也在不断地进步,但如何从大量的图像数据中分析出有价值的内容并对这些海量的图像进行有效的组织,使用户能快速、准确地找到他们感兴趣的信息,成为研究者们研究的热点之一。同时,在大数据时代,用户的信息素养越来越高,对信息的质量要求也不断提高,也对图书馆产生了更新、更高的要求。而图像检索技术的发展,能够更好地满足用户对图像检索匹配的精准度要求,改善用户在图像检索过程中的信息检索体验。总之,对图像检索领域的深入研究将决定大数据时代数字图书馆能否抓住机遇提升自己的发展水平。
  近年来,对图像检索需求和检索行为等方面的研究已经取得了丰富的成果,但在如何提高用户图像检索效率的问题上并没有统一合理的解决措施,而图像检索技术恰恰能够弥补这一缺失,现阶段的图像检索技术主要分为基于文本的图像检索和基于内容的图像检索两大类。传统的基于文本的图像检索系统是先对图片信息用关键字进行描述和注释,该技术虽然已经在数字图书馆图像检索领域中有了比较成熟的研究经验,但依靠手工标注会浪费大量的精力并且人为的主观性理解不能充分表达图片的内涵,使得图像检索的结果并不尽如人意。图像文本包含更多的内容,这些丰富的信息需要使用一定的方法和技术进行挖据,采用内容的检索方法不仅可以对图像信息进行客观合理的描述,而且采用相似性度量的手段有效地提高了检索效率,满足了信息时代发展的需求,于是基于内容的图像检索(CBIR)成为数字图书馆研究的主要方向。
  本文通过构建一种基于内容的数字图书馆图像资源检索框架,并利用非下采样的Contourlet变换方法对图像资源进行特征提取,提高了图像检索精准度,有效地实现了数字图像资源检索方案,为数字图书馆图像资源的搜索提供了参考价值。
  1基于内容的图像检索研究现状
  CBIR结合人工智能、认知心理学、面向数据库等方面的学科知识,利用计算机视觉等方面的理论对图像进行自动检索,它不再依赖人工注释,具有节省人力、客观、可建立复杂描述和应用前景广阔等诸多优点,因而该技术被广泛研究。现阶段CBIR主要从以下两个方面进行研究:
  1)图像特征提取。图像特征提取就是通过映射或变换将高维信息转换成计算机识别的底层特征的过程,常用的特征包括颜色特征、形状特征、纹理特征等,这些特征要尽可能维数小、獨立性好才能对图像的描述具有更好的相似性。
  2)相似匹配和图像特征索引。提取图像特征后,如何采用合理的方法对特征集进行匹配和索引以提高图像检索的精度成为该阶段的主要研究方向,图像匹配和索引大致分为3类技术:相似性测量、聚类分析、相关反馈技术。主要框架概念图如图1所示。
  1.1特征提取
  特征是图像的一种固有属性。在CBIR检索模型中,对特征向量的提取是实现图像检索的关键步骤之一,也是数字图书馆图像检索领域研究的重点和难点。特征提取的内容主要有基于低层的特征提取和基于高层语义的特征提取两个方面。尽管高层语义特征能够更好地反映图像特征。目前也出现了有关高层语义特征提取的相关研究,但图像低层特征与高层语义特征之间存在着巨大的“鸿沟”,如何从低层特征中提取语义信息并将它们融合在一起仍然处于瓶颈期,所以近几年对图像特征提取的研究主要还是从颜色、形状、纹理等低层特征来进行的。
  颜色作为图像内容的底层特征之一,在图像检索领域的研究中得到广泛应用。颜色特征易于从图像中提取,它对图像的变化依赖性较小,可以有效地减少旋转、尺度不一所带来的干扰。除了采用颜色直方图对颜色特征进行提取以外,还可以采用颜色聚合向量、颜色协方差和颜色矩等方式提取。
  形状特征是图像的另一个重要特征,包括了部分图像语义信息,形状特征的优点是可以通过算法提取将图像低层特征和高层特征很好地融合在一起,这样就可以得到图像中的检索目标。但形状特征受图像的平移、缩放、旋转等变换的影响,有一定的局限性。有关形状特征的图像检索,可以通过基于边界特征的或基于区域特征这两种方法来提取。
  纹理是绝大多数物体表面的固有属性,不同物体表面的组织结构之间的排列规则不相同,人们通过感官视觉可以轻易地分辨不同的纹理。纹理特征能够反映像素在领域空间的灰度分布规律,是对像素在局部区域之间关系的一种度量。针对纹理特征的提取算法已经有了很多研究成果,目前纹理分析的方法基本分为统计法、结构法、模型法和空间/频率域联合分析法这4类方法。
  1.2特征的索引与匹配
  对数字图书馆图像资源特征提取后,如何将图像数据集进行索引和匹配成为主要的问题,如何解决语义鸿沟问题是这一过程的主要研究难点。相似性度量是图像特征匹配非常重要的组成部分,其承担着判断图像是否相关的重要作用,常用的相似性度量算法有曼哈顿距离、夹角余弦、兰式距离、欧式距离和编辑距离等。每一种相似性度量算法都有其优点也有其应用的局限,对于不同的应用和不同的图像特征,在设计图像检索系统时,相似性度量算法的选择和设计是不可忽视的一步。同时,单一地通过一种相似度测量方法难以产生健壮的、符合人类感知的图像序列,来解决这一问题,研究人员还需要从图像聚类、分类和相关反馈技术进行改进。   聚类和分类适用于处理大规模、非结构化的图像数据。Murthy在对图像检索时提出了K-means聚类并结合分层的方法,首先根据图像颜色特征将其分为不同类别,再利用K-Means算法进行进一步的聚类,分层聚类能够有效忒搞检索速度,K-Means算法通过对向量与其聚类中心之间的距离进行评价,高校准确地获得聚类结果。张永库等人在利用改进颜色聚合向量提取图像颜色特征的基础上,找到服务条件的特征向量作为初始聚类中心,利用分散度与贡献度进行聚类并建立特征索引库,提高了检索的效率。
  相关反馈为人们提供了与系统交互的机会,通过反馈检索结果,可以不断提高检索效率。芮勇等人最早提出了相关反馈技术,并将其应用于基于内容的图像检索中。现阶段有关图像检索的相关反馈技术研究方向为减少系统与用户的交互次数,满足用户的检索需求从而提高检索的效率和精度。
  2数字图书馆图像资源检索框架构建
  本文构建的基于内容的数字图书馆图像检索框架主要由特征提取、相似匹配、反馈输出这3个模块组成。其中对图像资源特征提取,建立特征数据库是构建数字图书馆检索系统的核心,也是本文研究的重点。具体模型框架如图2所示。
  系统首先对存储在数字图书馆数据库中的图像进行自动提取特征,然后用多维的特征向量来表示,存入到图像特征数据库。而用户根据自己的检索需要,选择一张或几张样本图像,同样用相同特征提取方法提取特征向量。最后,系统计算出特征数据库中特征向量和提取的样本图像的多维特征相向量的相似距离,根据距离进行排序,再结合相应的索引信息,最终就能获得一定程度上相似的图像。
  2.1图像预处理
  由于生成图像数据的工具、手段以及图像在传输时会引入噪声,导致图像质量下降。因此,为了提高图像检索效果,在收集图像数据集后,不能直接作为检索图像,本文首先对原始图像灰度处理,然后采用中值滤波的方法对图像进行去噪以减少图像检索的干扰因素。
  2.2图像数据库特征提取
  特征提取是数字图书馆图像检索系统实现的重要环节,信息提取的完整性直接影响数字图书馆图像检索的效果,纹理特征反映图像本质信息,是近年来较为常用的提取图像信息的方式,本文提出了一种NSCT纹理算法提取图像特征,并通过实验并与同类算法比较分析,该算法具有较好的检索效果,可以为数字图书馆图像检索系统的实现提供参考方案。
  2.2.1 NSCT算法
  NSCT算法是由Contourlet变换发展而来的,Contourlet变换的基本思想是用近似的“线段”来逼近原始图像,相比小波采用“点”来逼近,可以利用更少的系数来近似原始图像,因而具有良好的各异性和方向性。它很好的解决了二维或更高维奇异性,可以获得更多的高频中各个方向的细节信息。但是,采用Contourlet变换对图形进行分解时,必须对图像信号频繁地进行采样操作,导致分解的过程中不仅缺乏平移不变性还容易信息失真,为此Cunha等人针对Contourlet变换的一些局限性进行改进,提出非下采样的Contourlet变换,在分解和重构过程中,取消了上、下采样操作,具有较好的平移不变性。
  NSCT由非下采样的金字塔滤波器NSP和非下采样的方向滤波器组NSDFB实现。如图3所示,图像首先经NSP分解为低通部分和带通部分,然后带通部分通过DFB进行多方向分解,类似的分解步骤可以对低频子带继续迭代滤波,实现对信号的多尺度、多方向分析。因为多尺度分解和多方向分解是相互独立的,所以各高频子带上的方向分解数都可以是2的任意正整数次幂。与Contourlet变换相比,由于剔除了下采样环节,经NSCT分解后的图像与原始图像尺寸一致,在保持平移不变性的同时也保留了更多的图像细节。
  3.2结果分析
  通过实验结果看出,相比同类算法,本文提出的算法在检索目标图像后,返回前7、10、20、30幅图像的平均查准率要明显高于其它类方法,同时该算法检索五幅图像的平均查全率达到80%,优于Harr小波变换检索40%和文献[16]提出的检索算法59%,不仅使数字图书馆图像检索框架得以有效实现,而且具有较高的检索准确率。
  4结语
  大数据时代,图书馆新兴的数据分析、知识挖掘、信息处理等服务为数字图书馆带来了历史性的发展机遇,图书馆通过总结数据中存在的规律,挖掘潜在价值,将促进图书馆服务水平的提升。图像检索技术为数字图书馆图像采集与处理提供了新的技术支持和科技创新的平台,能够更好地实现图书馆的服务宗旨。本文构建了数字图书馆图像资源检索框架,并提出了一种基于NSCT的图像纹理检索算法,实验结果显示该算法實用便捷,具有较好的鲁棒性和较高的检索性能,对数字图书馆图像检索的服务模式具有一定参考价值。多种特征融合和相关反馈机制可以进一步提高图像检索精度,将是以后研究的重点。
其他文献
〔摘要〕借助数据挖掘软件Clementine 120,以Apriori模型和GRI模型为数据挖掘方法,对东华大学近五年来纺织学院博士研究生的借阅记录进行分析。通过分析数据挖掘的结果,寻找学科领域中相互关联的知识,辅助教师的教学工作,优化学科建设。  〔关键词〕数据挖掘;关联规则;学科建设;学科关联  DOI:10.3969/j.issn.1008-0821.2013.09.029  〔中图分类号〕
随着人民生活水平的提高和家庭结构的变化,消费者对西瓜的需求向优质化、中小型化发展。京欣类西瓜表现早熟、皮薄、优质、瓤脆爽口、瓜个适中,迎合了消费趋势,近年在大中城市郊区发展迅速。陕西省关中地区以中棚模式种植,于6月上旬上市,刚好填补了大棚西瓜结束和露地西瓜上市前的空档期,2004-2007年批发价一直在3元/kg左右,每667 m2纯收入达7 000-8 000元,在经济利益带动下,西安市户县及咸
瓤用籽瓜甜籽1号是一个西瓜、籽瓜中间类型低糖西瓜品种。经过连续3年在宁夏中部干旱带压砂地试种,表现出显著的丰产性、抗逆性,具有突出的贮运性,综合性状突出,作为一个特殊类型的西瓜品種,在干旱、半干旱地区具有良好的推广前景。    注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文
摘 要:越冬春甘蓝新品种苏甘21是江苏省农业科学院蔬菜研究所以自交不亲和系9407和Y6-6-4杂交育成的一代杂种。越冬栽培全生育期138 d左右;冬性强,早熟,耐寒性好;植株开展度约48.8 cm × 47.8 cm,生长势较强,整齐度好;叶色浅绿,蜡粉少,叶球牛心形,肉质脆嫩;单球质量1.0 kg左右,667 m2产量约3 000 kg。适合中国南方地区特别是长江流域作越冬春栽培。  关键词:
[摘 要]本文通过对中国水产科学研究院系统文献信息资源建设情况的调查,以及文献信息资源共建共享的机制建设和措施方法,系统地展示了渔业科技信息资源共建共享的实践和成果,并提出了当前信息资源共建共享的模式对科研的促进作用和今后的努力方向。  [关键词]渔业;科技;信息资源;共建共享  DOI:10.3969/j.issn.1008-0821.2011.05.015  〔中图分类号〕G250.73 〔文
教师本人已从教18年了,教学风格开放,一直关心着教材的变化和学生的接受能力,现在主要是在研究新课标下课堂教法和学法。这里讲的单项式和单项式相乘是一堂尝试课,根据多年的教学经验,我知道学生学了单项式和单项式相乘后,过一段时间总会出现,系数积的符号错和同底数幂相乘的指数错,这个问题直接影响到复杂的多项式相乘运算,因此本人在新课标的指导下,用新教法尝试,以解决这个学生常错的问题,同时减少后进面。
牛牛和小赫住在离海边不远的地方,他们每天傍晚都会坐在岸边的岩石上,目送太阳去睡觉。  “为什么太阳会早上起来,晚上睡觉,并且每天都很准时呢?”小赫问。 本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
1.从旧石器时代到新石器时代,一直延用着比较简单的石器;砍所器、石铲、圭形石凿、石斧等。 本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
〔摘要〕采用作者共引分析方法,利用聚类分析、多维尺度分析以及社会网络分析方法,构建河南省图情学学术群体知识图谱,分析河南省图情学主要的研究分支以及代表性的学者群体;同时与全国范围的图情学学术群体知识图谱进行对比分析。  〔关键词〕作者共引;共引;知识图谱  〔中图分类号〕G250.252〔文献标识码〕A〔文章编号〕1008-0821(2013)08-0103-05  作者共被引分析(ACA)是指两
[摘 要]信息源是信息的生产地,信息是信息源知识内在体现,通过对信息不同属性和特征进行分析,可以了解信息源基本内涵。信息源作为知识库开发的主体,其搜集与开发是知识库建设的关键。分析知识库搜集与开发面临的问题,提出问题解决策略,并以广州“教育e时代”教学资源库为实例分析,对信息源搜集与开发进行实证研究,为知识库建设提供可行性参考意见和操作策略。  [关键词]知识库;信息源;信息;策略;实例分析  D