基于交互式的鸟类图像识别系统的研究与实现

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:thisxyl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物种的鉴别与分类是生物学等科学领域中一项较为常见的科学研究内容。传统的基因鉴别、形态学鉴别等物种鉴别方法都需要专业的数据库支持,并且需要专业人员对样本的基因、形态数据进行采集。使得这些物种鉴别方法的时间较长,且受到专业技术及人员的条件限制。在计算机技术发展迅速的今天,图像数据已经成为重要的科学数据。在青海湖野生鸟类数据库中,就存储了大量野生鸟类的图像数据。利用这些丰富的野生鸟类图像数据,为鸟类物种的鉴别提供帮助成为十分有价值的科研问题。本文提出的对青海湖野生鸟类的图像数据进行基于图像内容的检索,可以帮助科学家更便捷、高效地实现鸟类物种的鉴别。   基于内容的鸟类图像检索系统可以实现对鸟类图像特征的自动提取、索引、比对功能。从而找出野生鸟类数据库中,在外观上与输入的鸟类图像最相近的一组鸟类图像数据。系统以此为依据,判断输入鸟类可能所属的物种类别。为了提高鸟类图像识别的准确度,本文针对鸟类图像的特性,加入了人机交互的图像识别模块,提高了鸟类图像识别的准确度。本文的主要研究工作包括以下四个方面内容:   首先,本文对目前国内外图像识别技术的发展水平和应用领域做了较为完整的分析。发现目前对于一般物体的识别尚无通用的可行的技术实现;但是,对于特殊物体的识别,通过人为建模和机器学习两种方式提取物体图像的特征可以实现针对某专业领域较为精确的图像识别,如指纹识别、人脸识别等。而对于鸟类图像识别,由于图像背景、形变、角度变换等技术难点的存在,目前还没有专门针对鸟类图像识别的研究与系统实现。   其次,本文从理论层面上分析了目前各种图像识别技术。对图像预处理、图像分割、特征提取、特征描述、特征降维、分类方法等阶段适用的技术进行分析和归纳,提取出适用于鸟类图像检索的方法。将这些方法进行分类,找到最优的组合模式。并且,使用基于统一标准数据集的实验验证各个方法在鸟类图像识别中的识别准确度和运行效率。   第三,本文针对鸟类图像背景复杂、姿态变换较多、角度变换多样的情况,提出采用人机交互的特征提取方法,来实现针对鸟类图像更为精确、快速的特征提取和索引。并且,将其整合用于鸟类图像识别系统中,与鸟类识别系统的其他各个模块良好结合。设计出适用于鸟类图像识别的系统,为基于其他专业信息的物种鉴别系统提供辅助和支撑功能。   最后,本文结合图像识别各部分技术实现了基于人机交互特征提取方式的鸟类图像识别系统。并且在统一的测试环境下,对特征提取时各个参数的选取对系统性能和识别准确度的影响做了系统的测试,得出对于野生鸟类图像识别最佳的交互方式和特征提取方法。有测试的结果数据得出结论为,使用人机交互的方法在对鸟类图像特征提取、多维索引和分类识别时均可达到实时对图像进行识别的要求,并且具有较高的准确度。
其他文献
随着信息技术和互联网技术的高速发展,视频逐渐成为了人们获取和传递信息的一种重要媒介。视频中的文字是一种高级语义信息,能够为视频索引与检索提供十分重要的辅助信息。如
视觉真实感绘制是通过对人眼进行光学建模,以人眼模型为成像模型,对人眼的多种成像特性和视觉缺陷进行模拟成像的技术。它能够绘制反映人眼球面像差、近视和远视等视觉特性的图
带有通配符的字符串匹配问题已成为诸多领域的研究热点,例如生物信息学、数据库系统中的SQL查询、搜索引擎的文本索引、文件名查找、网络入侵检测等领域。然而,带有通配符的
伴随着信息技术的迅速发展,网络信息量以指数级增长,以及网络信息检索工具效率低下,使用户很难从网上检索到所需信息。在本人参与的科技信息资源中心系统中,由于科技信息资源数据
随着世界各国在空间探测领域内的深入研究和扩展实验,空间探测领域使用的计算机系统所需完成的任务越来越复杂。但在空间环境中,由于空间辐射的影响,计算机系统很容易发生硬件故
具有真实感的语音可视化合成技术一直是多媒体和人机交互领域的一个有趣而具有挑战性的研究方向。它可以广泛地应用于教学、数字娱乐、远程会议以及电影游戏等方面。   本
基于关键字的搜索引擎是人们在互联网上搜索信息的重要方式,而互联网上大量的关系数据库则构成了DeepWeb的主要组成部分,因此面向关系数据库的关键字搜索成为该领域学者关注
近年来在线社交网络(Online Social Network,简称OSN)飞速发展,用户数量不断增加。在线社交网络以用户为中心,每个用户和网络中的其他用户成为朋友,形成人际关系网络,用户之间通过
近年来,随着各种数据获取技术与影像技术的逐渐成熟,三维标量场可视化技术已经成为科学计算可视化领域中的研究热点。体绘制作为一种重要的三维标量场可视化技术,在科学计算、医
数据驱动的人体动画合成采用捕获的真实人体运动数据驱动虚拟人体模型来产生动画,该方法由于动画制作效率高,所得结果真实感强,在近年来得到了广泛应用。但是由于运动捕获数据只