论文部分内容阅读
特征提取是计算机视觉系统中不可缺少的重要组成部分,它在各种视觉应用中发挥着重要作用,提取特征的优劣将直接决定系统性能的好坏。虽然提出了多种特征提取方法和识别模型,但目前的计算机视觉系统与人类的视觉系统水平之间仍存在着很大的差距。另一方面,近年来对生物视觉系统的研究取得了很大的进展,研究者通过深入探索灵长类动物的大脑视皮层区域,初步了解了视觉信息的处理通路、各视皮层区域的功能特性和一些重要的感知机制等,这些成果为构建仿人类视觉感知的计算机视觉算法提供了新的途径。论文以生物视觉理论为指导,重点研究对视觉信息的加工处理即特征提取过程,通过深入研究视皮层中的信息处理方式和重要的功能机理,从多个方面来模拟视皮层中表征不同信息的机制,进而提出基于复杂细胞特性的特征提取模型、模拟细胞响应汇聚的特征合并方式、生物启发的局部特征描述子以及提取颜色特征的模型,并取得了实际应用。论文的主要工作可概括如下:首先,提出了一种结合图像拓扑编码来模拟复杂细胞特性的特征提取模型,该模型将基于独立子空间分析从自然图像中训练而得的滤波器组进行改造,提取出具有明显方向和拓扑性的滤波器池,可简单高效的模拟复杂细胞的特性;进而通过视皮层内的协同合并策略将滤波器的响应进行合并,提取了具有一定不变性的特征,将其用于多目标识别实验,该特征表现出了明显的优势。其次,对视皮层内细胞响应汇聚的方式展开了深入的研究,通过对比分析已有研究中提出的几种合并策略的特性和不足,提出了一种能更加合理解释生物实验现象的特征合并机制。该机制将多种合并方式根据细胞间的局部连接进行关联,可实现对输入刺激局部变换的不变性,将基于该合并机制提取的不变特征用于目标识别,实验证实了其对目标的局部变化有更强的鲁棒性。然后,区别于常规的基于图像内容统计或数学分析的描述子,论文探索了脑皮层中局部区域的表征方式,提出了一种基于生物启发的局部描述子,其主要通过模拟灵长类动物脑皮层腹部流的视觉信息处理机制,结合细胞间的抑制、增强和响应归一化等特性提取对局部区域变化鲁棒的特征,并进一步融合方向和空间结构获得强区分性。相比广泛认可的SIFT和SURF描述子,该描述子在图像匹配和目标识别实验上取得了更优的性能,展示了基于生物启发的视觉算法的优势。该局部描述子能更加详细的描述局部区域,具有广泛的应用和研究价值。最后,针对多数特征提取方法对颜色信息利用不足的问题,提出了基于人类色彩感知机制的颜色特征提取模型。该模型基于对三色理论和对立色理论的研究,通过模拟从视网膜锥体细胞到视皮层拮抗细胞的颜色信息处理通路,构造了同时包含颜色信息和形状信息的特征提取结构。将该特征扩展到已有的视觉算法中,在多个数据库上进行分析验证,结果表明其能更好的融合颜色信息,有效提升了算法的性能。