论文部分内容阅读
机器视觉技术是在图像处理及模式识别上发展起来的新兴技术。典型的机器视觉系统通过图像摄取装置获得目标图像,然后将信息传递给图像处理部分,实现模式识别、在线检测、目标跟踪等功能,并可驱动执行机构完成相关动作,具有非接触、高精度、高速等特点,是先进制造中的重要组成。图像处理技术是机器视觉中的研究热点,直接影响到系统的性能,而图像矩是图像形状特征的表达方式,其描述了图像的区域特征。正交图像矩是图像矩中的一个重要分支,与非正交图像矩相比,具有多个显著的优点。传统正交连续图像矩的计算需要进行坐标空间的重新映射和积分的近似化处理。在总结前人研究的基础上,提出了一种精确计算伪Zernike矩的方法。首先将伪Zernike矩转变为Fourier-Mellin矩的线性组合,然后利用若干个矩形、三角形和扇形区域的拼接来表征整个计算区域,接着通过三角函数的积分关系,提出了基于迭代关系求解上述形状区域矩积分的方法,降低计算复杂度。另外,介绍了基于递归的伪Zernike矩精确求解算法,以递归方法计算相邻矩,减少计算时间。传统正交离散图像矩的求解不进行离散化和积分的近似化处理,一般通过迭代和对称关系进行求解。但是在大规模图像的高阶离散正交图像矩的求解中,迭代次数的增加将导致传递误差剧增。以Krawtchouk矩为研究对象,分析了Krawtchouk多项式在不同参数p下的对称关系,提出了一种Krawtchouk多项式双向递推的算法,最大迭代次数将缩减为原有次数的一半,从而提高Krawtchouk矩的计算精度。另外提出了分段双向迭代算法,可进一步减少迭代次数,降低计算过程中的传递误差。径向正交图像矩是一类特殊的正交图像矩,其幅值与旋转角度无关,旋转不变量可直接获得。径向连续正交图像矩的计算过程需要离散化处理,此过程将产生离散误差。首先分析了笛卡尔坐标系与极坐标系的一一映射关系,然后基于径向连续正交图像矩的推导表达式,构建了极坐标系下具有正交性质的离散傅里叶表达式,从而构建了径向双离散傅里叶变换,最后利用正交的余弦变换替换傅里叶变换,避免复数运算,提高计算效率。目标识别中图像特征量的选择是识别的关键因素。Zernike矩作为径向正交连续矩,直接反应了目标的区域特征,适合于复杂边界目标的描述。Zernike矩的裁剪半径直接影响到不变量的稳定性,提出了一种裁剪半径的计算方法。针对BP神经网络易陷入局部极值和初值敏感等问题,利用粒子群算法来优化神经网络的权值和阈值,混沌算子用于初始化神经网络的权值和阈值,并通过混沌机制使粒子群跳出早熟。精确定位系统中图像处理的主要任务是求取图像中目标的位置。目标特征一般包括边缘特征和点特征两种,边缘特征的处理量较大,提出了基于点特征的匹配方法。首先利用自适应中值滤波器处理椒盐噪声,然后通过两级Zernike矩进行边缘的亚像素检测,接着采用曲率尺度空间的改进方法提取角点,最后由局部和全局匹配的方法完成目标的精确定位。字符和缺陷是常见的产品检测项目。在字符识别中,选用Zernike矩和骨架特征作为特征量,采用两层串级的识别方法,可保证识别效果和识别效率;在缺陷检测中,利用平均灰度灰度矢量完成粗匹配,再通过正交Fourier-Mellin矩进行细匹配,可兼顾检测的准确性和快速性。