论文部分内容阅读
手势的使用已经成为一种重要的人机交互(HCI)方式,它是一种自然而直观的人际交流模式。基于视觉的手势识别是实现新一代人机交互所不可缺少的一项关键技术,然而由于手势本身具有的多样性、多义性、以及时间和空间上的差异性等特点,加之人手是复杂变形体及视觉本身的不适定性,因此基于视觉的手势识别是一个极富挑战性的多学科交叉研究课题,它的研究涉及模式识别、图像处理、生理学,心理学、认知科学,与计算机人机感知交互领域都有密切联系。本文结合上海市自然科学基金资助课题“手势识别和合成算法”,从手势图像的预处理、手势特征提取和手势识别等三个方面研究了基于视觉的手势识别的识别算法。 在手势图像的预处理部分,本文首先对输入手势图像采用局部平均法进行平滑,然后对图像采用Laplacian算子进行锐化,最后对图像采用最大方差比法进行二值化处理。 在手势图像的特征提取和识别部分,本文首先采用八邻域搜索法对二值化的手势图像进行边缘检测,得到连通的手势外轮廓,然后尝试两种方法进行特征提取和识别:基于形状特征的特征提取和识别及基于傅立叶描述子的特征提取和识别。在基于形状特征的特征提取和识别中,本文首先根据手势图像中手指的方向及数目进行粗分类,然后在边界图像及二值图像中提取手势的周长、面积、重心距等形状特征向量,再进行基于类似度的模板匹配,实现对字母手势的细分类;在基于傅立叶描述子的特征提取和识别中,本文提出并分析了具有旋转、平移和尺度变换不变性,平且与边界的起点位置无关的傅立叶描述子,并把傅立叶描述子及欧式距离应用于字母手势的识别中,通过计算输入手势的归一化傅立叶描述子与样本库中各类图像的映射向量的欧式距离,判定输入图像与样本图像间的匹配程度,我们把待识输入图像归为距离最小的那一类。 实验结果表明,基于形状特征的粗分类能够排除完全不匹配的手势,减少识别过程中的匹配搜索时间,利用傅立叶描述子能够有效的识别出有旋转、平移及尺度变换后的同一类字母手势,其识别率可达到89.6%。