论文部分内容阅读
人类对于外界感知的信息80%来自于视觉感知,由于视网膜色素变性以及老年黄斑变性所引发的视觉感受受损,会让人损失这一获取信息的途径。近年来对失明患者视觉功能的修复多集中于对于视觉假体的研究,这一研究主要是通过电刺激患者残存可用的视觉神经系统,使患者产生光幻视,从而产生视觉感受。人体动作识别是人类日常行为最重要的一部分,因此在视觉恢复中对于人体行为识别是非常重要的一部分,由于现今技术的局限性,植入人体的微电极个数是有限的,如何通过有限的电极个数为视觉假体植入者实现最大限度的视觉感受是当今的视觉假体研究热点。以合适的方法去提取人体显著行为信息,就能为患者以有限的电极数提供更多的视觉信息。本研究是通过提取人体骨骼点及其连线并将其像素化,旨在以低分辨率下能让患者的人体行为识别率得到较大提升。利用(部分亲和阈)Part Affinity Fields的人体姿态估计方法得到骨骼关键点位置及其连线信息,将得到的骨骼点及其连线进行无背景提取,得到骨架图像,并将其处理为16?16,24?24,32?32,48?48分辨率下的像素化视频图像,统计分析40名被试在不同分辨率下的识别准确率。实验统计结果表明,仿真假体视觉下,随着分辨率的增加,人体行为识别准确率增高;人体行为识别准确率在性别上以及有无仿真假体视觉经验上不具有显著性差异。将实验结果与FT(频率调整显着区域检测)算法、SR(剩余谱)显著图算法处理之后的图形进行对比。FT算法利用颜色特征的中央-周边算子来得到显著图,具有计算量小,在对目标边界的显著性提取效果也比较好。SR模型通过分析输入图像的对数谱,可以在空间域中获取输入图像的剩余谱,进而用快速的方法在空间域中构造相关的显著性图。模型在自然图像和艺术图像的测试结果表明该方法具有计算效率高且鲁棒性好的特点。将FT算法与剩余普模型进行显著图提取后像素化处理,并将处理之后的像素化图像与像素化处理之后的骨架图像进行对比,骨架提取之后的像素化图像在低分辨率的识别准确率具有显著优越性。