人体运动捕获数据的稀疏建模方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:vpnyoyo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在稀疏表示理论日臻完善的背景下,信号的稀疏表示逐渐引起了越来越多的研究学者的关注,并且被广泛地应用在了各个领域中。与此同时,以三维电影和游戏为代表的数字媒体产业逐渐兴起,计算机动画技术有了很大的发展,成为学者们的研究热点。由于人体运动捕获数据有其独有的空间结构和时间结构,单纯地使用现有的稀疏表示理论模型很难对运动捕获数据进行分析处理,因此如何有效地使用稀疏表示理论对运动捕获的数据进行建模,并对人体运动捕获数据进行分析、处理,以取得更好的效果,是本文研究的主要目标。本文的研究工作主要涉及以下三个方面内容:(1)基于稀疏表示的半监督距离学习用于人体运动捕获数据的相似性度量。人体运动的检索技术是运动数据管理和重用过程中必需的环节。由于欧式距离难以度量两个运动间的逻辑相似性,为此本文提出了一种基于稀疏表示的半监督距离度量学习算法,利用带标记的运动进行训练来挖掘运动间的逻辑相关性,利用无标记的运动进行训练能够充分挖掘出运动间的潜在规律,用以学习得到运动间的马氏距离度量,从而判断两个运动的逻辑相似性来进行运动的检索。该方法能够获得较高的查询精度,且没有任何人工干预,可应用于自动检索。(2)基于多表示的联合稀疏模型用于人体运动的关键帧提取。当面对大量运动捕获数据时,数据的快速浏览不可或缺。本文将关键帧提取问题转化为稀疏字典选择问题,将多表示模型与联合稀疏表示模型相结合,用以进行关键帧提取。所提取的关键帧能够包含原始运动中的大部分信息,并且由于稀疏性的存在,所得关键帧个数少。同时由于运动数据是时序数据,引入三角约束,充分考虑到时序数据的局部相关性,提取的关键帧仅仅对其一定邻域范围内的其他帧表示起到作用,关键帧中所包含的信息更加准确。(3)基于结构稀疏主成分分析的人体运动合成。本文将结构性稀疏与主成分分析相结合,提出了一种自动获取低维可理解运动参数的结构性稀疏主成分分析模型,从而实时地生成符合用户需求的逼真运动。结构性稀疏语义参数化模型将各种独立结构的运动属性自然地提取出来,并关联到不同的低维运动参数上,并极大降低了运动合成的控制复杂度,同时不会损失合成运动的质量,只需简单地修改一下运动参数的数值,即可实时、直观地控制运动生成。
其他文献
针对智慧城市建设,本文结合LED照明技术、物联网技术和云平台技术,设计研发了基于物联网的城市道路智慧照明云管控系统,为城市道路照明节能化、舒适化、智慧化建设提供系统解决
随着社会的迅速发展,控制对象也日趋复杂化,传统的点到点控制已经无法满足日常的生产需要。与此同时,网络技术不断发展、成熟,并且与控制理论相融合形成了适合实际需求的网络控制
在文献综述的基础上,本文研究了在线学习及其在控制中的应用,离线学习及其在辨识中的应用。本文第二章集中于研究一类系统的学习控制,一种周期自适应控制算法被提出来,该方法
电力电子设备的核心技术是电力电子变换器,然而在实际运行时经常会出现一些不规则的奇异现象。20世纪80年代以来对于DC/DC变换器的这些貌似随机的现象才有了比较深入的研究,
激光、结构光和光栅式双目视觉测量已成为近两年常用的三维数字化采集设备。这种设备是利用计算机和摄像机以及辅助装置完成的视觉检测领域,目前,已经广泛的应用到了工业生产中
端元提取技术的发展对超光谱图像快速分析地面物体有着重要的作用。目前,比较流行的端元提取算法大多是基于PC平台的,其优点是易于实现,缺点是提取速度慢,实时性较差,不能满足快速识别地面物体的要求。为了克服以上不足,本设计采用FPGA来实现端元的自动提取。设计的主要工作如下:首先分析了超光谱图像数据的特点,归纳已有超光谱图像端元提取算法的优缺点。通过对比,在已有PPI算法的基础上加以改进,实现快速PPI
沙漠化是中国乃至世界最严重的环境问题之一,对沙漠的治理与维护越来越重要,研究意义深远。由于沙漠化成因复杂,沙漠的环境恶劣,对沙漠进行长期有效地监测相当困难,导致相关的数据
语音情感识别指的是通过计算机学习算法,自动由语音判断出说话人的情感状态,主要涉及到语音情感特征参数的提取和情感识别算法。语音情感的自动识别技术在教育、娱乐、医疗等领
亚低温是临床研究中证实的一种有效的脑保护治疗措施,许多有条件的医院都将亚低温治疗方法列为重型颅脑损伤患者的治疗措施之一。血管内热交换降温技术是近年来发展起来的一种
电子耳蜗是唯一能恢复全聋患者部分听觉感知的医学装置,其有效缩短了神经细胞再生或者基因治疗等技术治愈感音神经性耳聋的研发周期,主要采用电极脉冲刺激耳聋患者的残留听神经