面向增强现实的视觉交互与场景建模关键技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:maye626
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技和社会的发展,人们对现实世界的感知与交互有着越来越多的需求。增强现实技术能够把虚拟信息与现实环境实时地融合在一起并进行互动,增强了人对现实世界的感知和交互,进而提高了人们的工作效率和生活体验。研究增强现实相关技术方法,完善和提升增强现实系统的功能和体验,对于计算机视觉和增强现实应用而言,都有着重要的理论价值和实际意义。  对于增强现实系统,眼动跟踪和人体姿态估计是关键的无穿戴视觉交互技术,而深度重建是场景建模的重要手段。本文针对增强现实系统在视觉交互和场景建模方面所存在的一些局限性问题,从眼动跟踪、人体姿态估计、深度重建等关键技术出发,研究设计新的算法和解决方案,为实现灵敏、高效、鲁棒、易用的增强现实系统奠定技术基础。  眼动跟踪是增强现实系统中一种非常自然高效的视觉交互方式。当前的眼动跟踪方法有着一些局限性问题,如硬件方案复杂性、繁琐的定标、不理想的视线估计精度、不允许用户头部运动、效率达不到实时等,严重影响了眼动跟踪技术的可用性。针对上述问题,本文提出基于RGB-D相机的三维眼动跟踪方案,系统设置简单易行;提出基于三维模型的视线估计算法,容许用户头部自由移动并且提高视线估计精度;提出参数化的虹膜中心定位模型,取得理想的定位精度并对光照变化和遮挡具有较高的鲁棒性;针对用户定标程序繁琐的问题,提出在线定标方法,实现以尽量小的用户负担获得尽量好的用户参数。  三维人体姿态估计是增强现实系统中人体运动分析和人机交互的关键技术。本文针对图像描述中的模糊性和人体外观变化问题,提出将训练样本根据输入图像按局部运动在外观、姿态和时序上的相似性组织为motionlet,能比较好的抓住人体的局部动作相似性,加强图像表示的区分性和鲁棒性。通过局部线性编码和联合字典学习,将复杂高维非线性函数的学习转化为局部线性的平滑稀疏的编码和重建。通过集成多视角线索,提高方法的准确性和鲁棒性。  深度重建是增强现实中重要的场景建模手段。本文针对现实应用中不稳定的成像质量和非控制的环境条件问题,提出层次化的深度匹配算法框架,提高深度重建的效率和鲁棒性。通过结合局部损失聚合和全局损失优化,提升深度重建的精度;通过构建图像金字塔,由粗到精逐级进行重建,提高重建的效率;利用匹配置信度进行多视角的匹配线索融合,有效地降低了匹配歧义性,避免许多错误匹配。该算法框架着重提升现实应用中深度重建的效率和鲁棒性,同时保证重建精度满足应用需求。  针对本文提出的算法,进行了相应的实验评估和比较,并对部分算法开发了相应的演示应用程序。实验结果和应用展示效果表明,本文提出的算法有效地提升了现有方法的精度、效率和鲁棒性,同时改进了相关技术在增强现实应用中的可验。
其他文献
该文简介了人类视觉的机理,缩述了低层计算机视觉中边缘检测的基本理论和算法,介绍了经典的边缘检测算子.对数学形态学这种非线性数学工具在边缘检测中的应用作了进一步的探
激光扫描技术因其独特的技术优势逐渐成为岩石工程中获取岩体信息的主流方式。为了避免植被、建筑等非岩体物体对后续的模拟计算造成干扰,需要对获取的岩体点云进行滤波处理。
该文阐述了运用面向对象的方法设计开发"本地电信网综合网管监控2000系统"--LITMN2000(Local Integrated Telecommunications Management Network 2000)的方法.在系统的设计
21世纪计算机技术的发展所带来的影响深入到社会生活的各个领域,人们的工作和生活方式发生了深刻变化。在这样的背景下,世界范围内掀起了对学校教育改革的浪潮,教学手段的现代化
随着现实应用中数据量的增加,副本或者镜像与纠删码技术协作的分层冗余存储模式因具备高存储空间利用率,高可靠性,高性能等优势在分布式存储系统中被广泛应用。蓝鲸分布式SAN集
该文系统回顾了传统图象压缩编码技术及简单介绍了第二代图象编码技术,对现有静止图象压缩国际标准JPEG进行了剖析和改进.在分析小波变换理论撕础上,讨论了小波分析在静止图
高光谱成像技术是近几十年来成像领域的一场革命。高光谱图像由几十甚至几百个连续密集光谱窄波段组成,既包含了普通图像的空间信息,又包含了所拍摄物质的光谱信息,因此在农业、
近年来,随着Internet的飞速发展,网络安全已经成为人们日益关心的问题.该文就是研讨这个问题,全文分为三章:首先介绍了涉及到Internet网络安全方面的几个问题,包括病毒入侵和
时间序列是指一系列按照时间顺序排列的数据的集合。时间序列数据中蕴含着重要的价值,已广泛应用于各个领域。而现实世界中的事物往往是由多个维度共同刻画的,因此,研究多维时间
该课题从长沙电信局自动转报系统的现状出发,研究了目前电报网中存在的局限性.在此基础上,通过对网络技术、数据库技术,分组交换和网络拓扑设计等技术的研究,找到了解决原有