面向虚拟教学的多模态意图理解模型与算法研究

来源 :济南大学 | 被引量 : 0次 | 上传用户:zw244942568
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
虚拟现实技术能带来强烈的沉浸感和真实感,它通过对算机的功能和设备的合理应用来模拟现实环境,使用户体验到在现实世界能被看到和不能被看到的事物。基于这种特性和教育领域的发展需求,虚拟现实技术在教育领域的推广成为必然趋势。在国家工业与信息化部发布的《关于加快推进虚拟现实产业发展的知道意见》中,明确提出了促进国家虚拟现实产业发展的多项目标,“VR+教育”是其重点推进的行业应用之一,这意味着在国家战略发展需求层面,在教育领域推广虚拟现实技术的应用也是重要的一环。这两者结合的新型教育方式概括为“虚拟教学”,虚拟教学表现出的便捷性、经济性、安全性与当前科学教育所存在的科学实验教学实施困难、实验材料短缺、潜在危险性等特点是互补的,这是推动虚拟教学不断发展和革新的主要动力。此外,丰富的用户信息能使系统更好地理解用户的意图,也使虚拟教学的交互方式更加自然和平易近人。例如,手势、语音和触觉等多模态的信息为更加丰富的虚拟交互行为和交互方法提供了可能。虚拟教学的发展不仅可以解决当前科学教育中的顽固问题,同时也能有利于激起学生对科学世界的探索积极性。本文以面向中学教育的虚拟实验教学系统为背景,以“理解用户的复杂意图,提高用户学习效果,学习体验”为最终目标。针对当前虚拟教学实验系统中,交互负荷高,呈现效果差,用户意图理解不到位等问题,提出了基于虚拟交互的多模态意图理解方法,建立基于虚拟现实的虚拟实验教学系统,并解决了当前虚拟交互中存在的一些交互缺陷。对本文的创新点归纳如下:(1)提出了针对虚拟教学的交互工具和方法;针对常见的凌空点击式交互手势,提出新的融合特征提高了指尖跟踪的实时性和稳定性。并分析了基于虚拟手的虚拟交互中用户交互的特点,提出了一种矫正算法用于解决虚拟交互中出现的用户视角下虚、实人手错位的问题。(2)提出了融合多模态信息的意图理解算法和导航式交互方法;针对虚拟交互下的复杂用户意图,利用多模态信息构建了意图理解模型,有效地帮助系统推测用户的当前操作意图,并在此基础上提出了智能导航算法,帮助用户高效、便捷的进行虚拟实验。(3)实现了虚实融合的智能实验设备;为了解决完全虚拟化的实验设备带来的认知错误、功能不清晰和意义不明等问题,利用微型硬件设备搭建用户与虚拟设备的交互通道,实现对真实实验设备的功能复现,从而帮助用户更好地理解实验设备的实际作用和意义。(4)提出了虚拟教学中的探究式实验交互模式;当前的虚拟教学大多实现的是标准化实验教学,即要求用户按照标准流程和步骤完成特定的实验,并未考虑实验本身存在的可调节因素和影响条件,限制了用户对实验的深度理解和对科学实验的探究积极性。提出的探究式交互模式结合实时的交互情况,为用户提供更充实的交互内容,扩展了用户的可操作空间和探究空间,不仅激发了用户的积极性,还保护了用户的求知欲。
其他文献
羊鼻山铁钨矿床处于中亚造山带东段的佳木斯地块中部,佳木斯隆起带桦南隆起上。羊鼻山铁钨矿床发现较早,是一典型的大型沉积变质型铁矿,中型钨矿。前人对其钨矿成因及构造背
辽西兴城台里韧性剪切带位于华北克拉通北缘东部。整体呈近北东南-西向展布,纵向延伸约6km,宽约12 km。对台里剪切带北段进行详细宏微观构造解析,结合岩石变形强度差异性分析
红麻脱胶已经成为生产工艺纤维的基本流程,同时也是红麻初加工的关键过程,红麻纤维的质量和品质的优劣主要取决于其脱胶效果的好坏[1-2]。但是,筛选到的菌株脱胶能力差,产酶
地下水作为环境的基本要素之一,是一种十分宝贵的资源,对地下水的研究关系到水资源的正确评价以及合理利用。地下水数值模型是刻画、表征和再现地下水系统的一种有效工具和常
随着科学与新技术的蓬勃发展,在人们工作生活的各个方面都可以看见人工智能的应用。人脸识别是人工智能研究的热点方向,其应用范围已覆盖安防、金融和移动智能硬件终端等领域
高炉渣作为钢铁生产中的重要副产物,排放温度极高,蕴含大量的余热资源,尚未得到妥善利用。目前水淬急冷是高炉渣处理的主要方式,但该技术浪费了大量的余热和水资源,对环境造
脑电图(Electroencephalogram,EEG)信号代表人类脑部的电活动。由于其准确度高、安全、无创、廉价,因此成为目前癫痫诊断的主流技术。但是癫痫脑电信号的分类研究中仍存在算
我国是世界上受自然灾害影响最大的国家之一,建国以来唐山大地震、长江特大洪水、汶川大地震、南方雪灾等使中国人民饱受自然灾害的摧残,多灾多难的中国必须要探求完善的防灾
在人工视觉的研究方向上,视觉假体作为研究的热点,对于视力恢复的发展及视觉通路的研究起到了重要作用,它为盲人的康复带来了福音。通过刺激存活的神经元,将信号传输至视觉中
近年来,基于单张单视角RGB图像的三维重建研究得到了广泛关注。由于基于RGB图像的深度神经网络获得了巨大成功,三维重建的质量也得到大幅提升。目前的深度学习模型大都是重建