视觉语音合成技术在英语发音辅导中的应用探究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:shui__hen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球一体化进程的迅速推进;我国与世界各地之间的交流日益频繁,英语作为国际通用的工作语言越来越受到人们的重视。但是,由于多年只重视书面教学,和缺乏良好的口语学习环境,致使我国当前的英语口语教学收效甚微。虽然计算机技术在我国发展的如火如茶,但是我国的计算机辅助语言学习(CALL,Computer-Assisted Language Learning)却仍然停留在起步阶段。针对这一现状,笔者将视觉语音(Visual Speech)技术应用于英语初学者的语音教学。本文参考美国大力推广的Phonics教学法,开发了一个唇形—语音同步的英语发音辅导系统,希望从以下两方面帮助英语初学者学习语音:一是根据语音的双模态特性,视觉语音可以帮助用户更好的观察、模仿脸部发音动作,有助于用户理解、记忆语音;二是借助于视觉语音技术呈现的用户界面更加友好,人机交互更加和谐、自然,这样对于缓解英语初学者的压力,提高学习者的学习积极性有很大帮助。本文所做的工作主要有以下几点:(?)基础标准层面,对MPEG-4定义的“人脸对象”进行介绍并以该定义中人脸动画的参数(FAP)为基础开展后面的工作;(?)技术要素层面,对本文采用的Microsoft Speech SDK 5.1中的TTS引擎进行研究和实践;(?)系统架构层面,对本文提出的视觉语音合成系统(TTVS)的框架结构、进行介绍和分析;(?)具体算法层面,详细介绍实现视觉语音动画合成系统的步骤和算法等;(?)系统应用层面,将详细介绍“EP Tutor”系统的知识结构、各模块功能及其应用场景;(?)工作展望层面,将对EP Tutor系统进一步的发展做出展望。
其他文献
我国煤炭资源安全生产现状不佳,当突发井下安全事故时,现有井下定位系统不足以向救援者提供人员和设备的准确分布情况及运行轨迹,致使救援人员错失最佳救援时机。有鉴于此,有必要
为了满足未来战争的发展要求,加快军事现代化的进程,我军正在提高军用通信设备的普及程度。这种新型的低功耗数字接收机将装配到班一级。与通用接收机相比,它的特点是体积更小,重
多输入多输出(MIMO)技术能够在不增加系统带宽和发射功率的情况下,大幅度地提升系统容量,改善无线通信系统的性能,因此成为目前研究的热点。本文在已有的研究基础上,开展空域
为了改变目前艾滋病PA检测法中依靠人眼判断而造成的误判率高的问题,本文将图像处理应用于艾滋病PA检测方法上。为了更好的进行图像处理,首先利用图像滤波、直方图变换等图像
正交频分复用(OFDM)技术是一种多载波调制技术。他的基本原理是把高速数据流分散到多个正交的子载波上传输,从而使子载波上的符号速率大幅度降低,符号持续时间大大加长。由于他
智能交通系统是将先进的信息技术、数据通讯传输技术、电子控制技术及计算机处理技术等综合运用于整个交通运输管理体系,建立起一种实时、准确、高效的综合运输管理体系,最终使
为了应对消费电子领域日益增长的对超高清视频内容的需求,ITU以及ISO联合推出了HEVC编码标准。面对超高清视频大数据量的挑战,HEVC解码器能否成功实现实时处理性能,将影响到该标
目前,无线通信系统主要受时频选择性信道的多径传输和多普勒频移的影响。为了抵抗这两种影响,本文介绍并研究了基于OFDM并结合固定QAM和自适应QAM调制的系统,以及TFL-CDMA技术。
移动终端的设计是宽带数字无线综合接入通信网络研究中的重要一环。本文对移动终端功能结构和设计方法进行了深入的研究,给出了基于TI公司的OMAP5912平台的无线分组综合业务接