论文部分内容阅读
随着自然语言处理技术的发展,语音合成、语音识别、语音翻译、说话人识别也得到了快速的发展。而这些技术都离不开语音语料,它们都需要大规模、高质量的语音语料来进行训练和测试。要得到高质量的语料就需要对语料进行很好的管理,这就需要设计一个维吾尔语语音语料库管理平台。可以集录音、标注、管理为一体的语音语料平台,而且可以让研究维吾尔语相关技术的学者能够播放、查看、查询、统计相关的语音语料,以及对维吾尔语应用工具的下载。为解决维吾尔语语音语料库管理平台方面的设计空缺以及传统的应用软件C/S架构的问题,提出了一种基于在线的维吾尔语语音语料库管理平台。主要研究内容和成果如下:1、结合语音学、声学方面知识,对维吾尔语的音素、编码、音系结构、音节结构、韵律特征、协同发音做了研究。维吾尔语一共有32个音素,采用Unicode编码,得出了音系结构、音节结构、重音韵律、长度韵律、协同发音的规律。2、从发音人规范、数据采集规范、数据存储规范、语料筛选规范、语料标注规范、法律声明6个方面对语料库进行了规范。对发音文本进行了设计,包括文本的获取、文本归正、文种转换、语料筛选。对语音录制进行了设计,包括发音人的确定、语音采集。语音库的标注采用praat软件。其中对文本的获取采用了爬虫技术。3、通过Microsoft Visual Studio 2012开发工具、Asp.net web开发、C#语言、Microsoft SQL Server 2012数据库,以及GridView控件与SqlDataSource的数据绑定把语料显示在页面上、chart控件来显示统计对比分析图、config配置数据连接、audio控件来播放,这些技术来实现语音语料库管理平台的增加、删除、编辑、查询、播放、导出Excel表、查看、下载、上传、用户权限、统计分析等功能。该管理平台已应用到新疆多语种实验室。语音合成12000条语音语料,合成标注6000条。语音识别15000条语音语料,其中电话语音语料3000条、情感语音语料6000条、方言语音语料3000条、其它ASR语音语料3000条,识别标注3000条。4、共同实现了维吾尔语标注平台,主要功能有分配任务、单个上传任务、批量上传任务、留言管理、内容审核、维文和拉丁文转换、播放语音语料。主要技术采用JetBrains PhpStorm 10.0.1编辑器、XAMPP服务器软件、php语言、mysql数据库、CI框架。对密码进行了md5算法加密处理。该平台已应用到新疆多语种实验室,在线标注了18000条句子,其中60个人(30男30女),每人300条。5、共同实现了维吾尔语录音软件,主要功能有录音,音频文件查看、播放、重命名、删除、查询录音数量、查看帮助、任务下载。主要技术采用Eclipse开发软件、java语言、SQLite数据库、Android平台。该录音软件已应用到新疆多语种实验室,20个人(10男10女)都录音了陈述句105条,感叹句137条,问句100条。本文对维吾尔语语音语料库管理平台分别从功能、性能、页面、安全性进行了测试,其中在性能测试中使用了谷歌浏览器的开发者模式对访问平台的5个特征requests、transferred、Finish、DOMContentLoaded、Load进行了测试。与传统的C/S架构的语料库平台相比,此平台界面友好,功能齐全,语音语料的质量有了很大的提高。通过平台测试和运行结果表明,此平台效果更为显著。将收集到的语音识别语音语料在Kaldi上使用各种模型进行训练和测试,得到DNN模型的WER为8.24%,语音识别效果最好。