论文部分内容阅读
随着语音信号处理和自然语言处理技术的飞速发展,口语对话系统的研究已经进入了一个实验和应用的阶段.国内外开发了很多的测试系统,其中一部分已经投入了使用中,取得了比较喜人的成果.在这个开发和研究的过程中,也发现了一些目前急待解决的问题.该文对其中的三个关系非常密切的问题进行了研究:首先是目前开发和研究的口语对话系统大部分都是面向特定任务域的查询系统,一方面是系统有广泛的市场需求和应用前景,另一方面是比较复杂的开发过程,高额的开发成本.该文中从查询系统之间的可移植性问题出发,具体到对每个模块的移植开发进行了研究,并且实现了从颐和园导游域到火车信息查询域之间系统的移植.其次是如何来判断开发或者移植后系统的好坏?针对现在阻碍汉语人机对话系统研究和发展的一个重要因素是缺少一个用于口语对话系统评价的基本框架,使研究者能够以此为依据对开发的口语对话,人机交互的应用系统进行科学的评价,从而知道如何进一步改善和提高系统的性能.国内目前关于口语对话系统评测的工作开展的比较少,该文通过对国外的一些成熟的对话系统评测规范和代表性的评测项目进行细致的学习,同时结合火车查询和订票系统的具体情况,制定了一套评测方案.希望通过这样一次尝试,有助于今后这方面工作的继续.口语对话系统如果要面向应用,最为关键的是如何提高系统的语音识别率.现在语音识别效果不佳已经成为了口语对话系统研究和应用的一个最大的瓶颈,最迫切需要解决的问题.该文针对特定任务域的口语对话系统,分别通过语言模型自适应和文音相似度的方法,对于提高系统的识别效果进行了研究.其中利用语言模型自适应的方法分别对颐和园导游系统和火车查询和订票系统进行了测试,系统的识别性能得到了明显的改善;利用识别文本和正确文本之间的这种相似性,以及特定域的系统用户输入是有限集,采用文音相似度的方法的对于移植后的火车信息查询系统进行了测试,较直接利用识别引擎,系统的性能有了很大的提高.