限定领域内汉英口语的统计翻译方法研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:mountaineer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译是自然语言处理的重要应用领域.口语翻译作为机器翻译的一个新兴分支,具有重要的理论意义和实用价值,正受到越来越多的关注.该文以基于统计的翻译方法为研究主线,提出和建立了一整套限定领域内汉英口语的统计翻译框架,并就其中的一些关键问题进行了研究,主要成果和创新点包括:1.建立了限定领域内汉英口语统计翻译的原型系统,并就统计机器翻译在汉英口语翻译中应用的可行性和主要不足进行了探讨.该文在对统计机器翻译理论深入分析的基础上,将经典的基于单词的统计翻译方法应用到汉英两种差别较大的语言之间.2.提出了双语语块的基本概念.该论文在对基于语块的处理方法进行深入分析的基础上,针对汉英口语的特点和机器翻译的需要,提出了双语相关的语块描述框架——双语语块,并从结构、句法和语义对整性等多角度对其进行定义.然后,论文深入研究了双语语块的识别和语料库加工等问题,先后提出基于规则的双语语块语料库加工策略和统计与规则相结合的双语语块自动识别方法,为建立基于双语语块的大规模口语语料库提供了可能.3.对基于单词的统计机器翻译进行改进,建立基于双语语块的口语统计翻译系统.该论文针对原有统计机器翻译的主要不足,将双语语块概念引入到统计翻译方法当中,建立了基于双语语块的汉英口语统计翻译框架,并将其与基于单词的系统进行了比较.4.提出了面向口语统计翻译的译文质量自动评价新方法.输出译文质量的自动评价对统计翻译方法的研究具有十分重要的意义.但现有的评价方法主要是针对书面语翻译,并没有考虑到口语翻译的特殊要求.因此,该论文提出了一种面向口语和统计翻译方法的新型的自动评价方法,通过定义信息段、标注权重和设计多种匹配策略等方法,使自动评价结果与人工打分更为接近,同时也提高了评价过程对不同译文的适应能力.
其他文献
人类的视觉系统在面对复杂场景时,可以轻易并且高效的从中检测和提取感兴趣信息,并优先将这些感兴趣信息输送给意识。在计算机视觉领域,研究自然场景图像的显著区域检测算法,
答疑作为现代远程教育中的一个环节已经越来越显示出它的重要性.答疑系统需要充分利用现代信息技术所提供的、具有全新沟通机制与丰富资源的学习环境,实现一种全新的学习方式
近一段时期,在图像分析和模式识别领域的发展使感情和会话时的脸部信号的自动识别成为可能。自动化后的人脸表情识别可以被应用到人机交互方面,从而最为一种新的方式和手段从而
随着通信网络技术的飞速发展,特别是Internet的不断普及,人们的消费观念和整个商务系统都发生了巨大的变化,人们更希望通过网络的便利性来进行网络采购和交易,从而导致了电子
在“客户为向导”的时代,企业实施客户关系管理可以持续与消费者建立良好的互动关系,其经营策略是“卖客户真正需要的产品”。然而,不同的客户其需求各不相同的,只有发掘客户的潜
该文介绍了基于微机通讯的数字式应变仪的研究与设计。针对微弱信号在硬件选择上和软件方面采用相应方法来提高精度和抗干扰能力。采用RS232串行方式与上位机之间通讯,并且控
远程实验作为远程控制的一种应用,是计算机网络和多媒体技术相结合的新一代实验技术。利用远程实验,广大实验者可突破传统实验在实验资源(实验设备、场地和时间等)和实验方法(
该论文在充分考虑电力企业未来发展需求的基础上,运用管理信息系统开发的一般理论和软件开发的基本方法,介绍基于客户机/服务器结构的电厂管理信息系统的整体设计方案,详述设备