【摘 要】
:
在当前的基于统计的翻译方法中,双语语料库的规模、词对齐的准确率对于翻译系统的性能有很大的影响。虽然大规模语料库可以改善词语对齐的准确度,提高系统的性能,但同时会以增加
论文部分内容阅读
在当前的基于统计的翻译方法中,双语语料库的规模、词对齐的准确率对于翻译系统的性能有很大的影响。虽然大规模语料库可以改善词语对齐的准确度,提高系统的性能,但同时会以增加系统的负载为代价,因此目前对于统计机器翻译方法的研究不只局限在使用大规模语料库的基础上,同时会寻求其它可以提高系统性能的方法。
针对以上问题,本文提出一种方法:在基于短语的统计机器翻译系统中应用双语词典。即根据对数线性模型(Log—Linear)的思想将双语词典作为统计机器翻译系统的一个特征融合在系统中,利用双语词典对Giza++双向训练所得的词语对齐结果进行优化,能够在双语语料库有限的情况下提高词语对齐的准确度;而且可以利用双语词典优化翻译结果,对未登录词进行处理,可在一定程度上解决数据稀疏问题。为现在主流的基于短语的统计机器翻译提供帮助,同时推进现有语言学资源在统计翻译中的应用。
其他文献
在抄表系统中,嵌入式系统的引入及其应用己经成了一个新的发展热点问题。而嵌入式操作系统的应用是近年来嵌入式系统向高端发展的趋势。嵌入式操作系统负责嵌入式系统的全部
目前逆向工程已经成为实现产品再创新开发及快速制造的重要技术之一,其在汽车、家电、模具、娱乐和医疗等行业具有广阔的应用前景。作为逆向工程中数据模型的一种重要的表现
近年来,随着DHT(分布式哈希表)的发明,各种大规模高容错的分布式系统在实际应用中变得十分普遍。基于DHT的各种应用需求也随之应运而生,例如一些基于DHT的数据库系统就具有复
并行系统的安全性随着其流行程度的增加,显得日益重要。以往在这方面大多数研究的重点是,在并行机制的实现(OS,线程库)已经安全的假定下,如何保证并行程序本身的安全性。对于
随着数字多媒体技术以及因特网技术的飞速发展,多媒体产品的安全问题成为目前一个相当重要而又富有挑战性的研究课题。数字水印技术是实现数字产品版权保护的一种有效方法,目
隐蔽信道是互联网安全的巨大威胁之一。在学术上,对于隐蔽信道的研究分为构造和检测两个方向。构造方作为检测方的对立面希望通过研究隐蔽信道的特性以促进和丰富检测手段。
随着计算机技术的发展和普及,各行业的管理手段从人工逐步转变成自动或半自动方式。本文探讨对ICU监控屏幕字符图像进行实时采集、识别、记录相关信息的技术,以提高工作效率,
目标跟踪做为数据融合问题的一个典型应用,受到了学术界的广泛关注。它的主要目的是确定监测区域内目标的位置、个数、速度等。随着无线传感器网络的发展,基于无线传感器网络的
本论文的主要工作是在研究了基于ARM9体系结构的Samsung S3C2410处理器的基础上,并以该处理器为核心,加上外部存储器和音频编码解码芯片等器件,完成了一个嵌入式音频系统的硬
在无线网络中,系统资源的总量总是要小于对其的需求量,资源共享是不可避免的。有共享就有分配,如何使用无线资源管理的各种方法对复杂的无线物理信道、网络资源进行合理配置,完善