论文部分内容阅读
机器翻译是探索如何借助计算机程序将文字或语音从一种自然语言翻译成另外一种自然语言的技术。早期是从自然语言学的角度研究机器翻译,产生了基于规则的机器翻译系统。上世纪80年代末以来,针对传统机器翻译的不足在基于规则的技术中引入了语料库方法。与翻译有关的语料库有三类:平行语料库、多语语料库和可比语料库。基于语料库的机器翻译主要包括基于统计的方法和基于实例的方法。前者强调从数学上建立统计模型,后者主要是从机器学习的角度通过翻译实例进行推理。基于语义的方法将会成为统计机器翻译未来发展的趋势;而融合各种学科理论和技术的最新成果,进一步建立和发展多模态语料库,则是开发基于语料库的机器翻译系统的发展前景。