论文部分内容阅读
本文研究了汉语与手语(Sigh Language)这两种不同语言形式各自的特点,并结合语言学的知识加以说明。另外,本论文根据汉语到手语翻译的理论基础,探讨汉语与手语之间的对应关系以及实现形式,该研究成果可以方便人们学习和认识手语,并能够在手语的翻译领域得到广泛应用,促进人类对自然语言的认知和学习。从语言学的角度来说,汉语的“基本词”是汉字。中国手语也有基本词的概念,但是《中国手语》一书却是以词为单位进行描述,没有提及手语的构词法,为了挖掘手语词汇中手语的构词规则,本文通过DTW距离去衡量手语词汇和基本词的关系,并提出手语词汇编码的思想,将手语词汇表现成基本词的组合。在中文的信息处理方面,能否正确的分词是计算机能否理解语义的关键,而理解句子的语义是正确翻译句子的前提。所以在中文手语的翻译过程中,有必要对中文句子进行分词处理。目前常用的中文分词方法大致有三种:基于最大匹配的方法、基于大规模语料库的统计学方法和基于理解的方法。本文通过对这三种分词方法的研究,总结出各种方法的优缺点。为了充分发挥各种分词方法的优点,本文采用双层哈希字典并结合改进的正向匹配算法,对中文进行分词处理,同时判断句中是否存在交集型歧义,并采用全切分算法和统计学方法相结合的方法处理交集型歧义,对于句中是否存在组合型歧义,本文采用基于统计学的算法找出歧义字段,并依据DSM算法对组合型算法进行处理。本论文结合前人对手语和汉语的研究基础,对传统的中文处理方法进行总结、改进,并对手语的语言规律进行研究总结,实现汉语向手语的转换,实现了通过计算机进行汉语到手语翻译的功能,达到了软件设计说明书的要求。