论文部分内容阅读
音译维吾尔人名的规范工作从来都是少数民族语言文字处理中的关键性工作,尤其是近年来,随着自然语言处理信息化程度的加深,音译维吾尔人名的规范工作不仅牵涉音译人名转写的是否规范,更关系到人名音译在信息处理环境中的准确性和效率。因此,本文在田野调查的基础上,运用社会语言学的方法,对搜集到的527个(拆分后的1046个)音译维吾尔族人名进行语言学方向的讨论,不仅可以实现信息处理技术中命名实体识别、机器翻译等对语言基础的借鉴、语料的充实,还可以实践信息处理社会化层面的准确和高效。本文的研究工作主要包括三部分:一是对音译维吾尔人名名缀的研究,二是对音译维吾尔人名音节的研究,三是对音译维吾尔人名间隔号" ·"的研究,具体研究结论如下:(1)分析了维吾尔语的词缀特征,提出了对音译人名"名缀"的界定,归纳了构成维吾尔人名的音节结构、举例指出当前音译维吾尔人名名缀转写的不规范现状与原因分析,并将维汉音节组合的结构特征进行了差异性区分,从侧面证明了音译维吾尔人名音节长度变长的必然趋势和信息处理规范的必要性。(2)构建了音译人名名缀规则库(包括:音译维吾尔人名前名缀规则库、后名缀规则库、男女名通用名缀规则库),做出了适用于维吾尔人名的音节切分原则、简化音译音节和个别辅音的相关办法等,都可以直接作用于人名信息处理的两重背景。(3)以问卷调查的形式,整合间隔号" ·"给信息处理和内地生存维吾尔族民众带来的相关困扰,以及人们对间隔号" ·"发展的应对态度,最终提出切实可行规范解决间隔号的几点建议,也具有将理论与生活实际联系起来的重要价值。语言科学是人文科学与自然科学的桥梁,本文以语言科学中的社会语言学研究为起点,以计算机语言学的信息处理为方向,以解决社会性的实际生活问题为目标,基本实现了与维吾尔族民众关系密切的音译维吾尔人名规范工作。可以说该工作的顺利推行不仅可以达成国家语言文字的规范目标,为音译维吾尔人名的信息处理提供现实依据和技术支撑,实现社会间冲突的有效解决,提升工作效率和节约资源成本,更可为民族间的交往提供更加经济的交流途径,增强相互的理解与沟通,最终实现人们对音译维吾尔人名的充分接纳和民族交往的融合性目的。