面向信息处理的蒙古语词根研究

来源 :西北民族大学 | 被引量 : 0次 | 上传用户:daocaoren666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文运用语料库语言学方法和统计方法对蒙古语词根进行系统统计研究,从而分析蒙古语的词根音节、构词能力、语法功能,将蒙古语词根的研究从面向人的研究转化为面向人和机器所需要的研究。论文以《新蒙汉词典》里的七万余词条为主要语料库,《蒙古语正音正字词典》为辅助语料库的基础上完成。语料库中最终取了 55114个单词对其进行了录入,切分、标注、归类等一系列细化工作。在阐述词根、词干和词缀关系基础上统计并分析所切分的词根,把词根分成1-4音节,通过数据统计,分析哪一词性哪一音节词根数目及构词数目。根据统计和分析,本研究主要得到以下结论:1.蒙古语词根主要分1-4音节,其中2音节词根和3音节词根占据83.66%,而且构词能力远超1音节词根和4音节词根。2.以词根的词性分类统计,名词词根占总词根数52.7%,构词比例占总词数库27.88%;动词词根占总词根数16.6%,构词比例占总词数库13.9%;形容词词根占总词根数23.650%,构词比例占总词数库19.130%。从而可以得出结论:词根类型名词最多、形容词次之、动词最少。从构词能力上看,名词词根构词能力最强、形容词次之而动词最弱,整体上看,蒙古语是名词类词根为主导的语言。3.除了蒙古语词根追加词缀构词外,蒙古语词根也可通过词根合成法、粘着法和复合词根等方式和形式丰富着词汇。
其他文献
目的:为了控制腰痛片的质量,建立薄层色谱一标多测方法,鉴别腰痛片中的7味药材。方法:采用薄层色谱方法,鉴别处方中7味药材;一个色谱系统同时鉴别当归、补骨脂、乳香、肉桂4
本文从“和谐管理—顺应研究路向”的语用学视角对人际交际过程中的修正现象进行了研究。本研究的理论视角来源于两个方面,一个是SpencerOatey提出的和谐管理理论,另一个是Ve
农民专业合作社是现阶段我国农业现代化的重要载体,其功能的发挥将直接影响到我国乡村振兴战略的顺利实施。通过对相关研究文献的梳理,发现:一是目前学界关于农民专业合作社
阐述了气相色谱仪与红外光谱仪联用分析挥发性复杂混合物所涉及的主要技术,着重阐述了接口部分的设计,如光管的体积与色谱条件的匹配、传输线的设计与安装、最优的光学设计以及
目的观察体位调整法联合温针灸治疗椎间盘源性下腰痛(DLBP)的临床疗效。方法将90例DLBP患者随机分为观察组和对照组,每组45例。对照组采用体位调整法治疗,观察组加用温针灸治
目的探讨慢性非特异性腰痛(Chronic nonspecific low back pain,CNLBP)患者腰部本体感觉变化及其与肌力的关系,为其临床康复治疗提供指导。方法选择2014-12-2016-12我院收治
自改革开放以来我国推行的国有企业改革,使国企管理层拥有了较大的经营自主权,而民企大股东出任经理人的现象也使得管理层拥有对公司的超强控制权,为其利用权力寻租提供了便
布隆迪大学孔子学院是由国家汉办发起,布隆迪大学和渤海大学共建的一所孔子学院,也是布隆迪开设的第一所孔子学院。在布隆迪大学孔子学院的汉语课堂教学中,综合课居于核心地
目的:观察补中益肾汤对肾病大鼠模型低蛋白血症的疗效和安全性。方法:40只SD大鼠随机分为5组:正常对照组(A组)、模型对照组(B组)、白蛋白组(C组)、补中益肾汤组(D组)和联合治
丁香是木樨科丁香属(Syringa L.)植物的泛称.大多为灌木或小乔木。本属植物约有30余种。主要分布于我国北方和西南地区。丁香的花期大都集中在春末夏初.个别种类有在秋季二次开花