蒙古语连续多词单元的识别和标注

来源 :第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会 | 被引量 : 0次 | 上传用户：XHR

【摘要】

：

本文提出一种蒙古语连续多词单元(Consecutive Multi-WordUnits)的自动识别方法,用以辅助语言学工作者在蒙古语文本中对连续多词单元进行识别和标注。首先结合汉蒙词语对齐任

【作者】

：

雪艳那顺乌日图

【机构】

：

中央民族大学蒙古语言文学系 100081

【出处】

：

第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会

【发表日期】

：

2010年期

【关键词】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文提出一种蒙古语连续多词单元(Consecutive Multi-WordUnits)的自动识别方法,用以辅助语言学工作者在蒙古语文本中对连续多词单元进行识别和标注。首先结合汉蒙词语对齐任务,讨论对蒙古语多词单元进行识别和标注的必要性,界定本篇论文所要处理的蒙古语多词单元的范围,并对前人的相关研究进行简单评述；其次介绍基于同现频率的蒙古语连续多词单元的抽取算法以及根据蒙古语连续多词单元的语言学特征制作的两种过滤器;最后是实验结果和相关讨论。

其他文献

BIM技术在公路勘察设计中的实践分析

BIM信息模型实质是指根据工程相关信息数据为基础，建立模型，通过数字信息，对构造物全部真实信息进行仿真模拟。BIM模型运用于建设项目的勘察设计、监理、运营维护等各阶段的工作

期刊

BIM技术公路勘察设计应用

城市地下管线探测技术及RTK测量系统在其中的应用探讨

城市地下管线测量是城市基础建设信息系统建立的基础，地下管线测量的方法和技术也在不断进步和更新。本文就地下管线探测技术和方法及RTK测量系统在这方面的应用进行分析和探

期刊

地下管线探测测量技术RTK市政

蒙古语词法分析的生成式统计建模

我们为蒙古语词法分析建立了一种生成式的概率统计模型。该模型将蒙古语语句的词法分析结果描述为有向图结构,图中节点表示分析结果中的词干、词级及其相应标注,而边则表示节

会议

预应力混凝土小箱梁的施工技术与质量控制策略

交通工程行业是我国的支柱行业，对于很多地方的居民生产、生活条件改善，都会产生较大的影响，为了在日后的发展中取得更好的成绩，需要有效应用先进的技术手段，提高技术的可靠性、可

期刊

预应力混凝土小箱梁施工技术

浅谈机械液压系统的维修技术

对于生产来说，设备是必不可少的硬件，它的优劣与否直接影响着生产的效果，可以说，它统领着整个生产过程，是贯穿于生产线上的脉搏，决定生产的正常运营。但是该设备并不是不坏之身，在恶

期刊

矿山机械液压系统维修技术探讨

对土木工程建筑中混凝土结构的施工技术的研究

随着城市化进程的不断加快，使土木工程建筑随着建筑工程项目的增多也在不断的增加。在整个土木工程建筑中，混凝土材料占据着重要的地位，所以也受到了人们的广泛关注。因此，提高混

期刊

土木工程混凝土结构施工技术

简析CFG桩复合地基的技术应用

CFG桩即是水泥粉煤灰桩，它是由水泥、粉煤灰、碎石等混合料加水拌和而成的高粘结强度桩。通过在天然地基中设置一定比例的CFG桩体，并设置一定厚度的褥垫层，由桩、桩间土和褥垫层

期刊

CFG桩施工工艺技术

面向汉藏辅助翻译系统的平行语料库建设

本文首先在对目前自然语盲处理中计算机辅助翻译系统的思想和设计做了简要描述的基础上,提出了目前针对于汉藏双语的计算机辅助翻译系统中汉藏双语平行语料库的设计方案,以及

会议

辅助翻译系统双语平行语料库双语句子对齐语料库设计计算机关键问题设计方案盲处理编码格式自然统一思想描述交流基础存储藏语

电子词典软件系统中对维、哈、柯文进行自动判别的技术研究

本文以汉、维、哈、柯等具有多种书写方向的多文种电子词典软件系统开发为背景,首先指出了其中与语种相关的词语书写方向识别,词语的文种识别,提出了相应的解决方案:通过XML

会议

RTK定位技术在公路工程测量放线施工中的应用

本文首先对传统测量方法与RTK定位技术的优劣进行了分析，并提出了几条RTK在测量放线中的技术要点。

期刊

RTK公路施工测量放线

蒙古语连续多词单元的识别和标注

其他学术论文