蒙古语连续多词单元的识别和标注

来源 :第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会 | 被引量 : 0次 | 上传用户:XHR
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出一种蒙古语连续多词单元(Consecutive Multi-WordUnits)的自动识别方法,用以辅助语言学工作者在蒙古语文本中对连续多词单元进行识别和标注。首先结合汉蒙词语对齐任务,讨论对蒙古语多词单元进行识别和标注的必要性,界定本篇论文所要处理的蒙古语多词单元的范围,并对前人的相关研究进行简单评述;其次介绍基于同现频率的蒙古语连续多词单元的抽取算法以及根据蒙古语连续多词单元的语言学特征制作的两种过滤器;最后是实验结果和相关讨论。
其他文献
BIM信息模型实质是指根据工程相关信息数据为基础,建立模型,通过数字信息,对构造物全部真实信息进行仿真模拟。BIM模型运用于建设项目的勘察设计、监理、运营维护等各阶段的工作
城市地下管线测量是城市基础建设信息系统建立的基础,地下管线测量的方法和技术也在不断进步和更新。本文就地下管线探测技术和方法及RTK测量系统在这方面的应用进行分析和探
我们为蒙古语词法分析建立了一种生成式的概率统计模型。该模型将蒙古语语句的词法分析结果描述为有向图结构,图中节点表示分析结果中的词干、词级及其相应标注,而边则表示节
会议
交通工程行业是我国的支柱行业,对于很多地方的居民生产、生活条件改善,都会产生较大的影响,为了在日后的发展中取得更好的成绩,需要有效应用先进的技术手段,提高技术的可靠性、可
对于生产来说,设备是必不可少的硬件,它的优劣与否直接影响着生产的效果,可以说,它统领着整个生产过程,是贯穿于生产线上的脉搏,决定生产的正常运营。但是该设备并不是不坏之身,在恶
随着城市化进程的不断加快,使土木工程建筑随着建筑工程项目的增多也在不断的增加。在整个土木工程建筑中,混凝土材料占据着重要的地位,所以也受到了人们的广泛关注。因此,提高混
CFG桩即是水泥粉煤灰桩,它是由水泥、粉煤灰、碎石等混合料加水拌和而成的高粘结强度桩。通过在天然地基中设置一定比例的CFG桩体,并设置一定厚度的褥垫层,由桩、桩间土和褥垫层
本文首先在对目前自然语盲处理中计算机辅助翻译系统的思想和设计做了简要描述的基础上,提出了目前针对于汉藏双语的计算机辅助翻译系统中汉藏双语平行语料库的设计方案,以及
本文以汉、维、哈、柯等具有多种书写方向的多文种电子词典软件系统开发为背景,首先指出了其中与语种相关的词语书写方向识别,词语的文种识别,提出了相应的解决方案:通过XML
会议
本文首先对传统测量方法与RTK定位技术的优劣进行了分析,并提出了几条RTK在测量放线中的技术要点。