自动识别木刻版蒙古文文献研究

来源 :内蒙古大学 | 被引量 : 1次 | 上传用户:linjinlong19880927
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在这个全球化、科技信息蔓延的时代,把文字、语言跟计算机信息处理融为一体是保护、继承和发扬自己的语言文字,历史文化、精神财富、民族特色的明确要求之一。把这些财富转化为省体力省时间的电子文档形式,使得方便用于科研,便于公用,换句话说,把图文形式的蒙古语文献或原文通过形式转化的方式转换成数字文档是当代需求之一。由于这个需求,把木刻版文献转换成电子版,建立蒙古甘珠尔的电子库,创建使用软件,作为本次研究的主要工作。为了把蒙古木版甘珠尔直接从图文转换成电子文档,把首先需要处理的几个步骤通过北京蒙古甘珠尔的第一卷转换成科研拉丁文,同原文献的扫描图建立了语料库。此文献共有31排,396张,790篇文章。论文主要讲述了把甘珠尔文献依据OCR系统,建立图文转换文档形式软件的步骤和试用此软件的步骤与结果。论文的结构和内容如下:序言:主要介绍了选题依据,目的,相关研究,创新特点及研究意义。第一部:介绍了文字处理软件OCR的理论方法,创建步骤等。第二部:从信息的角度介绍了蒙古文OCR创建的基本要求,蒙古语文的基础结构原则及木刻版的概况。并提出了留存至今的版书的范围,还介绍了把甘珠尔文献的第一部分转换成拉丁文的方法。第三部:主要介绍了创建识别甘珠尔文献软件的具体步骤及未来发展方向和潜力。
其他文献
本文在分析经典 L aplacian算子作用原理的基础上对其进行改进 ,提出了一种新的边缘检测算法 .实验证明 ,该算法能有效地消除噪声、准确地检测图像中的目标边缘 ,且能较好地保持目标边缘的连通性
本文首先讨论了一种计费模块和主模块分离的计费系统IAS(Independence AccountingSystem)的设计.然后以网络流量模型为基础,对基于网络会话模型的该计费系统进行了深入讨论,重
以安徽科技学院为例,分析了"数学建模"课程教学中存在的主要问题,围绕信息与计算科学专业应用型人才培养目标,从教学观念、教学内容、教学方法和评价方式等方面提出了深化课程
<正>明朝李时珍写的划时代的中药学巨著《本草纲目》,对中国医学、养生学、营养学、甚至动物学、植物学都有客观的记录、精辟的分析与论述,四百多年了,这部书一版再版,长销不
篇章语言学框架内的篇章类型研究越来越受到当代社会学思潮的影响。Hartmann在篇章语言学的奠基之作中就强调,语言学要转向对具体语言现象的研究,要关注在社会交际中实际存在
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的通过对伤科黄油纱联合艾灸对压疮的临床疗效观察,探讨两者联合的有效性和安全性,为进一步临床研究提供依据。方法将符合压疮诊断的30例患者随机分为试验组和对照组,每组
目的探讨十二指肠胃反流性疾病的内镜表现、相关病因及与幽门螺杆菌的关系。方法选取2011年3月-2011年9月在我院消化内镜中心胃镜检查确诊的206例十二指肠胃反流性疾病患者的
在设计一个分布式多媒体系统时 ,具有挑战性的问题之一是如何在系统的不同层次为各模式设计合适的规格描述模型 ,并提供不同模型的变换方法和媒体的集成与同步策略 .在本文中 ,我们给出了几种多媒体对象的表示模型和变换算法 ,它们把高层的多媒体对象变换成可以用来支持多媒体对象展示和通信的实用模式 ,在该模式中能较好地保持多媒体对象的集成与同步特性 .
生长期高温高湿的气候条件,决定南方核桃栽培需要建立有别于北方的技术体系。界定了适应铁核桃栽培的区域为南方核桃产区;根据气候条件和铁核桃栽培现状,对南方核桃产区划分