面向机器翻译的日语形态素解析

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:lomina
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
日语形态素解析是日文信息处理特有的研究课题,也是日文信息处理研究的基础。它在拼音输入、语音识别、文章校对、信息检索、文本分类、机器翻译等领域有着广泛的应用。 本文首先根据日中机器翻译的特点,构建了日语词典:然后,充分挖掘了日语源语言的特点,根据日语的语法知识,把活用匹配、接续检查、预切分处理过程同最长次长匹配法结合到一起,实现了日语形态素解析模型。另外,考虑到未登录词对最长次长模型的影响,本文对姓名、机构名、片假名、平假名、英文等未登录词进行了识别,并在最长次长匹配法模型中引入了再执行机制处理未登录词。 通过对实际语料的测试,该系统的封闭式精确率达到99%,开放式精确率达到97.6%。从测试结果可以看出,该形态素解析系统已经具有比较高的形态素解析精确率。目前,该系统已经应用到实际的日中翻译系统中。
其他文献
现今在信息时代,人们在网络世界里想要摆脱线缆的束缚,于是出现了无线通信网络。而近几年无线局域网(Wireless Local Area Network,WLAN)正发展成为热点。无线局域网可以让笔记
随着电信网络和Internet的不断融合,电信业务的发展面临着智能化、多样化和个性化的要求.业务独立于网络接入、业务同承载和控制分离以及不同种类网络业务的融合成为电信业务
中国近年来开始加速发展集成电路产业,通过采用EDA技术,可以将电子产品从电路设计、性能分析到设计出集成电路版图或印刷电路板版图的整个过程在计算机上自动处理完成,是发展
近十年来,网格成为计算机研究领域的热点.世界各国为首纷纷不惜出重金开展网格技术的研究.在美国,以Ian Foster领衔的Argonne国家实验室走在了网格研究的最前沿.而IBM、Sun等
BGS+系统(批量工艺卡系统补充开发系统)是对原来运行在主机系统上的工艺卡管理系统的改造。它采取B/S模式,运用J2EE技术为工艺卡数据的管理构建了一个网络信息平台。本文详细介
工作流技术是实现企业业务流程管理自动化的一项重要的计算机技术。然而,随着Internet上电子商务的飞速发展,传统工作流管理系统越来越不能适应现代企业业务流程管理的要求,主要
随着计算机网络技术的高速发展,昂贵而特制的并行超级计算机向工作站网络转换的趋势越来越强.为了将地理上分布、异构、自治的各种工作站、PC机和专用设备通过网络连接起来实
日地空间物理是以科学数据为核心的学科,该学科的科学发现与预报保障等业务均依赖于对科学数据的处理、共享与计算分析。除了具有海量、多源、异构的大数据特征外,日地空间物
随着软件规模变得越来越大,低生产率、低质量和高费用是现今软件开发急需解决的重要问题。软件复用是缓和这些问题的最有效的方法之一。特别是随着面向对象技术的出现,为软件复