【摘 要】
:
翻译系统采用基于统计和使用语义交集的方法,充分利用各种统计的方法和语义的方法所得到的信息来完成WORDNET节点翻译. 电子词典是机器翻译的基本模块之一.通过把通常的电子
论文部分内容阅读
翻译系统采用基于统计和使用语义交集的方法,充分利用各种统计的方法和语义的方法所得到的信息来完成WORDNET节点翻译. 电子词典是机器翻译的基本模块之一.通过把通常的电子版词典进行加工,从中抽取单词等来收集语料,获取各种单词信息,来建立适合我们需要的基本词库.在此过程中,把单词从词典中保存到HTML格式的文档中;再把HTML文档进行加工,提取所需要的单词、解释、汉语词义等信息,建立专有的XML类,保留到XML格式的文档中;然后,对XML类进行分析、加工;把信息插入到SQL数据库中.采用少量的纠正规则对数据表进行纠错处理.词义的选择直接影响翻译的质量,该文主要采用基于统计的方法来进行词义消歧;并采用基于语义匹配的方法来辅助进行词义消歧,结合两者的优点.利用各种统计方法所提供的丰富的词汇信息,将自然语言理解技术应用于英汉翻译,使定性方法和定量方法统一起来,完成词义消歧数据构造和消歧算法.
其他文献
随着计算机网络规模日益庞大及复杂性和异构性不断增加,如何实施完整而有效的网络管理已成为一个备受关注的问题。本文主要对计费管理、安全管理技术及基于Web的网络管理模式
随着采用多处理机的方法日渐成为提高系统性能的主流方法,分布式共享存储系统技术也变得倍受注目。它结合了分布式存储的可扩展性和共享存储系统的编程简单的优点,为物理分布在
数据挖掘技术发展趋势的多样化,使我们更加清楚的认识到数据挖掘技术的灵活性。随着信息时代的发展,目前技术将被广泛的融合,数据挖掘技术也不例外。本文将传统的图象处理工作与
XML是W3C协会于1998年提出的一个基于文本的可扩充的标识语言规范.它是SGML的一个简化子集,目前正在迅速成为网络数据交换的标准.XML的出现,可以说给基于Internet的应用带来
今天的社会是信息化的社会,它的一个重要特征就是企业和个人依赖网络来进行通信和交换信息。随着互联网的发展,人们日益趋向于使用数字化方法来处理和保存信息。由于互联网每时
煤矿井下安全生产问题已经成为我国亟待解决的问题之一,而其中煤矿瓦斯灾害作为“头号杀手”威胁着我国的煤矿安全。因此,保证预警的有效性与准确性,在如今井下安全生产过程
该文设计了一种TCP发送端与网络节点利用包含TCP流的IP报文和ICMP报文进行通信的新机制.在有线/无线混合网络中,通过这种机制,TCP发送端可以请求无线网络节点报告TCP报文在无
嵌入式设备广泛应用在人们的日常工作、生活中。随着信息共享程度的增加以及嵌入式计算、网络通讯技术的成熟,让嵌入式设备接入Internet并与传统应用进行功能整合逐渐成为可能
该课题主要致力于数据仓库实视图维护算法及其应用的研究,主要的研究工作和创新成果可概括为以下几个方面.第一,提出了基于Agent和基库的三层数据仓库体系结构.该课题针对传
移动代理是一种新的分布式计算模式,安全是其必须解决的重要问题。本文针对基于Java移动代理系统的主机安全问题,提出一种解决方案。该解决方案从保护主机和保证移动代理合法性