基于语料库的自然语言句法分析技术研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:liu1208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文对于基于语料库的自然语言句法分析技术进行了深入的研究,主要的研究工作和成果如下:1.将最新的统计学习理论和机器学习算法SVM(支持向量机)应用于大规模的自然语言处理任务中.2.该文提出的标注算法精度明显高于隐马尔可夫模型(HMM)等常用的词性标注算法,可以达到97%以上的准确率.3.深入研究单词词义辨析的问题,提出一种高精度的自适应单词词义辨析算法,并在SENSEEVAL-2词义辨析系统公开竞赛提供的语料库中对该算法进行试验.4.对完全句法分析的子任务——浅层句法分析技术进行深入研究,在对语块的特点进行深入分析以后,该文提出了一种粗粒度的语块分析算法,并在CoNLL-2000语块分析系统测试提供的公开数据上对该方法进行测试.5.提出两种自然语言句法分析的模型,一种基于浅层句法分析技术,对输入语句进行逐层分析.另外一种方法利用概率化的支持向量机模型,将句法分析过程看作是一个分析动作的序列,并利用概率支持向量机模型寻找一个对给定句子的最优分析动作序列.6.创造性地将单词词义分析引入到句法分析当中,利用词义分析的结果对句法分析中难以处理的歧义问题进行排歧,显著地提高了句法分析算法的精度.而且单词词义分析方法本身也可以直接应用于信息检索等重要应用领域.
其他文献
随着计算机网络和Internet的发展,网络安全越来越受到人们的关注和重视。网络中存在着越来越多的非法攻击行为严重影响网络的性能并威胁着个人隐私的安全。入侵检测系统正是
随着后PC时代的到来,人们上网的获取信息手段不再单一,通过各类信息电器(IA)如机顶盒、交互式数字电视、iDVD等接入Internet实现对网络中各种资源的访问已经成为必然的趋势和潮
超声医学是声学、医学和电子工程技术相结合,用于研究超声对人体的作用和反作用规律,并加以利用以达到医学上诊断和治疗的科学.彩色超声诊断仪是利用超声成像原理,通过超声换
随着信息技术的飞速发展和网络技术的普及应用,网络信息安全的话题越来越为人们所关注.网络信息安全是一个系统化、层次化的概念,有效的安全策略或方案的制定,则是网络信息安
随着分布式计算环境的广泛应用,分布式并行数据库系统已成为信息处理中的重要一环,它消除了传统集中式数据库的许多缺点,适合于多种体系结构。分布式并行数据库是逻辑上属于同一
实时多数据库系统可以屏蔽现在已有的各数据库系统不同的访问方法和用户界面,给用户呈现一个访问多种数据库的公共接口,从而减少了各数据库系统之间的差异,并维护信息访问的