依存句法分析统计模型及树库转化研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：spiderwolf

【摘要】

：

句法分析的任务是根据给定的语法,自动推导出句子的语法结构。句法分析性能的提高将对信息检索、信息抽取以及机器翻译等应用产生重要的推动作用。在句法分析的研究中,依存语

【作者】

：

李正华

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2008年期

【关键词】

：

依存句法分析统计模型确定性搜索算法树库转化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

句法分析的任务是根据给定的语法,自动推导出句子的语法结构。句法分析性能的提高将对信息检索、信息抽取以及机器翻译等应用产生重要的推动作用。在句法分析的研究中,依存语法以其形式简洁、易于标注、便于应用等优点,逐渐受到研究人员的重视。本文比较全面地研究了依存句法分析中的几项关键技术,包括统计模型、搜索算法、树库建设等。为了深入的理解各种模型、算法在实际中的应用效果,本文选择了三个具有代表性的方法,分别为马金山面向中文的依存分析算法,Nivre的基于转移的依存分析器MaltParser以及McDonald的基于图的依存分析器MSTParser,进行了深入的研究,并且通过实验进行比较。结果表明,MaltParser和MSTParser在中文上取得了不错的效果,但是马金山的算法在效率上占有优势,可以满足实际应用的需要。作者参加了CoNLL 2008依存分析和语义角色标注联合评测任务,取得了比较好的成绩。依存分析系统分为两个步骤。首先,本文基于MSTParser,经过仔细的特征选择和参数优化,建立了依存分析器。为了克服全局寻优的依存分析方法无法融合全局特征的缺点,本文使用了依存关系校正器对依存分析器的处理结果进行后处理。本文尝试使用基于规则与统计相结合的方法,将PennCT转化为HIT-IR-CDT的体系结构。本文将转化后的树库PennCDT加入到HIT-IR-CDT,训练并测试依存句法分析器。通过对实验结果仔细分析,本文认为这种基于规则与统计相结合的树库转化方法是有效的。但是由于PennCT和HIT-IR-CDT在标注体系上存在较大的差异,还需要继续深入研究。

其他文献

炉霍红星忆元戎——纪念朱德同志诞辰120周年

2006年夏天,我到四川省甘孜州炉霍县,沿着红军长征中朱德同志的足迹,缅怀他的丰功伟绩。1936年3月7日,红四方面军攻取炉霍县城(原老县城)。朱德和张国焘、红军总司令部、总政

期刊

朱德同志炉霍长征路上朱总司令苏维埃政府党史工作动员群众革命精神皮火筒藏族群众

江苏射阳:重大决策权转移

2003年9月,中共江苏省委组织部将射阳县确定为党代会常任制改革试点县。10月,县里重新登记核发了新的党代表证,并于年底召开了第二次党代表大会——射阳县党代会常任制下的第

期刊

党代会常任制江苏射阳中共江苏省委公推公选领导干部初步人选初始提名基层党组织任用制度县委书记

中国共产党山东省纪律检查委员会委员名单

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

纪律检查委员会邵明周玉华张志华何建平张兴华宋卫国孙海裴建华天祥

学校要认真做好《江泽民文选》学习工作

一、要充分认识学习《江泽民文选》的重大意义江泽民同志是党的第三代中央领导集体的核心,是“三个代表”重要思想的主要创立者。党的十六大把“三个代表”重要思想同马列主

期刊

江泽民文选党的指导思想主要创立者邓小平理论学习过程理论学习表率作用泸水政治理论课经常性教育

基于JIT的嵌入式JS引擎优化技术的研究

JavaScript在Web中得到了广泛应用,提高JavaScript程序的处理能力显得尤为紧迫,由此看来提高JS引擎的性能对JavaScript的发展将有重要意义。针对嵌入式平台多样性和硬件复杂

学位

JS引擎JIT嵌入式浏览器Trace Tree优化函数

面向公路网络的位置隐私保护技术的研究

随着第三代移动通信技术的快速发展,使一些包含信息量较大的基于位置服务(location-based services,LBS)通过无线网络提供给用户成为可能。基于位置服务给人们生活带来了极大

学位

位置隐私基于位置服务公路网络子图隐匿单行线

基于图和转移算法相结合的中文依存关系解析

句法分析是自然语言处理的重要任务之一,近年来得到广泛重视,在机器翻译、信息检索、自动文摘等领域有着直接的应用。依存关系解析是句法分析的一个重要方法,依存关系可以明

学位

中文依存关系解析最大生成树算法支持向量机Nivre算法

科学发展，新闻界需从自身做起——有关新闻界提案、议案的关注焦点与若干讨论

人大代表、政协委员们怎样看待新闻界的现状?看看有关新闻界的议案提案也许是个好办法。根据已公布的数据统计,五年来,十届人大代表共提出49条内容直接涉及新闻界的议案。其

期刊

政协委员议案提案数据统计媒体集团网络文化建设广告管理网络媒体发展低俗内容中国记协记者站

应用服务器中资源适配器统一框架的设计与实现

随着电信网络中通信量的激增,各种电信增值业务也获得了迅猛的发展,3G网络则为各种电信业务提供了更加宽广的舞台。而传统电信网络或智能网中的业务开发周期长,成本高,已经不

学位

3G下一代网络应用服务器资源适配器IO多媒体彩铃

对初中英语课堂“二·五游艺合作学习模式”的探究

合作学习是教学上的一次成功改革,学生在分工明确的基础上进行互助性学习,达到各自的目标.通过介绍合作学习的理论基础,就益阳市赫山万源学校开创的“二·五游艺合作学习模式

期刊

初中英语教学小组合作学习二·五游艺合作学习模式以学生为中心

依存句法分析统计模型及树库转化研究

其他学术论文