【摘 要】
:
复句是汉语语法重要的实体,它包含两个或两个以上的分句。其中,复句内分句之间的层次结构和逻辑语义比较复杂,要理解复句的语义,首先要弄清楚复句内分句的语义以及分句的层次关系。汉语复句层次关系的正确划分不仅对自动问答、机器翻译具有重要意义,也有利于推动篇章理解的发展。关系标记是复句中连接分句标明关系的词语。关系词非充盈态复句由于关系标记的部分缺省,不能显式标识出复句的层次结构和逻辑语义关系,使得关系词非
论文部分内容阅读
复句是汉语语法重要的实体,它包含两个或两个以上的分句。其中,复句内分句之间的层次结构和逻辑语义比较复杂,要理解复句的语义,首先要弄清楚复句内分句的语义以及分句的层次关系。汉语复句层次关系的正确划分不仅对自动问答、机器翻译具有重要意义,也有利于推动篇章理解的发展。关系标记是复句中连接分句标明关系的词语。关系词非充盈态复句由于关系标记的部分缺省,不能显式标识出复句的层次结构和逻辑语义关系,使得关系词非充盈态复句的层次关系很难识别。本文以三句式关系词非充盈态复句为研究对象,采用深度学习的方法自动判别关系词非充盈态复句的层次归属。所做的工作如下:首先,本文利用标点符号和依存句法对复句内分句先进行初步划分,然后利用构建规则库对伪分句进行过滤,实现对复句内分句进行准确划分。其次,对复句内分句进行了三方面的特征提取:第一,构建分句的句法分析树,用深度优先算法遍历句法分析树,提取分句的句法成分,并计算得出分句间的句法相似度。第二,提取分句的核心论元,从训练的词向量模型中提取核心论元的词向量,计算得出分句间的语义相似度。第三,设计了主语提取器,首先提取分句的主语,然后判断分句之间的主语是否一致,计算得出分句之间的主语相似度。再次,构建关系词非充盈态复句层次划分模型。本文根据提取的特征数据训练关系词非充盈态复句层次划分模型。通过对特征数据集的分析发现,复句层次关系的划分与分句之间的语义相似度联系紧密。所以,本文在训练复句层次划分模型的过程中提高了语义相似度的权重,从而进一步提高了关系词非充盈态复句层次划分模型的准确率。最后,对本文提出的方法进行验证。本文从CCCS语料库中挑选10000条复句对关系词非充盈态复句层次划分模型进行测试,准确率为73%。同时,选取了随机森林、支持向量机与神经网络作对比,在相同的训练集和测试集中,三个模型分别从精度、查全率、查准率、Roc曲线、Auc几个方面进行评估,发现基于神经网络的关系词非充盈态复句层次划分模型取得了更优的效果,从而证明了本方法的有效性。
其他文献
在有限责任公司股权的对外转让中,基于维护公司的人合性的需要,设立了股东优先购买权制度。与此同时,也应当注重维护股东股权转让的意思自治,且应当保证各方当事人的利益实现平衡。关于股权出让股东在其他股东主张行使优先购买权后,能否反悔并放弃转让股权的问题,在理论界和司法实践中一直存在争议。直到《最高人民法院关于适用<中华人民共和国公司法>若干问题的规定(四)》第20条明确规定,出让股东在其他股东主张优先购
高校肩负着培养社会主义事业建设者和接班人的重任,高校基层党组织是党在高校教学、科研、管理的第一线战斗堡垒,在高校党的组织架构中处于承上启下的关键位置,是落实这一战略重任的组织保证。当前,高校基层党建工作水平不断提升,但面对全面从严治党对高校提出的新任务新要求,还不同程度地存在一些问题。开展政治巡察,是高校加强党的领导,推动全面从严治党向基层延伸的重要制度安排,通过巡察着力发现并推动解决基层党建存在
20世纪90年代以来,我国的美术馆事业进入了一个前所未有的快速发展时期,许多经济较发达地区掀起了一股美术馆建立热潮。除公立美术馆外,各类民营美术馆也纷纷涌现,成为了新时期以来一个奇特的文化现象,也被看作是新的公民活动中心。其中,与藏品相关的问题在民营美术馆的发展过程中被越来越多的人提及,在明确其身份定位和规划后,高度重视藏品建设,正确认识到藏品价值理论,解决藏品匮乏的现状,对发展藏品建设具有重要的
目的:探索miR-138在胃癌细胞迁移、侵袭中的作用及其潜在的分子机制。方法:(1)将miR-138mimics和miR-138inhibitor转染HGC27细胞系,检测miR-138对胃癌细胞迁移及侵袭的影响。(2)qRT-PCR、western blotting实验验证miR-138对靶基因RhoC的具体调控作用。(3)利用si RNA沉默HGC27细胞系中RhoC基因表达,采用qRT-PC
电子病历作为医疗信息化的核心内容,包含了医生诊治患者过程中全部的原始数据,对医生的临床经验积累、治疗参考、疾病交流等方面具有重要的意义。相似电子病历对医生的临床诊断和疾病研究具有尤为重要的作用,因此本文主要围绕相似电子病历的搜索展开。现有的医院管理系统的搜索主要是基于关键字匹配方法实现的,难以找到符合医生预期的相似电子病历而且存在较大的隐私泄漏的隐患。本文提出了一种全新的基于文本匹配技术的相似病历
高校创新创业教育资源的科学配置是立足于教育的全局性,以促进教育公平、提升教育质量和素养为目标而使用的教育管理手段,通过创新创业教育资源的有效利用可以加快实现创新创业教育和谐发展,培养更多兼具知识、素质、能力的复合型人才。2015年国务院下发了《关于深化高等学校创新创业教育改革的实施意见》,2021年相继出台了《国务院办公厅关于进一步支持大学生创新创业的指导意见》,黑龙江省高校紧随国家政策导向,积极
20世纪90年代以来,上市门槛较低、市场机制较完善的美国资本市场吸引了一大批中国企业走上了赴美上市的道路。但是自2010年起,做空机构开始质疑中概股信息披露的真实性并对其发起做空攻击,中概股一度陷入了信任危机。严重的信任危机导致中概股股价低迷、交易量萎缩。2020年瑞幸咖啡的财务舞弊事件和中美贸易战的持续升级也将中概股推上了“风口浪尖”,中概股的生存空间被进一步压缩,越来越多的中概股企业走上了私有
当前国际国内形势变化复杂,网络话语空间面临西方意识形态渗透、多元社会思潮博弈、网络舆论“资本—技术—官方—民间”多方角力等现状,这影响着我国网民的思维方式、行为习惯和价值观念,挤压着我国网络思想政治教育话语空间并消解着其主导地位。如何实现网络思想政治教育话语空间实践的优化转型,增强网络思想政治教育话语空间中的育人实效性,在多重话语空间博弈中掌握话语权,成为一项迫切的现实课题。本文将从网络社会这一语
纪检监察派驻监督在健全监督体系方面承担了十分重要角色并伴随者我国各级不断推动的纪检监察派驻监督改革取得了一系列硕果。但是,人、财、物等资源配置和制度机制建设的短板限制使得县级层面纪检监察派驻监督在发挥其监督职能作用方面受到一定程度的制约。县级层面还可以通过进一步地深入改革创新来激活派驻监督职能。研究县级纪检监察派驻监督职能,找准实际问题,分析影响监督效果的相关因素,提炼出客观规律的经验,是强化监督
种群生态学是研究种群数量动态与环境相互作用关系的科学,它起源于人口统计学,应用昆虫学和水产学. Lotka-Volterra (1925,1926)的模型理论是理论生态学的一个里程碑,生态学并由此进入了黄金时代.20世纪上半叶它由一门以描述为主的学科发展成为一门试验性的,定量的理论性的学科.1957年冷泉港(Leng Quan harbor)的国际会议有关种群调节理论的讨论,标志着种群生态学已成为