一种软/硬模板相结合的定义抽取算法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:pplhome
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
术语定义抽取是信息抽取研究领域的重要内容之一。文中提出了一种结合硬模板匹配和软模板匹配技术的综合术语定义自动抽取方法。文中首先使用硬模板库对待抽取文本进行了初步的定义句匹配抽取。接着,通过使用基于N元语言模型的软模板匹配模型来计算待匹配文本中每个句子与软模板之间的匹配度,并通过设定匹配得分阈值来抽取定义句或过滤掉错误召回的非定义句。实验结果表明文中的术语定义抽取方法远远优于单纯的硬模板匹配或软模板匹配方法。
其他文献
德育课程是基础教育的重要组成部分,不仅能达到其他课程的教学目标,还能全面推进素质教育。创新德育工作形式,丰富德育工作的内容,在活动中不断提高德育课程的吸引力和感染力,减轻学校德育活动的功利色彩和空洞的说教,才能更好地服务学生全面成长,增强德育课程对高中生的吸引力和凝聚力。本文以武昌区水果湖高中团委近年来组织的特色德育活动为例,浅谈如何潜移默化地把爱国主义融入高中德育课程,开发出具有特色的德育课程。
车牌识别系统是智能交通的重要组成部分,在日益凸显的道路交通问题上发挥着举足轻重的作用。车牌的倾斜校正是字符分割和字符识别正确与否的一个重要因素。旋转投影变换法能够很好地解决车牌倾斜的问题,但是对一个特定范围内的所有角度进行此变换,增加了计算所需要的时间。为了降低算法所需要的时间,文中结合旋转投影变换法,在此基础上根据旋转后投影的直方图必有一个峰值的特点,提出了变步长的旋转投影变换方法。仿真表明,在
基于HBase的本体复用方法,是通过统计概念间关系在不同本体出现的频度来产生其可信度,最后形成带有统计信息和领域信息的大型概念空间。利用当前流行的开源云存储技术HBase表
小学阶段是学生进行英语学习的重要阶段,在这个阶段受到良好的英语教育有助于培养小学生的英语表达能力、英语应用能力等,小学英语教师应当积极地提升对于该学科课堂教学的重视力度,积极探索和改进小学英语课堂教学中存在的一些不足之处,激发小学生在课堂的学习兴趣,唤醒学生在课堂的求知欲望,不断让英语课堂变得多姿多彩、趣味十足,为小学生更为积极高效地开展英语学习创造十分良好的环境氛围。  一、小学英语课堂教学基本
目的探讨侧脑室-腹腔分流术在脑积水患者的临床治疗中的应用效果。方法使用侧脑室-腹腔分流术治疗过的脑积水患者36例,对其治疗效果进行回顾性分析。结果术后随访36例,随访时
脱机印刷体彝文文字识别系统包括字符分割、特征提取、特征压缩以及字典匹配四个主要模块,该系统利用总结出的彝文字符合并和反合并规则提高了字符分割准确率,采用1024维周边方向贡献度作为彝文字符统计特征,对彝文中存在的大量相似字符具有良好的区分能力。系统还采用基于KL变换的特征压缩算法和三级字典快速匹配算法,最终实现了一个基于Windows平台的脱机印刷体彝文识别平台,该平台对样本的一次识别率在99.4