基于条件随机场的实体提及识别研究

来源 :北京信息科技大学 | 被引量 : 0次 | 上传用户:shying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机应用的普及和互联网的飞速发展带来了信息爆炸,大量信息以电子文档的形式出现在人们面前,人们迫切希望计算机能对出现的文本信息实现自动化处理。因此,需要有效地利用信息处理的工具。信息抽取是解决这一问题的有效途径。信息抽取的主要任务之一就是实体识别。   ACE评测首次提出了实体提及识别任务,目的在于识别指定类型实体的所有提及,包括命名性提及、名词性提及和代词性提及,并考虑它们在结构上的嵌套特性。实体提及识别任务同传统的命名实体识别有着密切的联系,但不仅仅局限于命名实体识别。因此,ACE评测的实体提及识别任务对实体识别提出了更高的要求,同时也在更大的程度上推动了实体识别和信息抽取技术的发展。   本文从理论和实际出发,针对中文实体提及的特点,利用条件随机场模型的特征融合的能力,提出了一种基于条件随机场模型针对中文文本中实体提及进行识别的方法。综合运用字词特征、前后缀特征、同义词特征、词典特征和语义特征提高系统的识别性能。与此同时,本文还提出了一种基于条件随机场模型针对英文设施名进行识别的方法。综合运用字词特征、词类特征等提高系统的识别性能。实验结果表明对于本文所提出方法对于中文实体提及识别和英文设施实体提及识别都具有一定的效果。
其他文献
校园网一卡通系统是通过建设规定的、安全的、可扩展的校园管理系统,实现校园管理信息化、智能化、自助化。该系统在校园内实现了货币电子化,让校内的现金交易的过程更加安全和
近年来,阅读器芯片可以集成在移动终端(如手机中),阅读器和后台数据库之间的通信安全不再属于传统的网络安全研究范畴,无法满足传统RFID认证协议的假设条件:阅读器与后台数据
智能建筑(Inteiligent Buildings)是建筑技术与计算机信息技术相结合的产物,是信息社会与经济国际化的需要。可以满足人们对高效、舒适、便捷、安全的工作和生活环境的需求。随
本体(Ontology)作为一种能在语义(Semantic)和知识(Knowledge)层次上描述信息系统的概念模型建模工具,已受到各方面的广泛关注,并在知识工程、数字图书馆、软件复用、信息检
本文研究了基于动力学模型的电力线路巡检飞行机器人(FROPI)运动规划方法。首先,研究了机器人运动规划模型,对FROPI的两个坐标系进行了定义,同时给出了两者的转换矩阵及FROPI
近年来,随着图像技术和计算机应用技术的不断更新发展,计算机图像技术在医学领域的应用也更加广泛。现如今医学图像处理技术已成为临床诊断中的重要手段,医学图像技术中最重