基于多信息集成的实体关系抽取

来源 :南京大学 | 被引量 : 0次 | 上传用户:a471839794
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体关系抽取是信息抽取领域的一个非常重要的子领域。实体关系抽取任务主要是利用计算机自动抽取命名实体之间的关系。通常,实体关系抽取问题可转化为分类问题,首先列出一个句子中的所有实体对,然后使用一个分类器来判断每对实体所具有的关系。这样,实体关系抽取问题就可以包含两个部分:一个是将自然语言语料转化为分类器能识别的训练测试数据;另一个就是利用分类器来进行关系类型的判断。   当前实体关系抽取面临的主要问题是如何在自然语言语料中抽取出有用的信息来提交给分类器进行分类。对于同一训练集和测试集,不同的特征抽取方法可能会导致结果很大的差异。目前,已有的特征抽取方法的主要问题是:   1.特征抽取比较任意,完全从主观经验出发,不能保证特征抽取的系统性和完整性,对后续的分类性能会造成影响;   2.现有方法一般都是将多种不同类型的特征简单地组合在一个单一的视图中,然后提交给分类器进行训练。而不同类型的特征之间可能具有一定的充分冗余性,这种简单的单视图特征组合方法则可能会降低分类器的性能。   本文针对上述问题做了以下的工作:   1.研究了从多个视图结合进行特征抽取的方法,利用各个视图的优点来互补对方的缺点,以此来达到提升总体准确率的效果。论文利用改进的特征抽取方法结合集成学习方法,在单视图分类器上应用SVM分类器,多视图结合时使用决策树分类器,得到了良好的测试结果,与单视图方法以及一般的特征组合方法相比,有一定提高。   2.设计了一种组合了混合谱核和实体核的合成核,以此来集成和利用各自的信息,更好地刻画关系实例之间的相似度。通过实验,证明这个方法相对于单个核的方法有较大的改进。  
其他文献
人脸的识别和分析可以广泛地应用在个人身份识别、安检、人机交互、表情分析、唇读等领域。人脸的检测定位是人脸识别技术的一个重要组成部分,其目标是在图像或图像序列中搜索
随着科学技术的进步,各个领域的科研工作者能够获取的信息量越来越大。大量的信息给科学研究带来了数据处理上的困难,因此人们需要探讨一些信息处理的工具。从而人工智能领域
P2P(Peer-to-Peer)网络是建立在互联网之上的覆盖网络,它通过节点之间的相互协作实现系统功能,从而充分利用了边缘网络资源,具有良好的扩展性、自组织性和匿名性等特点。目前,P2P
H.264标准是由国际电信联合会和国际标准化组织共同发展的下一代视频压缩标准。H.264/AVC视频压缩标准采用了很多新技术,如整数DCT变换、多参考帧的运动估计、多种宏块分割模
由于互联网技术的普及,计算机已经走进了各大企业以及各家各户,毫无疑问计算机给人们的工作和生活带来了许多的便捷,但是由于黑客的非法入侵,以及用户自己安全意识的缺乏,无
缓存技术是减轻服务器负载、减少网络拥塞、降低客户访问延迟的有效途径。但仅使用Web缓存技术作用有限。为提高缓存系统的性能,引入了Web预取技术,于是选择哪些数据源进行研究
数据流是近年出现的一个新的应用类型,具有连续、无限、高速等特点。典型的数据流包括:无线传感器网络应用环境中由传感器传回的各种监测数据、股票交易所的股票价格信息、网络
逆向工程作为产品快速成型的重要技术,在电影特技、医学、文物修复等领域中有着广泛的应用。散乱点云简化及三角剖分曲面重建是逆向工程中两个关键的技术,然而,许多简化算法
由于火箭构成的复杂性及航天任务的高可靠性,对火箭的自动化测试会产生大量的测试数据。以往火箭测试数据多是以测试项目为单位保存对应文本文件,数据判读或分析时需人工查看相
学位
正交频分复用技术和多天线多输入多输出技术被认为是下一代无线通信的核心技术。在无线通信系统中,MAC层的无线资源管理算法控制和管理数据传输信道、反馈信道和发射功率等资