基于核方法的中文实体关系抽取研究

来源 :中文信息学报 | 被引量 : 11次 | 上传用户：LanceXulei

【摘要】

：

命名实体关系抽取是信息抽取领域中的重要研究课题之一。该文探讨了核方法在中文关系抽取上的有效性问题,主要分为三部分:研究了在卷积树核中使用不同的语法树对关系抽取性能的影响;通过构造复合核检查了树核与平面核之间的互补效果;改进了最短路径依赖核,将核计算建立在原最短依赖路径的最长公共子序列上,以消除原始最短路径依赖核对依赖路径长度相同的过严要求。因为核方法开始被用于英文关系抽取时,F1值也只有40%左右

【作者】

：

黄瑞红孙乐冯元勇黄云平

【机构】

：

中国科学院软件研究所,中国科学院研究生院

【出处】

：

中文信息学报

【发表日期】

：

2008年05期

【关键词】

：

计算机应用中文信息处理中文实体关系抽取核方法卷积树核复合核最短路径依赖核

【基金项目】

：

国家自然科学基金资助项目（60773027,60736044）,国家863计划重点资助项目（2006AA010108）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于HMM的满文文本识别后处理的研究

将满文单词识别系统的识别信息和满文的词组信息有机的结合起来,建立满文词组和待定词集统计信息库,采用基于统计的隐马尔可夫模型的方法,依据贝叶斯准则,综合满文待定词的后验概率和词组的先验概率信息,建立合理有效便于实现的数据结构,采用动态规划法对满文单词识别系统输出存在的拒识词和错识词进行检测和纠正,从而有效的提高满文文本识别系统的识别率。实验表明:后处理性能除取决于语言模型外,还取决于概率的精确估计。

期刊

计算机应用中文信息处理满文后处理模糊矩阵贝叶斯准则特征矢量computer application Chinese information pr

体制改革是摆脱货币政策窘境的不二选择

面临通货膨胀的内忧和外汇储备缩水的外患，为实现经济平稳、协调发展，我国需要从维护本国国民的最高利益和世界经济均衡发展的大局出发，全面梳理外资、外贸政策，改革汇率体制，最大

期刊

货币政策体制改革经济均衡发展窘境外汇储备通货膨胀协调发展外贸政策

一种基于信息熵的中文高频词抽取算法

为扩展分词词典,提高分词的准确率,本文提出了一种基于信息熵的中文高频词抽取算法,其结果可以用来识别未登录词并扩充现有词典。我们首先对文本进行预处理,将文本中的噪音字

期刊

人工智能自然语言处理分词中文抽词信息熵高频词

为民服务宗旨是法治建设的灵魂和生命

胡锦涛总书记在“七一”讲话中明确指出，“必须始终把人民利益放在第一位，把实现好、维护好、发展好最广大人民群众的根本利益作为一切工作的出发点和落脚点”。这一精辟论断，既

期刊

法治建设服务宗旨中国特色社会主义最广大人民群众生命灵魂“七一”讲话胡锦涛总书记

基于核方法的中文实体关系抽取研究

其他学术论文