【摘 要】
:
针对从非结构化文本中抽取指定人物职衔履历属性问题,提出一种基于远距离监督和模式匹配的属性抽取方法。该方法从字符串模式和依存模式两个层面描述人物职衔履历特征,将问题
【机 构】
:
北京语言大学大数据与语言教育研究所,北京语言大学信息科学学院
【基金项目】
:
国家自然科学基金资助项目(61300081), 中央高校基本科研业务费专项资金资助项目(北京语言大学科研项目:15YJ030006)
论文部分内容阅读
针对从非结构化文本中抽取指定人物职衔履历属性问题,提出一种基于远距离监督和模式匹配的属性抽取方法。该方法从字符串模式和依存模式两个层面描述人物职衔履历特征,将问题分为两阶段。首先利用远距离监督知识和人工标注知识,挖掘具有高覆盖度的模式库,用于发现职衔履历属性和抽取候选集;其次利用职衔机构等属性间的文字接续关系,以及特定人物与候选属性的依存关系,设计候选集的过滤规则对候选项进行筛选,实现高准确度的属性抽取。实验结果显示,所提方法在CLP2014-PAE测试集上的F值达到55.37%,显著高于评测最好成绩(F
其他文献
为了避免构建概念格时的繁琐过程,提高概念格构建的效率,提出了一种基于内涵亏值通过查找顶元素来快速渐进式生成概念格的新方法。首先,形式化地定义了顶元素、旧概念、产生概念、新概念、产生子概念、内涵亏值集合、剩留父概念、超集删除与正则队列;提出了概念格元素是否为顶元素的判定定理并给出了其证明;其次,在原概念格的正则队列中依次取概念元素,经超集删除后得到剩留父概念;最后,从剩留父概念查找其所在等价类的顶元
习近平军民融合法治思想是习近平新时代中国特色社会主义法治思想的重要组成部分,也是习近平军民融合深度发展思想的重要内容。习近平军民融合法治思想明确了军民融合法治建
结合当下严峻的禁毒形势,阐述在毒品犯罪侦查中阵地控制应用的可行性;总结出在毒品犯罪侦查阵地控制的应用中存在重视程度不够、把控能力不强、公安缉毒情报人才培养难度较大
结合某高校实验楼的建筑设计,从设计前的准备工作、初步设计和施工图设计阶段等方面简要介绍了建筑设计的基本过程,为类似工程的设计提供了参考依据。
目的通过对128例儿童过敏性紫癜的回顾分析,了解该病的临床特点,以减少I临床误诊。方法将128例儿童过敏性紫癜的,临床资料,包括病史、实验室检查、治疗方法作总结归类分析。结果1
一、市政给水管网规划和设计中的定线原则1.城市给水管网城市给水管网定线是指在城市用水区域的地面上确定各条配水管线的走向、路径和位置。(1)在干管定线时其铺设方向应该与
福岛核危机已事发一年,对美国而言,这场核灾难让众人反思,同时这也是一次核电改革的机会。福岛核危机让世人惊醒,人们也因此更加关注核能的安全利用问题。$$ 可以预见的是