【摘 要】
:
随着电网设备故障资料的电子化,与电网设备故障相关的文本数据资源迅速增长。为利用其中的知识,本文拟将电网设备故障领域文本蕴含的知识结构化,构建电网设备故障领域知识图谱。知识抽取是知识图谱的主要构建方法,是从非结构化的文本中提取结构化知识三元组的过程。其中命名实体识别和关系抽取是主要任务。但目前现有命名实体识别模型缺乏对领域的针对性,且大多采用合并预测实体位置和类别的任务构建模式,造成误差积累。在关系
论文部分内容阅读
随着电网设备故障资料的电子化,与电网设备故障相关的文本数据资源迅速增长。为利用其中的知识,本文拟将电网设备故障领域文本蕴含的知识结构化,构建电网设备故障领域知识图谱。知识抽取是知识图谱的主要构建方法,是从非结构化的文本中提取结构化知识三元组的过程。其中命名实体识别和关系抽取是主要任务。但目前现有命名实体识别模型缺乏对领域的针对性,且大多采用合并预测实体位置和类别的任务构建模式,造成误差积累。在关系抽取任务中,有监督学习模型的训练依赖人工标注数据,但由于领域实体关系标注的专业性,人工成本较高,无法满足需求。针对以上问题,对于命名实体识别任务,本文提出一种基于多任务学习的实体边界感知模型,在任务构建、领域实体信息上利用进行创新。该模型基于多头注意力机制的Transformer,将传统命名实体识别任务分解为实体边界感知任务和实体分类任务,开展多任务学习,减少任务之间的误差积累。本文模型还使用基于领域实体类别综合描述的相似度计算辅助实体分类,实现对领域实体的针对性。并在公开数据集和领域数据集上进行了实验,证明了模型的先进性。对于关系抽取任务,本文提出一种基于多类关系注意力机制的关系抽取模型,以远程监督多示例学习的思想为出发点,减少模型对人工标注的依赖。为提高模型对领域实体关系的针对性,本文引入领域关系特征,并在公开数据集和领域数据集上进行实验,验证了模型的效果。为搭建知识图谱,本文首先对领域实体进行抽取,完善领域词典。之后利用通用知识库和电网标准进行知识对齐,构建领域实体关系数据集,进行关系抽取得到知识集合。最后对结果进行知识融合,实现电网设备故障领域知识图谱的构建、存储和可视化。本文比较了电网设备故障领域知识图谱和通用知识图谱的查询结果,证实该知识图谱在专业性、详细性和领域针对性等方面具有明显的优势。
其他文献
人工智能在医学领域的应用越来越多,对临床诊断的辅助分析也越来越精确。而多模态医学图像分割则是人工智能在医学领域的一个重要应用,它对准确高效的临床诊断具有重要意义。在多种模态的医学图像上得到的精确的器官区域的分割结果,也是在临床治疗中确定治疗方案的重要依据之一。在实际应用中,分割这一步骤通常由专业医生手工完成,工作量极大,极其耗时。基于人工智能技术,医生的工作效率会因为引入计算机辅助诊断系统得到有效
在迅速成为当今最主要广告形式的互联网广告中,针对用户交互行为数据进行针对性预测已经成为推荐搜索领域非常重要的一环,对商业营销策略的优化和广告推送收益的提升都有着很大影响。广告点击预测在学术界和工业界都是一个热点话题,在实际场景中,其大规模商业数据通常无法凭借结构单一的训练模型完成,需要采用模型融合的策略完成特征的自动构建及提升预测效果。本研究从广告点击预测场景下其大规模结构化数据特性带来的工程问题
分析了某车型汽车发电机上所用线圈架的注射成型工艺,并对该注射模的设计过程作了一定的阐述.利用Pro/E软件里的Plastic Advisor模块对该塑件进行CAE分析.在模具设计过程中,为了避免塑件上3处定位凸台在模具斜导柱带动侧滑块分型过程中的干涉,对与斜导柱配合的斜导柱孔径进行创新优化,设计为间隙配合,实现了垂直分型后再进行水平分型.该模具优化设计后塑件脱模顺利,尺寸合格,外观良好,达到了设计要求,满足了批量生产的要求.
领域知识图谱能够为应急管理工作提供重要的语义知识支持,有效提高突发事件事前预警的精准度和及时性,并为事中事后处置提供科学的依据。然而,目前的领域知识图谱存在知识不完备的问题,特别是知识图谱中很重要的属性知识面临着属性和属性值缺失的问题,而属性补全过程又面临着属性冗余歧义以及属性值填充错误的情况。因此,本文研究领域知识图谱的属性自动补全技术,具有重要的理论和应用价值。本文首先提出了一种多维特征的多源