油气勘探开发文档的语义分析及提取方法的研究与实现

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:xzhtqx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱技术的推广与应用,给相关领域带来了新的研究方向与挑战。目前油气勘探开发领域的知识图谱正处于起步阶段,需要大量该领域的知识提供支持,这些知识主要来源于油气勘探开发文档,然而还没有一套完善的方法和系统,能自动地从这些文档中提取知识。如何从非结构化的文档中大规模地自动提取知识已经成为研究油气勘探开发知识图谱的首要任务(知识主要指油气勘探开发领域的实体和关系)。为了准确地提取油气勘探开发领域的知识,本文从三个方面研究了油气勘探开发文档的语义分析及提取方法,分别是油气勘探开发文档的信息提取、油气勘探开发文档的命名实体识别以及油气勘探开发文档的实体关系提取。其中,在文档的信息提取部分设计了一种基于规则和SVM相结合的文档信息提取方法,并通过对比实验证明了该方法的效果;在文档的命名实体识别部分,针对油气勘探开发领域的特点,编制出合适的规则和词典去优化机器学习训练的命名实体识别模型,更好地提升了油气勘探开发领域命名实体识别的效果;在文档的实体关系提取部分,采用模式和远监督相结合的关系提取方法,有效地提取了大量的油气勘探开发领域的实体关系。通过对三部分研究的整合,提出并实现了油气勘探开发文档的语义分析及提取方法。实验表明,该方法能够较好地从油气勘探开发文档中自动提取大量的油气勘探开发知识。
其他文献
麻疯树,大戟科植物,多年生落叶灌木或小乔木,种子含油率高达40%~60%,可以提炼出不含硫,无污染,符合欧四标准的生物柴油。其副产物可生产生物药品(医药中间体)、肥料及农药等
工业领域中,减速器因其独特的优势在现代化机械工业中被广泛运用。本论文任务来源于校企合作产学研项目,企业研发生产的精密研磨机用蜗轮蜗杆减速器,因其性能的优劣会直接影响到研磨机以及硅片加工的质量,因此配合企业开发减速器综合性能测试台,用于检验减速器综合性能指标,保证减速器产品质量。蜗轮蜗杆减速器主要性能指标包含振动性能、传动效率、温升等,其中对减速器振动信号的研究,不仅可以进一步提升减速器整机性能,而
本文建立了一维河流石油类污染物"解吸为主"的动态水质模型.模型方程中考虑了河流悬移质、推移质泥沙和底泥与石油类之间发生的吸附解吸的动态过程,以及河流弥散作用对石油类
已有的许多研究发现,身体活动或者状态能够影响各种认知过程,即使是简单的身体动作也能激起发散性思维的表现。画图是想象、知觉和身体动作等心理成分协作进行的一种活动,如果先行做出画图活动,其对后续的发散思维有何影响?本研究通过2个实验,探索画图能否促进发散思维表现,进而寻找画图活动中能够真正促进发散思维的有效成分。实验1考察画图能否促进后续发散思维任务的表现。本实验将被试分为3组:(1a)自由画图组;(