论文部分内容阅读
油气勘探开发领域经历了四十多年的信息化建设,已经形成了一批支撑各个科学应用的信息模型。由于各个学科和专业在进行信息模型建设过程中缺乏统一的标准支撑,导致大量的“信息孤岛”出现。“信息孤岛”的出现使各个学科和专业很难共享这些信息,特别是随着人工智能和大数据在油气勘探开发领域的应用,迫切需要勘探开发知识库的支撑。在这种情况下,需要将这些海量的、分散的、异构的勘探开发信息组织并表示为知识模型。尽管目前油气勘探开发领域也有一些相关的研究,但是并没有很好的解决油气勘探开发知识表示的标准化等问题。此外,基于油气勘探开发信息模型很难实现数据的语义检索与知识推荐应用。针对以上问题,本文通过对知识图谱技术与ISO/IEC 11179数据元注册标准的研究,提出一种基于数据元注册系统(MDR)的标准化领域知识图谱构建方法,解决领域的标准化知识表示问题,并在其基础之上对领域语义数据的查询扩展方法以及个性化推荐应用进行了研究,主要包括以下几个方面:首先,利用知识图谱技术解决领域的标准化知识表示问题,提出了基于MDR的标准化领域知识图谱构建方法。建立了基于MDR生成知识图谱的架构模型,并分别设计了MDR概念模型、数据描述元模型与概念关系图谱的标准化映射规则,构建了知识图谱的概念关系图谱,通过建立关系数据库与知识图谱的实体关系图谱的映射规则与映射算法,将关系数据库发布为实体关系图谱,实现了领域知识图谱的标准化构建,解决了领域知识表示方法不统一、不标准,语义知识无法在领域内共享与重用的问题。其次,在分析概念相似度算法基础上,将综合相似度计算方法与知识图谱技术结合,基于标准化的知识表示提出了一种综合相似度计算与知识图谱融合的语义查询扩展算法,解决了无法对用户的检索内容进行有效扩展、查询结果比较片面的问题,实现了领域语义数据的智能检索。结合勘探开发领域实际的概念关系权重与业务需求进行了语义数据检索实验,实验结果表明,在适当的阈值下,该算法能够提高用户数据查询的准确率与召回率。再次,通过对个性化推荐算法的综合分析,提出了知识图谱与协同过滤推荐算法混合的推荐算法。将知识图谱与K-means聚类算法结合来筛选相似用户,解决了用户-兴趣矩阵的数据稀疏问题,然后使用SVD分解方法实现了基于用户的协同过滤推荐,解决了用户个性化的信息推荐问题,实现了语义信息的智能推送。通过结合勘探开发领域实际的业务需求与数据进行了个性化信息推荐实验,实验结果表明,该算法能够提高用户信息个性化推荐的准确率。最后,以地质大队井下作业的地质设计业务对于地层知识的检索需求为背景,设计并开发了地层数据知识检索的应用。基于勘探开发领域MDR构建了地层语义概念关系图谱,将EPDM中与地层相关的数据映射为实体关系图谱,采用本文提出的查询扩展与个性化推荐算法,实现了地层数据语义知识的智能检索与推送。通过实际应用证明了本文知识图谱构建方法与应用算法的可行性。同时,本文提出的知识图谱构建方法及其在查询扩展与个性化推荐方面的应用具有通用性,能够为其他领域知识图谱的构建与应用提供借鉴。