论文部分内容阅读
摘 要:為了保证电力系统的安全可靠运行,电气设备需要严格按照安全操作规程,并在出现故障之后能够及时有效地做出应对措施,然而在集控站负责运行调度的条件下,面对海量的电网调控需求,则需要变电站运行人员及时准确地做出应对措施。为了满足以上需求,本文对变电站调度运行规范进行分析和知识抽取,利用五防规则对其进行指导调整,并基于Protégé形成变电站调度运行规范知识图谱,为运行人员提供直观、智能的信息展示与解决方案指导,通过实例证明了本方法的有效性。
关键词:变电运行知识图谱;调度规范;五防;依存句法分析;Protégé
中图分类号:TM
Construction of Knowledge Graph of Substation Operation Operation Based
on Dependency Syntax Analysis and Fiveprevention Operation Specifications
Ma Wenjie He Zisi Wu Yingli Liu Jie Liu Yuanyuan Chen Zhou
State Grid Hubei Electric Power Company Maintenance Company HubeiWuhan 430050
Abstract:In order to ensure the safe and reliable operation of the power system,electrical equipment needs to strictly follow the safe operating procedures and be able to respond promptly and effectively after failures.However,under the condition that the centralized control station is responsible for the operation and scheduling,it faces a large number of Power grid regulation needs require substation operators to make timely and accurate response measures.In order to meet the above requirements,this article analyzes and extracts knowledge of substation dispatching operation specifications,uses the five prevention rules to guide and adjusts them,and forms a knowledge map of substation dispatching operation specifications based on Protégé,providing operators with intuitive and intelligent information display and solutions The program guidance has proved the effectiveness of this method through examples.
Keywords:substation operation;knowledge graph;scheduling specification;five preventions;dependency syntax analysis;Protégé
随着电网的智能化,海量的电网调控要求需要有及时准确应对,一个完整、细致、符合五防要求的知识图谱能够直观地展示变电站调度运行规范,同时为变电站的调度操作起到辅助决策的作用。我国电网在近些年来迅猛发展,在变电站这个模块中积累了大量的资料与数据,对其有效利用可以构造一个完整的指导体系。
变电站有着严格的调度运行规范,得益于自然语言处理(Natural Language Process,NLP)技术的发展,对调度运行规范进行语义识别、关系提取,可以将其内容形成直观的知识网络。作为NLP技术的重点研究领域,知识图谱被广泛应用在临床医学、情报分析、工业工程等各个行业。
文献[1]为高效地对一般案件进行处理,对法律法规等自由文本进行知识提取,构建知识图谱,通过设计人机交互实现案件的辅助分析;文献[2]将知识图谱引入至建筑机电领域,构建知识图谱实现文本实体识别及关系查询功能,为建筑机电领域的知识梳理与检索做了铺垫研究;文献[3]通过构建本体,利用机器学习的方法对知识进行抽取,建立了军事领域的知识图谱模型;文献[4]采用BERT模型对水稻表型关系进行知识抽取,精确率达951%,为相关知识图谱的构建奠定了基础。在电力工程领域,文献[5]利用哈尔滨工业大学开发的语言技术平台(Language Technology Platform,LTP),对变压器运行规范构建了知识图谱,并将其可视化,为变压器的运行维护提供了辅助与指导;文献[6]针对于电网基建工程中产生的说明书及清册等基础数据构建知识图谱,采用双向长短时记忆神经网络(Bi-LSTM)配合随机场模型(CRF)对文本中的自然语言进行处理,并基于图数据库模型将其可视化,可以满足用户查询需求,串联了上下层数据的交互;文献[7]基于模糊理论构建了电力客服知识图谱模型。
本文为应对庞大的电网调控需求量,利用NLP技术对变电站调度运行规范进行分析和知识抽取,在五防规则的框架下对实体关系进行调整,并基于protégé形成相关可视化知识图谱,最后通过实例验证本文的知识图谱方案。
1 知识图谱及自然语言分析
1.1 知识图谱
知识图谱(Knowledge Graph,KG)可以追溯到20世纪60年代提出的语义网络,其完整概念于2012年被谷歌公司(Google Inc.)首先提出,是一种揭示实体之间关系的语义网络[8]。
知识图谱采用三元组作为其基本存储单位,表示为“实体—关系—实体”或“实体—属性—属性值”[9],涉及的实体通过关系连接最终形成知识网络。根据覆盖的范围及目的,知识图谱可以分为两类:通用知识图谱与行业知识图谱[10]。通用知识图谱覆盖面广,涉及点多,但实体间关系较为单一,侧重于融合更多知识实体;行业知识图谱则强调其专业性,覆盖面小,实体间关系较为复杂,侧重描述特定行业的知识体系。构建知识图谱是对原始资料不断学习识别的过程,而每一輪的构建中均分为三步[11]:信息抽取、知识融合、知识加工。信息抽取是对原始数据进行实体、关系、属性的抽取,形成知识表达的基础;知识融合是对新知识进行合并,以消除指代中产生的歧义;知识加工包含之后的知识表示、知识推理等部分。结构如下:
图1 知识图谱构建
Fig1 Knowledge graph construction
1.2 自然语言分析
自然语言分析是基于人类语言句法,根据文本词性的分析。在行业知识图谱中,由于其覆盖范围较小,用语较为固定,所以可以构建相应的分类词典,通过语言技术平台(Language Technology Platform,LTP)对运行规范文本进行语义分析,添加五防规则进行知识提取。
利用LTP进行命名实体识别与依存语句分析需要预先建立行业词典,按照文本中词性,构建词典示意如下:
其中,n为名词,v为动词,wp为标点,a为形容词,p为介词,c为连接词。
得到词性分析后进一步分析语义,得到文本的语句依存关系,提取复杂信息中的核心内容。
2 变电运行操作知识图谱构建
2.1 信息处理
单纯地将词性进行标注识别只是信息抽取的基础,为正确反映变电站部件及操作之间的逻辑关系,需要提取文本内容中涉及的部件实体,所处状态,具体操作及时间上的逻辑顺序,将一个复杂文本的主要信息提取,形成简要鲜明的指导说明。其步骤如下:
(1)编辑字典,记入变电站中的特有词汇,建立词典;
(2)对文本的词性进行分析,标注词句的词性,获取词句结构,并进一步分析文本的依存关系;
(3)找出关键语句,提炼文本内容,将复杂文本简明化。
以1.2中的文本为例,在进行词性分析后,调用LTP对文本中词句的依存关系进行分析,通过语法分析确定词句之间的支配关系。首先编辑字典,记录文本中的电气特有词汇,如电流互感器;之后对文本进行分句并分析依存关系,并消除指代歧义;最终提炼信息。为直观表示,记录如表2:
4 结语
本文在变电站操作规程的基础上,建立行业词典,对文本进行语义分析,抽取主要信息,融合五防规则,通过protégé建立本体信息,并进一步构成知识图谱,直观展现了变电站运行操作规范,方便运行人员查阅。而在电网的不断发展过程中,变电站也会因此更新建设,相应的知识图谱内容也应随之做出修改,为了保证图谱的实时性与有效性,可以在未来结合云技术,实现图谱信息的自动更新。
参考文献: [1]梁鸿翔,吴肇良,杨帅.面向司法案件判定的知识引导智能分析系统[J].数据通信,2021(01):2832+47.
[2]吴浪韬,肖亚奇,梁雄,罗征,胡振中.基于知识图谱的机电逻辑关系检索[A].中国图学学会建筑信息模型(BIM)专业委员会.第五届全国BIM学术会议论文集[C].中国图学学会建筑信息模型(BIM)专业委员会:中国建筑工业出版社数字出版中心,2019:8.
[3]邢萌,杨朝红,毕建权.军事领域知识图谱的构建及应用[J].指挥控制与仿真,2020,42(04):17.
[4]袁培森,李润隆,王翀,徐焕良.基于BERT的水稻表型知识图谱中关系抽取研究[J/OL].农业机械学报,20210401:110.
[5]杨帆,李靖,王坚敏,丁克勤,谢元,密铁宾,邱才明.基于自然语言句法分析的电力变压器运行规范知识图谱构建[J].电气应用,2020,39(11):1823.
[6]蒋玮,周颖,陈舒淇,王波,陈红.电网基建工程数据挖掘及知识图谱构建技术研究[J].电力信息与通信技术,2021,19(02):1522.
[7]王楚,王忠锋,李力刚,徐志远,田世明,潘明明.电力客服知识图谱的改进研究与模型构建[J].供用电,2020,37(06):38.
[8]王琼,杨波.知识图谱在电力行业的应用与研究[J].网络安全技术与应用,2020(11):137138.
[9]姚萍,李坤偉,张一帆.知识图谱构建技术综述[J].信息系统工程,2020(05):121+123.
[10]徐增林,盛泳潘,贺丽荣,王雅芳.知识图谱技术综述[J].电子科技大学学报,2016,45(04):589606.
[11]刘峤,李杨,段宏,刘瑶,秦志光.知识图谱构建技术综述[J].计算机研究与发展,2016,53(03):582600.
[12]王健.浅析变电站“五防”系统的实现方式[J].现代经济信息,2018(03):371.
[13]章勇,吕俊白.基于Protege的本体建模研究综述[J].福建电脑,2011,27(01):4345.
作者简介:马文杰(1988— ),男,汉族,湖北武汉人,本科,继电保护中级工,研究方向:变电站运行维护;何子嗣(1987— ),男,汉族,湖北荆门人,工程硕士,研究方向:智能变电站;吴颖俐(1973— ),女,汉族,湖北武汉人,本科,研究方向:智能变电站;刘杰(1981— ),男,汉族,湖北武汉人,本科,研究方向:数字变电站;刘园媛(1984— ),女,汉族,湖北武汉人,本科,研究方向:变电运维技术;陈舟(1987— ),男,汉族,湖北孝感人,硕士,研究方向:变电运维技术。
关键词:变电运行知识图谱;调度规范;五防;依存句法分析;Protégé
中图分类号:TM
Construction of Knowledge Graph of Substation Operation Operation Based
on Dependency Syntax Analysis and Fiveprevention Operation Specifications
Ma Wenjie He Zisi Wu Yingli Liu Jie Liu Yuanyuan Chen Zhou
State Grid Hubei Electric Power Company Maintenance Company HubeiWuhan 430050
Abstract:In order to ensure the safe and reliable operation of the power system,electrical equipment needs to strictly follow the safe operating procedures and be able to respond promptly and effectively after failures.However,under the condition that the centralized control station is responsible for the operation and scheduling,it faces a large number of Power grid regulation needs require substation operators to make timely and accurate response measures.In order to meet the above requirements,this article analyzes and extracts knowledge of substation dispatching operation specifications,uses the five prevention rules to guide and adjusts them,and forms a knowledge map of substation dispatching operation specifications based on Protégé,providing operators with intuitive and intelligent information display and solutions The program guidance has proved the effectiveness of this method through examples.
Keywords:substation operation;knowledge graph;scheduling specification;five preventions;dependency syntax analysis;Protégé
随着电网的智能化,海量的电网调控要求需要有及时准确应对,一个完整、细致、符合五防要求的知识图谱能够直观地展示变电站调度运行规范,同时为变电站的调度操作起到辅助决策的作用。我国电网在近些年来迅猛发展,在变电站这个模块中积累了大量的资料与数据,对其有效利用可以构造一个完整的指导体系。
变电站有着严格的调度运行规范,得益于自然语言处理(Natural Language Process,NLP)技术的发展,对调度运行规范进行语义识别、关系提取,可以将其内容形成直观的知识网络。作为NLP技术的重点研究领域,知识图谱被广泛应用在临床医学、情报分析、工业工程等各个行业。
文献[1]为高效地对一般案件进行处理,对法律法规等自由文本进行知识提取,构建知识图谱,通过设计人机交互实现案件的辅助分析;文献[2]将知识图谱引入至建筑机电领域,构建知识图谱实现文本实体识别及关系查询功能,为建筑机电领域的知识梳理与检索做了铺垫研究;文献[3]通过构建本体,利用机器学习的方法对知识进行抽取,建立了军事领域的知识图谱模型;文献[4]采用BERT模型对水稻表型关系进行知识抽取,精确率达951%,为相关知识图谱的构建奠定了基础。在电力工程领域,文献[5]利用哈尔滨工业大学开发的语言技术平台(Language Technology Platform,LTP),对变压器运行规范构建了知识图谱,并将其可视化,为变压器的运行维护提供了辅助与指导;文献[6]针对于电网基建工程中产生的说明书及清册等基础数据构建知识图谱,采用双向长短时记忆神经网络(Bi-LSTM)配合随机场模型(CRF)对文本中的自然语言进行处理,并基于图数据库模型将其可视化,可以满足用户查询需求,串联了上下层数据的交互;文献[7]基于模糊理论构建了电力客服知识图谱模型。
本文为应对庞大的电网调控需求量,利用NLP技术对变电站调度运行规范进行分析和知识抽取,在五防规则的框架下对实体关系进行调整,并基于protégé形成相关可视化知识图谱,最后通过实例验证本文的知识图谱方案。
1 知识图谱及自然语言分析
1.1 知识图谱
知识图谱(Knowledge Graph,KG)可以追溯到20世纪60年代提出的语义网络,其完整概念于2012年被谷歌公司(Google Inc.)首先提出,是一种揭示实体之间关系的语义网络[8]。
知识图谱采用三元组作为其基本存储单位,表示为“实体—关系—实体”或“实体—属性—属性值”[9],涉及的实体通过关系连接最终形成知识网络。根据覆盖的范围及目的,知识图谱可以分为两类:通用知识图谱与行业知识图谱[10]。通用知识图谱覆盖面广,涉及点多,但实体间关系较为单一,侧重于融合更多知识实体;行业知识图谱则强调其专业性,覆盖面小,实体间关系较为复杂,侧重描述特定行业的知识体系。构建知识图谱是对原始资料不断学习识别的过程,而每一輪的构建中均分为三步[11]:信息抽取、知识融合、知识加工。信息抽取是对原始数据进行实体、关系、属性的抽取,形成知识表达的基础;知识融合是对新知识进行合并,以消除指代中产生的歧义;知识加工包含之后的知识表示、知识推理等部分。结构如下:
图1 知识图谱构建
Fig1 Knowledge graph construction
1.2 自然语言分析
自然语言分析是基于人类语言句法,根据文本词性的分析。在行业知识图谱中,由于其覆盖范围较小,用语较为固定,所以可以构建相应的分类词典,通过语言技术平台(Language Technology Platform,LTP)对运行规范文本进行语义分析,添加五防规则进行知识提取。
利用LTP进行命名实体识别与依存语句分析需要预先建立行业词典,按照文本中词性,构建词典示意如下:
其中,n为名词,v为动词,wp为标点,a为形容词,p为介词,c为连接词。
得到词性分析后进一步分析语义,得到文本的语句依存关系,提取复杂信息中的核心内容。
2 变电运行操作知识图谱构建
2.1 信息处理
单纯地将词性进行标注识别只是信息抽取的基础,为正确反映变电站部件及操作之间的逻辑关系,需要提取文本内容中涉及的部件实体,所处状态,具体操作及时间上的逻辑顺序,将一个复杂文本的主要信息提取,形成简要鲜明的指导说明。其步骤如下:
(1)编辑字典,记入变电站中的特有词汇,建立词典;
(2)对文本的词性进行分析,标注词句的词性,获取词句结构,并进一步分析文本的依存关系;
(3)找出关键语句,提炼文本内容,将复杂文本简明化。
以1.2中的文本为例,在进行词性分析后,调用LTP对文本中词句的依存关系进行分析,通过语法分析确定词句之间的支配关系。首先编辑字典,记录文本中的电气特有词汇,如电流互感器;之后对文本进行分句并分析依存关系,并消除指代歧义;最终提炼信息。为直观表示,记录如表2:
4 结语
本文在变电站操作规程的基础上,建立行业词典,对文本进行语义分析,抽取主要信息,融合五防规则,通过protégé建立本体信息,并进一步构成知识图谱,直观展现了变电站运行操作规范,方便运行人员查阅。而在电网的不断发展过程中,变电站也会因此更新建设,相应的知识图谱内容也应随之做出修改,为了保证图谱的实时性与有效性,可以在未来结合云技术,实现图谱信息的自动更新。
参考文献: [1]梁鸿翔,吴肇良,杨帅.面向司法案件判定的知识引导智能分析系统[J].数据通信,2021(01):2832+47.
[2]吴浪韬,肖亚奇,梁雄,罗征,胡振中.基于知识图谱的机电逻辑关系检索[A].中国图学学会建筑信息模型(BIM)专业委员会.第五届全国BIM学术会议论文集[C].中国图学学会建筑信息模型(BIM)专业委员会:中国建筑工业出版社数字出版中心,2019:8.
[3]邢萌,杨朝红,毕建权.军事领域知识图谱的构建及应用[J].指挥控制与仿真,2020,42(04):17.
[4]袁培森,李润隆,王翀,徐焕良.基于BERT的水稻表型知识图谱中关系抽取研究[J/OL].农业机械学报,20210401:110.
[5]杨帆,李靖,王坚敏,丁克勤,谢元,密铁宾,邱才明.基于自然语言句法分析的电力变压器运行规范知识图谱构建[J].电气应用,2020,39(11):1823.
[6]蒋玮,周颖,陈舒淇,王波,陈红.电网基建工程数据挖掘及知识图谱构建技术研究[J].电力信息与通信技术,2021,19(02):1522.
[7]王楚,王忠锋,李力刚,徐志远,田世明,潘明明.电力客服知识图谱的改进研究与模型构建[J].供用电,2020,37(06):38.
[8]王琼,杨波.知识图谱在电力行业的应用与研究[J].网络安全技术与应用,2020(11):137138.
[9]姚萍,李坤偉,张一帆.知识图谱构建技术综述[J].信息系统工程,2020(05):121+123.
[10]徐增林,盛泳潘,贺丽荣,王雅芳.知识图谱技术综述[J].电子科技大学学报,2016,45(04):589606.
[11]刘峤,李杨,段宏,刘瑶,秦志光.知识图谱构建技术综述[J].计算机研究与发展,2016,53(03):582600.
[12]王健.浅析变电站“五防”系统的实现方式[J].现代经济信息,2018(03):371.
[13]章勇,吕俊白.基于Protege的本体建模研究综述[J].福建电脑,2011,27(01):4345.
作者简介:马文杰(1988— ),男,汉族,湖北武汉人,本科,继电保护中级工,研究方向:变电站运行维护;何子嗣(1987— ),男,汉族,湖北荆门人,工程硕士,研究方向:智能变电站;吴颖俐(1973— ),女,汉族,湖北武汉人,本科,研究方向:智能变电站;刘杰(1981— ),男,汉族,湖北武汉人,本科,研究方向:数字变电站;刘园媛(1984— ),女,汉族,湖北武汉人,本科,研究方向:变电运维技术;陈舟(1987— ),男,汉族,湖北孝感人,硕士,研究方向:变电运维技术。