(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210738046.8
(22)申请日 2022.06.24
(71)申请人 武汉大学
地址 430072 湖北省武汉市武昌区珞珈山
街道八一路2 99号
申请人 国网辽宁省电力有限公司电力科 学
研究院
国家电网有限公司
(72)发明人 尚磊 叶欣智 董旭柱 田野
方华亮 王波
(74)专利代理 机构 武汉科皓知识产权代理事务
所(特殊普通 合伙) 42222
专利代理师 俞琳娟
(51)Int.Cl.
G06F 16/36(2019.01)G06F 40/295(2020.01)
G06F 40/216(2020.01)
G06F 40/242(2020.01)
G06N 3/04(2006.01)
(54)发明名称
配电网故障处置知识图谱构建方法及装置
(57)摘要
本发明提供了配电网故障处置知识图谱构
建方法及装置, 方法包括: 步骤1.通过配电网的
调控系统获取配网设备台账数据、 调度规程数
据、 配网缺陷库数据和故障处置数据四种数据,
并进行预处理; 步骤2.将前三种数据整理为三元
组形式; 步骤3.对第四种数据进行标注, 得到每
条数据中的多个命名实体以及 多个实体类型, 并
得到标注后的故障处置数据集; 步骤4.将标注后
的故障处置数据集作为模型训练数据集, 采用预
训练的方法构建BERTwithDic ‑BiLSTM‑CRF实体
识别模型并进行微调训练, 识别配电网领域复杂
专业实体, 并将故障处置数据整理为三元组形
式; 步骤5.根据三元组形式的数据构建配电网故
障处置知识图谱。
权利要求书3页 说明书7页 附图2页
CN 115129892 A
2022.09.30
CN 115129892 A
1.配电网故障处置知识图谱构建方法, 其特 征在于, 包括:
步骤1.通过配电网的调控系统获取配网设备台账数据、 故障处置数据、 调度规程数据
和配网缺陷库数据, 并对数据进行 数据清洗预处 理;
步骤2.将预处理后的配网设备台账数据、 配网缺陷库数据、 调度规程数据整理为三元
组形式;
步骤3.对预处理后的故障处置数据进行标注, 得到每条数据中的多个命名实体以及多
个实体类型, 并得到标注后的故障处置数据集;
步骤4.将步骤3标注后的故障处置数据集作为模型训练数据集, 采用预训练的方法构
建BERTwithDic‑BiLSTM‑CRF实体识别模型并进行微调训练, BERT withDic‑BiLSTM‑CRF实体
识别模型包括: BERT层、 Word2Vec词嵌入层、 双向长短时记忆记忆 网络层BiLSTM、 特征串联
层Concatenate、 全连接层Dense、 条件随机场层CRF, 从而有效识别配电网领域的复杂专业
实体, 然后根据预 先设定好的实体间关系将故障处置数据整理为 三元组形式;
步骤5.将步骤2得到的三元组形式的配网设备台账数据、 配网缺陷库数据、 调度规程数
据整理和 步骤4得到的三元组形式的故障处置数据作为配电网文本数据, 通过图数据库对
配电网文本数据进行存 储和可视化, 构建配电网故障处置知识图谱。
2.根据权利要求1所述的配电网故障处置知识图谱构建方法, 其特 征在于:
其中, 在步骤4中, 利用构建的电力领域字典, 基于Word2Vec模型提取其中的词 典特征
表示; 输入文本经过分词处理, 利用Word2Vec训练得到的词向量矩阵对输入序列进行词嵌
入Embedding, 得到词典特征表示向量序列D=[d1,d2,…,dn]; 电力领域词典中包括电力专
业词汇和配网设备台账数据中的设备名称; 然后, 将BERT层的输出序列T和词典特征表 示向
量序列D进行特征拼接, 得到拼接特征表示E=[e1,e2,…,en], 将其输入到BiLSTM层, 捕获文
字基于上 下文的语言特 征, 输出考虑文字上 下文信息的向量序列O=[o1,o2,…,on]。
3.根据权利要求1所述的配电网故障处置知识图谱构建方法, 其特 征在于:
其中, 在步骤1中, 配电网相关数据集为datak(x,y), 表示配电网数据集中的第k类中第x
条数据第y个属性下的数据值, k∈[1,L], x∈[1,M], y∈[1,N], L为配电网相关数据类型的
数量, M为某类数据下 数据的总条 数, N为某条数据的属性数量。
4.根据权利要求1所述的配电网故障处置知识图谱构建方法, 其特 征在于:
其中, 在步骤2中, 针对配网设备台账数据, 以设备名称作为实体, 其余部分作为附加属
性, 根据不同设备间的现实链接关系按照如下 方式整理为 三元组形式:
C1=(data1(x1,y),R,data2(x2,y)),
式中, data1(x1,y)为设备1, data2(x2,y)为设备2, R为根据设备现实链接关系指定的设
备间关系;
针对配网缺陷库数据, 以缺陷名称作为实体, 其余部分作为附加属性, 根据缺陷和缺陷
设备间的所属关系整理为如下三元组形式:
C2=(data2(x1,y),R,data1(x1,y)),
式中, data2(x1,y)为缺陷1, data1(x1,y)为缺陷1所指向的设备1, R为根据缺陷和缺陷设
备的所属关系指定的关系;
针对调度规 程数据, 采用关键词+短文本的方法整理为如下三元组形式:
C3=(data3(x1,y1),R,data3(x1,y2)),权 利 要 求 书 1/3 页
2
CN 115129892 A
2式中, data3(x1,y1)为调度规程数据1中的关键词, data3(x1,y2)为调度规程数据1中关
键词下的短文本, R为 根据编写规则设定的文本间关系。
5.根据权利要求1所述的配电网故障处置知识图谱构建方法, 其特 征在于:
其中, 在步骤5中, 基于图数据库对配电网文本数据构建了设备拓扑知识图谱、 故障预
案知识图谱、 缺陷库知识图谱和调度规程知识图谱, 并且故障预案知识图谱和缺陷库知识
图谱分别以故障线路和缺陷线路为关联属性链接 到设备拓扑知识图谱。
6.配电网故障处置知识图谱构建装置, 其特 征在于, 包括:
数据获取部, 通过配电网的调控系统获取配网设备台账数据、 故障处置数据、 调度规程
数据和配网缺陷库数据, 并对数据进行 数据清洗预处 理;
处理部, 将预处理后的配网设备台账数据、 配网缺陷库数据、 调度规程数据整理为三元
组形式;
标注部, 对预处理后的故障处置数据进行标注, 得到每条数据中的多个命名实体以及
多个实体 类型, 并得到标注后的故障处置数据集;
模型构建部, 将标注后的故障处置数据集作为模型训练数据集, 采用预训练的方法构
建BERTwithDic‑BiLSTM‑CRF实体识别模型并进行微调训练, BERT withDic‑BiLSTM‑CRF实体
识别模型包括: BERT层、 Word2Vec词嵌入层、 双向长短时记忆记忆 网络层BiLSTM、 特征串联
层Concatenate、 全连接层Dense、 条件随机场层CRF, 从而有效识别配电网领域的复杂专业
实体, 然后根据预 先设定好的实体间关系将故障处置数据整理为 三元组形式;
图谱构建部, 将所述处理部整理的三元组形式的配网设备台账数据、 配网缺陷库数据、
调度规程数据整理和所述模型构建部整理的三元组形式的故障处置数据作为配电网文本
数据, 通过图数据库对配电网文本数据进 行存储和可视化, 构建配电网故障处置知识图谱;
以及
控制部, 与所述数据获取部、 所述处理部、 所述标注部、 所述模型构建部、 所述图谱构建
部均通信相连, 控制它 们的运行。
7.根据权利要求6所述的配电网故障处置知识图谱构建装置, 其特 征在于, 还 包括:
输入显示部, 与所述控制部通信相连, 让用户输入检测用信 息和操作指令, 并根据操作
指令进行相应显示。
8.根据权利要求6所述的配电网故障处置知识图谱构建装置, 其特 征在于:
其中, 所述输入显示部能够对所述数据获取部获取和预处理后的数据分别进行显示,
并能够对所述处理部整理的三元组形式的数据进 行显示, 还能够对所述标注部标注后的所
述故障处置数据集进行显示, 对所述模型构建部构建的模型、 识别的配电网领域的复杂专
业实体、 整理的三元组形式的数据进行显示, 以及对所述图谱构建部构建的所述配电网故
障处置知识图谱进行显示。
9.根据权利要求6所述的配电网故障处置知识图谱构建装置, 其特 征在于:
其中, 在所述模型构 建部中, 是利用构 建的电力领域字典, 基于Word2Vec模型提取其中
的词典特征表示; 输入文本经过分词处理, 利用Word2Vec训练得到的词向量矩阵对输入序
列进行词嵌入Embedding, 得到词典特征表示向量序列D=[d1,d2,…,dn]; 电力领域词典中
包括电力专业词汇和配网设备台账数据中的设备名称; 然后, 将BERT层的输出序列T和词典
特征表示向量序列D进行特征拼接, 得到拼接特征表示E=[e1,e2,…,en], 将其输入到权 利 要 求 书 2/3 页
3
CN 115129892 A
3
专利 配电网故障处置知识图谱构建方法及装置
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 11:01:29上传分享