(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210710869.X
(22)申请日 2022.06.22
(71)申请人 国网天津市电力公司电力科 学研究
院
地址 300384 天津市西青区海 泰华科四路8
号
申请人 国网天津市电力公司
国家电网有限公司
(72)发明人 丁一 张磐 滕飞 霍现旭 庞超
杨挺 尚学军 陈沛 焦秋良
吴莉萍 吴磊
(74)专利代理 机构 天津盛理知识产权代理有限
公司 12209
专利代理师 王来佳(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/901(2019.01)
G06K 9/62(2022.01)
G06Q 50/06(2012.01)
(54)发明名称
适用于配电网设备故障记录的知识图谱实
体消岐融合方法
(57)摘要
本发明涉及一种适用于配电网设备故障记
录的知识图谱实体消岐融合方法, 包括以下步
骤: 步骤1、 建立配电网设备故障的基本知识图
谱; 步骤2、 对配电网设备 故障记录本文进行实体
抽取; 步骤3、 将每份故障记录所提取的实体名词
与步骤1的配电网设备故障知识图谱进行比对,
分别计算名称相似度和结构相似度; 步骤4、 基于
步骤3所计算的名称相似度和结构相似度结果,
计算每份故障记录中实体与知识图谱的综合匹
配度, 并选 取合适权重, 得到最优匹配结果后, 将
相同实体融合, 对不同实体开辟新的实体分支以
消除歧义, 完善配电网设备故障知识图谱。 本发
明能够将相同实体融合, 对不同实体开辟新的实
体分支以消除歧义, 完善配电网设备故障知 识图
谱。
权利要求书2页 说明书5页 附图2页
CN 115238084 A
2022.10.25
CN 115238084 A
1.一种适用于配电网设备故障记录的知识图谱实体消岐融合方法, 其特征在于: 包括
以下步骤:
步骤1、 建立配电网设备故障的基本知识图谱;
步骤2、 对配电网设备故障记录 本文进行实体抽取;
步骤3、 将每份故障记录所提取的实体名词与步骤1的配电网设备故障知识图谱进行比
对, 分别计算名称相似度和结构相似度;
步骤4、 基于步骤3所计算的名称相似度和结构相似度结果, 计算每份故障记录中实体
与知识图谱的综合匹配度, 并选取合适权重, 得到最优匹配结果后, 将相同实体融合, 对不
同实体开辟新的实体分支以消除歧义, 完 善配电网设备故障知识图谱。
2.根据权利要求1所述的一种适用于配电网设备故障记录的知识图谱实体消岐融合方
法, 其特征在于: 所述 步骤1的具体方法为:
通过设备及故障专业词 汇, 建立配电网设备故障的基本知识图谱, 并存储于neo4j图数
据库。
3.根据权利要求1所述的一种适用于配电网设备故障记录的知识图谱实体消岐融合方
法, 其特征在于: 所述 步骤2的具体方法为:
通过“字符窗”分词法对配电网设备故障记录本文进行实体抽取, 按照5、 4、 3、 2个字符
的顺序对文本逐字截断, 并与步骤1中的配电网设备故障知识图谱进 行比对, 提取出包括设
备名称、 设备类型、 设备属性和相关故障等实体名词。
4.根据权利要求1所述的一种适用于配电网设备故障记录的知识图谱实体消岐融合方
法, 其特征在于: 所述 步骤3的具体方法为:
计算步骤2得到的实体名词与知识谱图进行比较, 首 先计算名称相似度:
式中m,n是字符w1和w2的长度, D(m,n)是将字符w1转变到w2所需要的基本字符编辑操
作最小次数(即删除, 新增, 调序和替换的总操作次数), max(m,n)是字 符w1和w2的最大字符
长度。 进一步计算 实体结构相似度。 将待匹配实体作为根节 点, 图谱中与根节 点相邻的子实
体节点为叶节点, 形成树状结构, 之后对叶节点计算相似度:
式中stru(w)表示子实体数量, |stru(w1)∪stru(w2)|表示子实体的总数量, N(w1,w2)
表示子实体名称相似度。
5.根据权利要求1所述的一种适用于配电网设备故障记录的知识图谱实体消岐融合方
法, 其特征在于: 所述 步骤4的具体步骤 包括:
根据步骤3计算得到的实体名称相似度和结构相似度, 进一 步计算实体的综合匹配度:
式中Q表示对于待 匹配实体和知识图谱中实体名称不完全相符时, 对实体名称相似度N权 利 要 求 书 1/2 页
2
CN 115238084 A
2(w1,w2)和结构相似度S(w1,w2)的加权求和。 权重Q的具体数值通过匹配准确率Pr和匹配完
整率Pa的调和平均值Pc计算得到。 取少量实体样 本分别进行人工匹配和自动匹配, Y1表示自
动匹配未成功的实体数量, Y2表示自动匹配 正确的实体数量, Y3表示自动匹配错误的实体数
量, 可得:
通过调整权重Q使Pc最大, 此时Q作为最优权重值用来计算综合匹配度, 并进行自动实体
匹配。 得到最优匹配结果后, 将相同实体融合, 对不同实体开辟新的实体分支以消除歧义,
完善配电网设备故障知识图谱。权 利 要 求 书 2/2 页
3
CN 115238084 A
3
专利 适用于配电网设备故障记录的知识图谱实体消岐融合方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 11:01:28上传分享