说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210695552.3 (22)申请日 2022.06.17 (71)申请人 广东电网有限责任公司 地址 510000 广东省广州市越秀区东 风东 路757号 申请人 广东电网有限责任公司电力科 学研 究院 (72)发明人 陈鹏 孔力 金杨 邰彬 章坚  汪进锋 吕鸿 姚瑶 黄杨珏  王志华  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 陈志明 (51)Int.Cl. G06F 16/33(2019.01)G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 40/126(2020.01) G06F 40/194(2020.01) G06F 40/242(2020.01) G06F 40/279(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 7/00(2006.01) (54)发明名称 电力设备缺陷信息的处理方法、 装置、 设备 及存储介质 (57)摘要 本发明公开一种电力设备缺陷信息的处理 方法、 装置、 设备及存储介质, 通过利用预设的改 进BILSTM算法, 对结构化文本信息进行文本增 强, 得到目标结构化文本信息, 以保证缺陷文本 的质量, 从而提高后续构建的知识图谱的内容质 量; 再利用预设的改进BERT算法, 对非结构化文 本信息进行实体抽取, 得到目标实体信息, 以实 现针对具有异构性、 多样性和碎片化等特征的电 力设备缺陷文本的信息抽取, 同时利用改进BERT 算法能够提高实体抽取精度; 最后基于目标结构 化文本信息和目标实体信息, 构建电力设备缺陷 知识图谱, 从而以知识图谱 方式对电力设备缺陷 信息进行管 理, 能够有效提高知识管理的全面性 和可靠性, 为后续应用提高知识 支持。 权利要求书2页 说明书14页 附图5页 CN 115048492 A 2022.09.13 CN 115048492 A 1.一种电力设备缺陷信息的处 理方法, 其特 征在于, 包括: 获取电力设备缺陷信 息, 所述电力设备缺陷信 息包括结构化文本信 息和非结构化文本 信息; 利用预设的改进BILSTM算法, 对所述结构化文本信息进行文本增强, 得到目标结构化 文本信息; 利用预设的改进BERT算法, 对所述非结构化文本信息进行实体抽取, 得到目标实体信 息; 基于所述目标 结构化文本信息和目标实体信息, 构建电力设备缺陷知识图谱。 2.如权利 要求1所述的电力设备缺陷信息的处理方法, 其特征在于, 所述改进BILSTM算 法包括UCNN算法和第一BILSTM算法, 所述利用预设的改进BILSTM算法, 对所述结构化文本 信息进行文本增强, 得到目标 结构化文本信息, 包括: 对所述结构化文本信息进行预处理, 得到预处理后的结构化文本信息, 所述预处理包 括文本分词、 去停用词和同义词替换; 利用所述UCNN算法, 对预处理后的所述结构化文本信息进行词语特征提取, 得到预处 理后的所述结构化文本信息的词语特 征; 利用所述第一BILSTM算法, 根据所述词语特征, 对预处理后的所述结构化文本信息进 行文本分类, 得到所述目标 结构化文本信息 。 3.如权利要求2所述的电力设备缺陷信息的处理方法, 其特征在于, 所述UCNN算法的表 达式为: 其中, o(u, v)为所述词语特征, 为非共享卷积核, wi, j为 中在(i, j)处的权 重值, Kr×s表示预处 理后的所述结构化文本信息对应的词向量 集, ku‑i, v‑j为Kr×s中的词向量。 4.如权利要求1所述的电力设备缺陷信息的处理方法, 其特征在于, 所述改进BERT算法 包括BERT算法、 第二BILSTM算法和CRF算法, 所述利用预设的改进BERT算法, 对所述非结构 化文本信息进行实体抽取, 得到目标实体信息, 包括: 利用所述BERT算法, 对所述非结构化文本信息进行编码, 得到 字向量和位置向量; 利用所述第二BILSTM算法, 根据字向量和所述位置向量, 对所述非结构化文本信息进 行上下文语义特 征提取, 得到所述非结构化文本信息的上 下文语义特 征; 利用所述CRF算法, 根据 所述上下文语义特征, 对所述非结构化文本信息进行命名实体 识别, 得到所述非结构化文本信息的实体标签; 根据所述实体标签, 对所述非结构化文本信息进行实体抽取, 得到所述目标实体信息 。 5.如权利要求4所述的电力设备缺陷信 息的处理方法, 其特征在于, 所述实体标签包括 设备标签和位置标签, 所述目标实体信息包括缺陷设备名称、 缺陷位置名称、 设备缺陷信息 和缺陷处理策略, 所述根据所述 实体标签, 对所述非结构化文本信息进 行实体抽取, 得到所 述目标实体信息, 包括: 根据所述设备标签, 在所述非结构化文本信息中, 抽取与所述设备标签对应的缺陷设 备名称;权 利 要 求 书 1/2 页 2 CN 115048492 A 2根据所述缺陷设备名称对应的所述位置标签, 在所述非结构化文本信息中, 抽取与所 述位置标签对应的缺陷位置名称; 根据所述缺陷位置名称, 在所述非结构化文本信息中, 抽取与所述缺陷位置名称对应 的设备缺陷信息, 所述设备缺陷信息包括设备缺陷等级、 设备缺陷原因、 设备缺陷现象和设 备缺陷类型; 根据所述设备缺陷现象, 在所述非结构化文本信息中, 抽取与所述设备缺陷现象对应 的缺陷处 理策略。 6.如权利要求1所述的电力设备缺陷信 息的处理方法, 其特征在于, 所述基于所述目标 结构化文本信息和目标实体信息, 构建电力设备缺陷知识图谱, 包括: 利用基于相似性传播的知识融合策略, 对所述目标结构化文本信 息和所述目标实体信 息进行知识融合, 得到目标文本实体信息; 基于Neo4j数据库的知识存储策略, 对所述目标文本实体信息进行知识存储, 以构 建所 述电力设备缺陷知识图谱。 7.如权利要求6所述的电力设备缺陷信 息的处理方法, 其特征在于, 所述基于相似性传 播的知识融合策略包括相似度算法, 所述相似度算法用于对所述目标结构化文本信息和所 述目标实体信息中的实体进行语义匹配, 所述相似度算法为: 其中, Yi表示第i个实体的向量, Ys表示第s个实体的向量。 8.一种电力设备缺陷信息的处 理装置, 其特 征在于, 包括: 获取模块, 用于获取电力设备缺陷信息, 所述电力设备缺陷信息包括结构化文本信息 和非结构化文本信息; 增强模块, 用于利用预设的改进BILSTM算法, 对所述结构化文本信息进行文本增强, 得 到目标结构化文本信息; 抽取模块, 用于利用预设的改进BERT算法, 对所述非结构化文本信息进行实体抽取, 得 到目标实体信息; 构建模块, 用于基于所述目标结构化文本信息和目标实体信息, 构建电力设备缺陷知 识图谱。 9.一种计算机设备, 其特征在于, 包括处理器和存储器, 所述存储器用于存储计算机程 序, 所述计算机程序被所述处理器执行时实现如权利要求 1至7任一项 所述的电力设备缺陷 信息的处 理方法。 10.一种计算机可读存储介质, 其特征在于, 其存储有计算机程序, 所述计算机程序被 处理器执行时实现如权利要求1至7任一项所述的电力设备缺陷信息的处 理方法。权 利 要 求 书 2/2 页 3 CN 115048492 A 3

.PDF文档 专利 电力设备缺陷信息的处理方法、装置、设备及存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 电力设备缺陷信息的处理方法、装置、设备及存储介质 第 1 页 专利 电力设备缺陷信息的处理方法、装置、设备及存储介质 第 2 页 专利 电力设备缺陷信息的处理方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:00:34上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。