说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210540830.8 (22)申请日 2022.05.17 (71)申请人 国网冀北电力有限公司电力科 学研 究院 地址 100045 北京市西城区复兴门外地 藏 庵南巷一 号 申请人 国家电网有限公司 (72)发明人 付雪姣 巩宇 张扬帆 王玙  杨伟新 王正宇 王枭枭  (74)专利代理 机构 北京三友知识产权代理有限 公司 11127 专利代理师 周永君 汤在彦 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/30(2020.01) (54)发明名称 新能源电场运行数据的知识图谱构建方法 及装置 (57)摘要 本发明提供了一种新能源电场运行数据的 知识图谱构建方法及装置, 新能源电场运行数据 的知识图谱构建方法包括: 抽取新能源电场运行 数据的实体、 实体属性及多个实体之间关系; 根 据多个实体之间的语义相似度、 所述实体、 所述 实体属性及所述多个实体 之间关系, 对所述实体 进行筛选; 根据筛选后的实体、 所述实体属性以 及所述多个实体之间关系构建所述运行数据的 知识图谱。 本发 明基于新能源场站运行数据建立 与其对应的知识图谱, 并通过知识抽取与融合技 术, 最终实现非结构化文本数据有效采集利用, 以及全口径数据的深度融合。 权利要求书2页 说明书13页 附图11页 CN 115048528 A 2022.09.13 CN 115048528 A 1.一种新能源电场运行 数据的知识图谱构建方法, 其特 征在于, 包括: 抽取新能源电场运行 数据的实体、 实体属性及多个实体之间关系; 根据多个实体之间的语义相似度、 所述实体、 所述实体属性及所述多个实体之间关系, 对所述实体进行筛 选; 根据筛选后的实体、 所述实体属性以及所述多个实体之间关系构建所述运行数据的知 识图谱。 2.根据权利要求1所述知识图谱构建方法, 其特征在于, 所述根据多个实体之间的语义 相似度、 所述实体、 所述实体属性及所述多个实体之间关系, 对所述实体进行筛 选, 包括: 根据所述实体、 所述实体属性及所述多个实体之间关系确定所述实体的特 征量; 根据所述特 征量的义原相似度以及义项相似度确定所述多个实体之间的语义相似度; 根据所述语义相似度对所述实体进行筛 选。 3.根据权利要求2所述知识图谱构建方法, 其特征在于, 所述根据 所述特征量的义原相 似度以及义项相似度确定所述多个实体之间的语义相似度, 包括: 根据所述特 征量的义原相似度以及义项相似度确定所述特 征量的文本相似度; 根据所述文本相似度确定所述多个实体之间的语义相似度。 4.根据权利要求3所述知识图谱构建方法, 其特 征在于, 还 包括: 根据所述多个义原之间的义原深度以及多个义原在义原结构上的最短路径长度确定 所述义原相似度。 5.根据权利要求 4所述知识图谱构建方法, 其特 征在于, 还 包括: 将所述义项的特征结构数据划分为独立义原描述式、 关系义原描述式以及符号义原描 述式; 根据所述独立义原描述式、 所述关系义原描述式以及所述符号义原描述式确定所述义 项相似度。 6.根据权利要求1所述知识图谱构建方法, 其特 征在于, 还 包括: 根据所述 运行数据的数据结构确定所述 运行数据的非结构化数据以及半结构化数据; 分别提取 所述非结构化数据以及所述半结构化数据中的元 数据; 根据所述元数据以及预先的约束条件将所述非结构化数据以及半结构化数据转化为 结构化数据。 7.根据权利要求6所述知识图谱构建方法, 其特 征在于, 还 包括: 对所述结构化数据对应的实体的属性 值进行归一 化处理。 8.根据权利要求7所述知识图谱构建方法, 其特征在于, 所述抽取新能源电场 运行数据 的实体、 实体属性及多个实体之间关系包括: 根据归一化之后的结构化数据的规则模板抽取所述实体、 所述实体属性以及所述实体 之间的关系。 9.一种新能源电场运行 数据的知识图谱构建装置, 其特 征在于, 包括: 数据抽取模块, 用于抽取新能源电场运行 数据的实体、 实体属性及多个实体之间关系; 实体筛选模块, 用于根据多个实体之间的语义相似度、 所述实体、 所述实体属性及所述 多个实体之间关系, 对所述实体进行筛 选; 知识图谱构建模块, 用于根据筛选后的实体、 所述实体属性以及所述多个实体之间关权 利 要 求 书 1/2 页 2 CN 115048528 A 2系构建所述 运行数据的知识图谱。 10.根据权利要求9所述知识图谱构建装置, 其特 征在于, 所述实体筛 选模块包括: 特征量确定单元, 用于根据所述实体、 所述实体属性及所述多个实体之间关系确定所 述实体的特 征量; 语义相似度确定单元, 用于根据所述特征量的义原相似度以及义项相似度确定所述多 个实体之间的语义相似度; 实体筛选单元, 用于根据所述语义相似度对所述实体进行筛 选。 11.根据权利要求10所述知识图谱构建装置, 其特征在于, 所述语义相似度确定单元包 括: 文本相似度确定单元, 用于根据所述特征量的义原相似度以及义项相似度确定所述特 征量的文本相似度; 语义相似度确定子单元, 用于根据 所述文本相似度确定所述多个实体之间的语义相似 度。 12.根据权利要求1 1所述知识图谱构建装置, 其特 征在于, 还 包括: 义原相似度确定模块, 用于根据所述多个义原之间的义原深度以及多个义原在义原结 构上的最短路径长度确定所述 义原相似度。 13.根据权利要求12所述知识图谱构建装置, 其特 征在于, 还 包括: 义项划分模块, 用于将所述义项的特征结构数据划分为独立义原描述式、 关系义原描 述式以及符号 义原描述式; 义项相似度确定模块, 用于根据所述独立义原描述式、 所述关系义原描述式以及所述 符号义原描述式确定所述 义项相似度。 14.根据权利要求9所述知识图谱构建装置, 其特 征在于, 还 包括: 非结构化确定模块, 用于根据 所述运行数据的数据 结构确定所述运行数据的非结构化 数据以及半结构化数据; 元数据提取模块, 用于分别提取所述非结构化数据以及所述半结构化数据中的元数 据; 非结构化转化模块, 用于根据 所述元数据以及预先的约束条件将所述非结构化数据以 及半结构化数据转 化为结构化数据。 15.根据权利要求14所述知识图谱构建装置, 其特 征在于, 还 包括: 实体归一 化模块, 用于对所述结构化数据对应的实体的属性 值进行归一 化处理。 16.根据权利要求15所述知识图谱构建装置, 其特 征在于, 所述数据抽取模块包括: 数据抽取单元, 用于根据归一化之后的结构化数据的规则模板抽取所述实体、 所述实 体属性以及所述实体之间的关系。 17.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 其特征在于, 所述处理器执行所述程序时实现权利要求1至8任一项所述新能源电 场运行数据的知识图谱构建方法的步骤。 18.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被 处理器执行时实现权利要求1至8任一项所述新能源电场运行数据的知识图谱构建方法的 步骤。权 利 要 求 书 2/2 页 3 CN 115048528 A 3

.PDF文档 专利 新能源电场运行数据的知识图谱构建方法及装置

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 新能源电场运行数据的知识图谱构建方法及装置 第 1 页 专利 新能源电场运行数据的知识图谱构建方法及装置 第 2 页 专利 新能源电场运行数据的知识图谱构建方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:00:07上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。