说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211000193.1 (22)申请日 2022.08.19 (71)申请人 东软集团股份有限公司 地址 110179 辽宁省沈阳市 浑南新区新秀 街2号 (72)发明人 刘长虹 江泽浩  (74)专利代理 机构 北京英创嘉友知识产权代理 事务所(普通 合伙) 11447 专利代理师 张丽 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 40/295(2020.01) (54)发明名称 知识图谱构建方法、 装置、 存储介质及电子 设备 (57)摘要 本公开涉及一种知识图谱构建方法、 装置、 存储介质及电子设备。 该方法包括: 获取初始知 识图谱本体库, 初始知 识图谱本体库包括多个实 体数据结构, 实体数据结构 包括实体类别和实体 属性; 基于实体数据结构的实体类别和实体属 性, 从数据源中抽取得到对应实体类别、 且包括 实体属性的实体; 针对具有关联关系的第一实体 和第二实体, 基于业务域模型, 确定关联关系的 业务域属性; 根据抽取到的实体、 关联关系、 以及 关联关系的业务域属性生成知识图谱, 和/或, 根 据关联关系、 以及关联关系的业务域属性补全初 始知识图谱本体库中第一实体数据结构和第二 实体数据结构之间的关系, 得到目标知识图谱本 体库。 如此可降低目标知识图谱本体库或知 识图 谱的创建难度。 权利要求书2页 说明书13页 附图6页 CN 115391552 A 2022.11.25 CN 115391552 A 1.一种知识图谱构建方法, 其特 征在于, 所述方法包括: 获取初始知识图谱本体库, 所述初始知识图谱本体库包括多个预定义的实体数据结 构, 每一所述实体数据结构包括实体 类别和实体属性; 基于所述实体数据结构的实体类别和实体属性, 从数据源中抽取得到对应所述实体类 别、 且包括所述实体属性的实体; 针对抽取到的实体中具有关联关系的第一实体和第二实体, 基于业务域模型, 确定所 述关联关系的业务域属性, 所述第一 实体和所述第二 实体之间的所述关联关系是基于所述 数据源确定的; 根据抽取到的实体、 所述关联关系、 以及所述关联关系的业务域属性生成知识图谱, 和/或, 根据所述关联关系、 以及所述关联关系的业务域属性补 全所述初始知识图谱本体库 中第一实体数据结构和第二实体数据结构之间的关系, 得到目标知识图谱本体库。 2.根据权利要求1所述的方法, 其特征在于, 所述方法还包括通过如下方式生成所述业 务域模型: 从所述数据源中提取业 务主题词; 针对每一所述业务主题词, 将所述业务主题词以及所述业务主题词的预设权重转换为 词向量; 对所有的所述词向量进行聚类, 得到多个业 务簇; 为每一所述 业务簇分配业 务域ID; 根据每一所述 业务簇、 以及每一所述 业务簇的业 务域ID生成所述 业务域模型。 3.根据权利要求1所述的方法, 其特征在于, 所述针对抽取到的实体中具有关联关系的 第一实体和第二实体, 基于业 务域模型, 确定所述关联关系的业 务域属性, 包括: 从所述数据源中确定抽取 所述第一实体和所述第二实体的目标子数据源; 基于所述 业务域模型, 计算所述目标子数据源 对应的第一目标业 务域ID; 将所述第一目标业 务域ID确定为所述关联关系的业 务域属性。 4.根据权利要求3所述的方法, 其特征在于, 所述基于所述业务域模型, 计算所述目标 子数据源 对应的第一目标业 务域ID, 包括: 抽取所述目标子数据源中的目标业 务主题词; 确定所述目标业 务主题词对应的目标词向量; 从所述业务域模型中确定与所述目标词向量距离最小的目标业 务簇; 将所述目标业 务簇的业 务域ID作为所述第一目标业 务域ID。 5.根据权利要求1 ‑4中任一项所述的方法, 其特 征在于, 所述方法还 包括: 响应于用户的业 务操作, 确定所述 业务操作对应的第二目标业 务域ID; 从所述知识图谱中确定所述第 二目标业务域ID对应的子图谱, 所述子图谱中所述关联 关系的业 务域属性为所述第二目标业 务域ID; 基于所述子图谱执 行所述业务操作。 6.根据权利要求5所述的方法, 其特征在于, 所述响应于用户的业务操作, 确定所述业 务操作对应的第二目标业 务域ID, 包括: 确定所述用户的业 务操作权限信息; 根据所述 业务操作权限信息、 所述 业务域模型确定所述第二目标业 务域ID。权 利 要 求 书 1/2 页 2 CN 115391552 A 27.根据权利要求1 ‑4中任一项所述的方法, 其特 征在于, 所述方法还 包括: 响应于用户的业 务操作, 确定所述 业务操作对应的第二目标业 务域ID; 从所述目标知识图谱本体库中确定所述第二目标业务域ID对应的子本体库, 所述子本 体库中各 所述实体数据结构之间的关系的业 务域属性为所述第二目标业 务域ID; 从所述知识图谱中确定所述子 本体库对应的子图谱; 基于所述子图谱执 行所述业务操作。 8.一种知识图谱构建装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取初始知识图谱本体库, 所述初始知识图谱本体库包括多个预定义 的实体数据结构, 每一所述实体数据结构包括实体 类别和实体属性; 抽取模块, 用于基于所述实体数据结构的实体类别和实体属性, 从数据源中抽取得到 对应所述实体 类别、 且包括所述实体属性的实体; 第一确定模块, 用于针对抽取到的实体中具有关联关系的第一实体和第二实体, 基于 业务域模型, 确定所述关联关系的业务域属 性, 所述第一实体和所述第二实体之间的所述 关联关系是基于所述数据源确定的; 第一执行模块, 用于根据抽取到的实体、 所述关联关系、 以及所述关联关系的业务域属 性生成知识图谱, 和/或, 根据所述关联关系、 以及所述关联关系的业务域属 性补全所述初 始知识图谱本体库中第一 实体数据结构和 第二实体数据结构之 间的关系, 得到目标知识图 谱本体库。 9.一种非临时性计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被 处理器执行时实现权利要求1 ‑7中任一项所述方法的步骤。 10.一种电子设备, 其特 征在于, 包括: 存储器, 其上存 储有计算机程序; 处理器, 用于执行所述存储器 中的所述计算机程序, 以实现权利要求1 ‑7中任一项所述 方法的步骤。权 利 要 求 书 2/2 页 3 CN 115391552 A 3

.PDF文档 专利 知识图谱构建方法、装置、存储介质及电子设备

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 知识图谱构建方法、装置、存储介质及电子设备 第 1 页 专利 知识图谱构建方法、装置、存储介质及电子设备 第 2 页 专利 知识图谱构建方法、装置、存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:44:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。