(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210642117.4
(22)申请日 2022.06.08
(71)申请人 网易 (杭州) 网络有限公司
地址 310052 浙江省杭州市滨江区长河街
道网商路59 9号4幢7层
(72)发明人 郑杰文
(74)专利代理 机构 北京润泽恒知识产权代理有
限公司 1 1319
专利代理师 冯俊峰
(51)Int.Cl.
G06F 16/36(2019.01)
G06K 9/62(2022.01)
(54)发明名称
知识图谱的处理方法、 装置、 电子设备及存
储介质
(57)摘要
本发明实施例提供了一种知识图谱的处理
方法、 装置、 电子设备及存储介质, 所述方法包
括: 获取目标领域的知 识图谱以及与目标领域对
应的问答数据; 对问答数据进行实体关系抽取,
获得目标三元组, 目标三元组包括目标头实体、
目标尾实体以及目标头实体与 目标尾实体之间
的目标实体关系; 将目标头实体和目标尾实体分
别与知识图谱进行比对, 则根据比对 结果和目标
实体关系对目标头实体和/或目标尾实体进行打
标, 获得目标头实体对应的第一实体类型和/或
目标尾实体对应的第二实体类型; 根据目标实体
关系与第一实体类型和/或第二实体类型, 将目
标头实体和/或目标尾实体添加至知识图谱。
权利要求书2页 说明书14页 附图4页
CN 115098693 A
2022.09.23
CN 115098693 A
1.一种知识图谱的处 理方法, 其特 征在于, 包括:
获取目标 领域的知识图谱以及与所述目标 领域对应的问答数据;
对所述问答数据进行实体关系抽取, 获得目标三元组, 所述目标三元组包括目标头实
体、 目标尾实体以及所述目标头实体与所述目标尾实体之间的目标实体关系;
将所述目标头实体和所述目标尾实体分别与所述知识图谱进行比对, 根据比对结果和
所述目标实体关系对所述 目标头实体和/或所述 目标尾实体进行打标, 获得所述 目标头实
体对应的第一实体 类型和/或所述目标尾实体对应的第二实体 类型;
根据所述目标实体关系与所述第一实体类型和/或所述第二实体类型, 将所述目标头
实体和/或所述目标尾实体添加至所述知识图谱。
2.根据权利要求1所述的方法, 其特征在于, 所述知识图谱包括若干种预设实体关系,
每一所述预设实体关系链接一头实体和一尾实体, 所述方法还 包括:
从所述知识图谱中获取各所述预设实体关系中头实体对应的头实体类型和尾实体对
应的尾实体 类型;
采用各所述预设实体关系以及对应的头实体类型和尾实体类型进行关系映射, 生成与
所述知识图谱 对应的实体 类型映射表。
3.根据权利要求2所述的方法, 其特征在于, 所述根据对比结果和所述目标实体关系 对
所述目标头实体和/或所述 目标尾实体进行打标, 获得所述 目标头实体对应的第一实体类
型和/或所述目标尾实体对应的第二实体 类型, 包括:
从所述实体类型映射表中获取与 所述目标实体关系相同的预设实体关系, 并获取所述
预设实体关系对应的目标头实体 类型以及目标尾实体 类型;
若所述比对结果为所述知识图谱中不包含所述目标头实体, 且所述目标头实体与 所述
目标头实体类型匹配成功, 则将所述目标头实体类型作为所述目标头实体对应的第一实体
类型;
若所述比对结果为所述知识图谱中不包含所述目标尾实体, 且所述目标尾实体与 所述
目标尾实体类型匹配成功, 则将所述目标头实体类型作为所述目标尾实体对应的第二实体
类型;
若所述比对结果为所述知识图谱中不包含所述目标头实体与 所述目标尾实体, 且所述
目标头实体与所述目标头实体类型匹配 成功, 以及所述目标尾实体与所述目标尾实体类型
匹配成功, 则将所述目标头实体类型作为所述目标头实体对应的第一实体类型以及将所述
目标头实体 类型作为所述目标尾实体对应的第二实体 类型。
4.根据权利要求1或3所述的方法, 其特征在于, 所述根据所述目标实体关系与所述第
一实体类型和/或所述第二 实体类型, 将所述目标头实体和/或所述目标尾实体添加至所述
知识图谱, 包括:
从所述知识图谱中查找与 所述第一实体类型对应的第 一目标实体, 并将所述目标头实
体与所述第一目标实体进行实体链接;
和/或, 从所述知识图谱中查找与所述第二实体类型对应的第二目标实体, 并将所述目
标尾实体与所述第二目标实体进行实体链接 。
5.根据权利要求4所述的方法, 其特征在于, 所述根据所述目标实体关系与 所述第一实
体类型和/或所述第二 实体类型, 将所述目标头实体和/或所述目标尾实体添加至所述知识权 利 要 求 书 1/2 页
2
CN 115098693 A
2图谱, 还包括:
若所述比对结果为所述知识图谱中不存在所述目标头实体和所述目标尾实体, 则采用
所述目标实体关系构建所述目标头实体指向所述目标尾实体的实体链接 。
6.根据权利要求1所述的方法, 其特征在于, 所述问答数据至少包括问答语句, 所述对
所述问答数据进行实体关系抽取, 获得目标三元组, 包括:
获取与所述知识图谱 对应的实体关系抽取模型;
将所述问答语句输入所述实体关系抽取模型进行实体关系识别, 若识别出所述问答语
句中存在三元组, 则输出与所述问答语句对应的至少一种目标三元组。
7.根据权利要求6所述的方法, 其特征在于, 所述实体关系抽取模型通过如下方式生
成:
获取与所述目标领域对应的训练语句, 以及从所述知识图谱中获取已有的实体关系集
合, 所述实体关系集 合包括所述知识图谱中已有实体之间的当前实体关系;
根据所述训练语句以及所述当前实体关系 进行模型训练, 生成与所述知识图谱对应的
实体关系抽取模型。
8.一种知识图谱的处 理装置, 其特 征在于, 包括:
数据获取模块, 用于获取目标 领域的知识图谱以及与所述目标 领域对应的问答数据;
三元组获取模块, 用于对所述问答数据进行实体关系抽取, 获得目标三元组, 所述目标
三元组包括目标头实体、 目标尾实体以及所述目标头实体与所述目标尾实体之 间的目标实
体关系;
实体类型确定模块, 用于将所述目标头实体和所述目标尾实体分别与 所述知识图谱进
行比对, 根据比对结果和所述 目标实体关系对所述 目标头实体和/或所述 目标尾实体进行
打标, 获得所述目标头实体对应的第一实体类型和/或所述 目标尾实体对应的第二实体类
型
图谱处理模块, 用于根据所述目标实体关系与所述第一实体类型和/或所述第二实体
类型, 将所述目标头实体和/或所述目标尾实体添加至所述知识图谱。
9.一种电子设备, 其特征在于, 包括处理器、 通信接口、 存储器和通信总线, 其中, 所述
处理器、 所述 通信接口以及所述存 储器通过 所述通信总线完成相互间的通信;
所述存储器, 用于存放计算机程序;
所述处理器, 用于执行存储器上所存放的程序时, 实现如权利要求1 ‑7任一项所述的方
法。
10.一种计算机可读存储介质, 其上存储有指令, 当由一个或多个处理器执行时, 使得
所述处理器执行如权利要求1 ‑7任一项所述的方法。权 利 要 求 书 2/2 页
3
CN 115098693 A
3
专利 知识图谱的处理方法、装置、电子设备及存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 11:00:43上传分享