(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210615571.0
(22)申请日 2022.05.31
(71)申请人 腾讯科技 (深圳) 有限公司
地址 518057 广东省深圳市南 山区高新区
科技中一路腾讯大厦3 5层
(72)发明人 黄剑辉
(74)专利代理 机构 北京励诚知识产权代理有限
公司 11647
专利代理师 熊金凤
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 40/295(2020.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
G06F 16/955(2019.01)
(54)发明名称
实体链指方法、 装置、 设备及存 储介质
(57)摘要
本申请提供了一种实体链指方法、 装置、 设
备及存储介质, 该方法包括: 在知 识图谱中, 确定
与目标文本中的待链指实体关联的N个候选实体
的子图谱信息; 确定目标文本的语义信息, 以及N
个候选实体的子图谱信息中每个子图谱信息的
语义信息; 将目标文本的语义信息分别与每个子
图谱信息的语义信息进行交互 融合, 得到每个子
图谱信息的融合语义信息; 根据每个子图谱信息
的融合语义信息, 从N个候选实体中, 确定待链指
实体在知识图谱中的链指实体。 即本申请将目标
文本的语义信息与子图谱信息的语义信息进行
交互融合, 实现目标文本与子图谱信息的充分交
互融合, 进 而提高实体链指的准确性。
权利要求书3页 说明书20页 附图8页
CN 115129885 A
2022.09.30
CN 115129885 A
1.一种实体链指方法, 其特 征在于, 包括:
在知识图谱中, 确定与目标文本 中的待链指实体关联的N个候选实体的子图谱信 息, 所
述N为正整数;
确定所述目标文本的语义信息, 以及所述N个候选实体的子 图谱信息中每个子 图谱信
息的语义信息;
将所述目标文本的语义信 息分别与 所述每个子图谱信 息的语义信 息进行交互融合, 得
到每个所述子图谱信息的融合语义信息;
根据所述每个子图谱信 息的融合语义信 息, 从所述N个候选实体中, 确定所述待链指实
体在所述知识图谱中的链指实体。
2.根据权利要求1所述的方法, 其特征在于, 所述将所述目标文本的语义信 息分别与 所
述每个子图谱信息的语义信息进行交互融合, 得到所述每个子图谱信息的融合语义信息,
包括:
基于注意力 机制, 将所述目标文本的语义信 息分别与 所述每个子图谱信 息的语义信 息
进行交互融合, 得到所述每 个子图谱信息的融合语义信息 。
3.根据权利要求2所述的方法, 其特征在于, 所述基于注意力机制, 将所述目标文本的
语义信息分别与所述每个子图谱信息的语义信息进行 交互融合, 得到所述每个子图谱信息
的融合语义信息, 包括:
基于所述注意力机制, 对所述目标文本的语义信息进行处理, 得到所述目标文本的注
意力信息;
针对所述N个候选实体 中的第i个候选实体, 将所述目标文本的注意力信息, 与所述第i
个候选实体的子图谱信息的语义信息进行融合, 得到所述第i个候选实体的子图谱信息的
融合语义信息, 所述 i为小于或等于N的正整数。
4.根据权利要求3所述的方法, 其特征在于, 所述基于所述注意力机制, 对所述目标文
本的语义信息进行处 理, 得到所述目标文本的注意力 信息, 包括:
通过注意力模块中的映射参数矩阵对所述目标文本的语义信 息进行映射, 得到所述目
标文本的语义映射信息;
根据所述语义映射信息, 确定所述目标文本的注意力 信息。
5.根据权利要求4所述的方法, 其特征在于, 所述根据所述语义映射信息, 确定所述目
标文本的注意力 信息, 包括:
对所述语义映射信息进行归一 化处理, 得到归一 化后的语义映射信息;
根据所述归一 化后的语义映射信息, 确定所述目标文本的注意力 信息。
6.根据权利要求3 ‑5任一项所述的方法, 其特征在于, 所述将所述目标文本的注意力信
息, 与所述第i个候选实体的子图谱信息的语义信息进行融合, 得到所述第i个候选实体的
子图谱信息的融合语义信息, 包括:
将所述目标文本的注意力信息, 与所述第i个候选实体的子 图谱信息的语义信息进行
相乘, 得到所述第i个候选实体的子图谱信息的融合语义信息 。
7.根据权利要求1 ‑4任一项所述的方法, 其特征在于, 所述确定所述目标文本的语义信
息, 包括:
通过语言模块对所述目标文本进行语义编码, 得到所述目标文本的语义信息 。权 利 要 求 书 1/3 页
2
CN 115129885 A
28.根据权利要求1 ‑4任一项所述的方法, 其特征在于, 确定所述N个候选实体的子图谱
信息中每 个子图谱信息的语义信息, 包括:
针对所述N个候选实体中的第i个候选实体, 基于所述第i个候选实体的子图谱信息的
拓扑信息, 确定所述第i个候选实体的子图谱信息的语义信息, 所述i为小于或等于N的正整
数。
9.根据权利要求8所述的方法, 其特征在于, 所述基于所述第i个候选实体的子 图谱信
息的拓扑信息, 确定所述第i个候选实体的子图谱信息的语义信息, 包括:
将具有拓扑信 息的所述第 i个候选实体的子图谱信息, 输入图编码模块进行编码, 得到
所述第i个候选实体的子图谱信息的语义信息 。
10.根据权利要求1 ‑4任一项所述的方法, 其特征在于, 所述根据所述每个子 图谱信息
的融合语义信息, 从所述N个候选实体中, 确定所述待链指实体在所述知识图谱中的链指实
体, 包括:
针对所述N个候选实体中的第i个候选实体, 根据所述第i个候选实体的子图谱信息的
融合语义信息, 确定所述第i个候选实体与所述待链指实体的一致性信息, 所述一致性信息
用于指示所述第i个候选实体与所述待链指实体是否一 致, 所述i为小于或等于N的正整数;
根据所述N个候选实体中, 每个候选实体与所述待链指实体的一致性信息, 从所述N个
候选实体中, 确定所述待链指实体在所述知识图谱中的链指实体。
11.根据权利要求10所述的方法, 其特征在于, 所述根据所述第i个候选实体的子 图谱
信息的融合语义信息, 确定所述第i个候选实体与所述待链指实体的一 致性信息, 包括:
将所述第i个候选实体的子 图谱信息的融合语义信息, 与所述目标文本的语义信息进
行融合, 得到目标融合语义信息;
根据所述目标融合语义信息, 确定所述第i个候选实体与所述待链指实体的一致性信
息。
12.根据权利要求11所述的方法, 其特征在于, 所述将所述第i个候选实体的子 图谱信
息的融合语义信息, 与所述目标文本的语义信息进行融合, 得到目标融合语义信息, 包括:
将所述第i个候选实体的子 图谱信息的融合语义信息, 与所述目标文本的语义信息进
行拼接, 得到所述目标融合语义信息 。
13.根据权利要求11所述的方法, 其特征在于, 所述根据所述目标融合语义信息, 确定
所述第i个候选实体与所述待链指实体的一 致性信息, 包括:
通过分类模块对所述目标融合语义信息进行分类处理, 得到所述第i个候选实体与所
述待链指实体的一 致性信息。
14.根据权利要求1 ‑4任一项所述的方法, 其特征在于, 所述子 图谱信息的语义信息包
括所述子图谱中节点的语义信息和节点之间边的语义信息中的至少一个。
15.一种实体链指装置, 其特 征在于, 包括:
第一确定单元, 用于在知识图谱中, 确定与目标文本 中的待链指实体关联的N个候选实
体的子图谱信息, 所述 N为正整数;
第二确定单元, 用于确定所述目标文本的语义信息, 以及所述N个候选实体的子图谱信
息中每个子图谱信息的语义信息;
融合单元, 用于将所述目标文本的语义信 息分别与所述每个子图谱信 息的语义信 息进权 利 要 求 书 2/3 页
3
CN 115129885 A
3
专利 实体链指方法、装置、设备及存储介质
文档预览
中文文档
32 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共32页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:59:27上传分享