(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210700225.2
(22)申请日 2022.06.20
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 徐本峰 柴春光 吕雅娟 朱勇
(74)专利代理 机构 北京钲霖知识产权代理有限
公司 11722
专利代理师 李英艳 杨继成
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/35(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
多三元组抽取方法、 装置、 设备、 介质及产品
(57)摘要
本公开提供了一种多三元组抽取方法、 装
置、 设备、 介质及产品, 涉及深度学习、 知识图谱、
自然语言处理等人工智能技术领域。 具体实现方
案为: 获取文本语料, 并获取关系向量; 确定 所述
文本语料的头实体向量和尾实体向量; 对所述关
系向量、 所述头实体向量、 和所述尾实体向量进
行分类对齐, 得到所述文本语料的目标三元组。
通过本公开, 提升抽取文本语料中实体 之间关系
的准确率。
权利要求书3页 说明书10页 附图5页
CN 115168599 A
2022.10.11
CN 115168599 A
1.一种多三元组抽取 方法, 包括:
获取文本语料, 并获取关系向量;
确定所述文本语料的头实体向量和尾实体向量;
对所述关系向量、 所述头实体向量、 和所述尾实体向量进行分类对齐, 得到所述文本语
料的目标三元组。
2.根据权利要求1所述的方法, 还 包括:
对所述头实体向量和所述尾实体向量分别融合所述关系向量, 得到头实体增强向量和
尾实体增强向量;
其中, 所述对所述关系向量、 所述头实体向量、 和所述尾实体向量进行分类对齐, 得到
所述文本语料的目标三元组, 包括:
对所述关系向量、 所述头实体增强向量和所述尾实体增强向量, 进行分类对齐, 得到所
述文本语料的目标三元组。
3.根据权利要求2所述的方法, 还 包括:
对所述关系向量, 融合所述头实体向量、 所述尾实体向量以及所述文本语料的上下文
向量中的至少一种, 得到关系增强向量;
其中, 所述对所述关系向量、 所述实体增强向量和所述尾实体增强向量, 进行分类对
齐, 得到所述文本语料的目标三元组, 包括:
对所述关系增强向量、 所述头实体增强向量和所述尾实体增强向量, 进行分类对齐, 得
到所述文本语料的目标三元组。
4.根据权利要求2所述的方法, 其中, 对所述头实体向量和所述尾实体向量分别融合所
述关系向量, 得到 头实体增强向量和尾实体增强向量, 包括:
采用交叉注意力机制, 确定所述头实体向量和所述关系向量之间的第一交互关联关
系, 并基于所述第一交 互关联关系更新所述头实体向量, 得到 头实体增强向量;
采用交叉注意力机制, 确定所述尾实体向量和所述关系向量之间的第二交互关联关
系, 并基于所述第二交 互关联关系更新所述尾实体向量, 得到尾实体增强向量。
5.根据权利要求3所述的方法, 其中, 所述对所述关系向量, 融合所述头实体向量、 所述
尾实体向量以及所述文本语料的上 下文向量中的至少一种, 得到关系增强向量, 包括:
采用交叉注意力 机制, 分别确定所述关系向量与 所述头实体向量之间的第 三交互关联
关系、 所述关系向量与所述尾实体向量之 间的第四交互关联关系以及所述关系向量与所述
文本语料的上 下文向量之间的第五交 互关联关系;
合并所述第三交 互关联关系 、 所述第四交 互关联关系以及所述第五交 互关联关系;
基于合并后得到的交互关联关系得到关系增强向量更新所述关系向量, 得到关系增强
向量。
6.根据权利要求3所述的方法, 其中, 所述对所述关系增强向量、 所述实体增强向量和
所述尾实体增强向量, 进行分类对齐, 得到所述文本语料的目标三元组, 包括:
基于所述关系增强向量、 所述实体增强向量和所述尾实体增强向量分别确定三元组,
得到候选三元组集 合;
基于核心张量, 对所述候选三元组集合中的候选三元组进行张量分解, 以得到各个候
选三元组的分值计算;权 利 要 求 书 1/3 页
2
CN 115168599 A
2确定分值 最高的候选三元组, 作为所述文本语料的目标三元组。
7.一种多三元组抽取装置, 包括:
获取单元, 用于获取文本语料, 并获取关系向量;
编码单元, 用于确定所述文本语料的头实体向量和尾实体向量;
对齐单元, 用于对所述关系向量、 所述头实体向量、 和所述尾实体向量进行分类对齐,
得到所述文本语料的目标三元组。
8.根据权利要求7 所述的装置, 还 包括融合单 元, 所述融合单 元用于:
对所述头实体向量和所述尾实体向量分别融合所述关系向量, 得到头实体增强向量和
尾实体增强向量;
其中, 所述对齐单元采用如下方式对所述关系向量、 所述头实体向量、 和所述尾实体向
量进行分类对齐, 得到所述文本语料的目标三元组:
对所述关系向量、 所述头实体增强向量和所述尾实体增强向量, 进行分类对齐, 得到所
述文本语料的目标三元组。
9.根据权利要求8所述的装置, 所述融合单 元还用于:
对所述关系向量, 融合所述头实体向量、 所述尾实体向量以及所述文本语料的上下文
向量中的至少一种, 得到关系增强向量;
其中, 所述对齐单元采用 如下方式对所述关系向量、 所述实体增强向量和所述尾实体
增强向量, 进行分类对齐, 得到所述文本语料的目标三元组:
对所述关系增强向量、 所述头实体增强向量和所述尾实体增强向量, 进行分类对齐, 得
到所述文本语料的目标三元组。
10.根据权利要求8所述的装置, 其中, 所述融合单元采用如下方式对所述头实体向量
和所述尾实体向量分别融合所述关系向量, 得到 头实体增强向量和尾实体增强向量:
采用交叉注意力机制, 确定所述头实体向量和所述关系向量之间的第一交互关联关
系, 并基于所述第一交 互关联关系更新所述头实体向量, 得到 头实体增强向量;
采用交叉注意力机制, 确定所述尾实体向量和所述关系向量之间的第二交互关联关
系, 并基于所述第二交 互关联关系更新所述尾实体向量, 得到尾实体增强向量。
11.根据权利要求9所述的装置, 其中, 所述融合单元采用如下方式对所述关系向量, 融
合所述头实体向量、 所述尾实体 向量以及所述文本语料 的上下文向量中的至少一种, 得到
关系增强向量:
采用交叉注意力 机制, 分别确定所述关系向量与 所述头实体向量之间的第 三交互关联
关系、 所述关系向量与所述尾实体向量之 间的第四交互关联关系以及所述关系向量与所述
文本语料的上 下文向量之间的第五交 互关联关系;
合并所述第三交 互关联关系 、 所述第四交 互关联关系以及所述第五交 互关联关系;
基于合并后得到的交互关联关系得到关系增强向量更新所述关系向量, 得到关系增强
向量。
12.根据权利要求9所述的装置, 其中, 所述对齐单元采用如下方式对所述关系增强向
量、 所述实体增强向量和所述尾实体增强向量, 进 行分类对齐, 得到所述文本语料的目标三
元组:
基于所述关系增强向量、 所述实体增强向量和所述尾实体增强向量分别确定三元组,权 利 要 求 书 2/3 页
3
CN 115168599 A
3
专利 多三元组抽取方法、装置、设备、介质及产品
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:59:19上传分享