说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210649330.8 (22)申请日 2022.06.08 (71)申请人 工银科技有限公司 地址 071700 河北省保定市中国 (河北) 自 由贸易试验区雄安片区容城县雄安市 民服务中心企业办公区C栋第1层111 单元 申请人 中国工商银行股份有限公司 (72)发明人 汪美玲  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 赵婷 (51)Int.Cl. G06F 40/134(2020.01) G06F 40/126(2020.01)G06F 16/36(2019.01) G06F 16/335(2019.01) G06F 16/332(2019.01) (54)发明名称 知识图谱问答问句实体链接方法、 装置、 设 备及介质 (57)摘要 本公开提供了一种知识图谱问答问句实体 链接方法, 可 以应用于人工智 能技术领域。 该方 法包括: 获取用户问句; 提取用户问句中的实体 提及; 从知识图谱中检索出与实体提及匹配的T 个候选实体; 获取T个候选实体中每个候选实体 的实体差异化编码表示, 其中, 实体差异化编码 表示是基于候选实体的编码表 示与候选实体的N 个相似实体的编码表示的差异得到的; 基于实体 提及的编码表 示与T个候选实体中每个候选实体 的实体差异化编码表示, 计算实体提及与每个候 选实体的第二相似度; 以及确定T个候选实体中 第二相似度最大的候选实体, 为实体提及的链接 实体。 本公开还提供了一种知识图谱问答问句实 体链接装置、 设备、 存 储介质和程序 产品。 权利要求书3页 说明书19页 附图10页 CN 114880991 A 2022.08.09 CN 114880991 A 1.一种知识图谱问答问句实体链接方法, 包括: 获取用户问句; 提取所述用户问句中的实体提及, 所述实体提及为知识图谱中的实体在所述用户问句 中的字符串表述; 从所述知识图谱中检索出与所述实体提及匹配的T个候选实体, 其中, T为大于1的整 数; 获取所述T个候选实体 中每个候选实体的实体差异化编码表示; 其中, 所述实体差异化 编码表示是基于所述候选实体的编 码表示与所述候选实体的N个相似实体的编 码表示的差 异得到的, 其中, 所述N个相似实体为所述知识图谱中与所述候选实体的第一相似度满足预 设条件的N个实体, 其中, N 为大于或等于1的整数; 获取所述实体提及的编码表示; 基于所述实体提及的编码表示与 所述T个候选实体中每个候选实体的所述实体差异化 编码表示, 计算所述实体提及与每 个候选实体的第二相似度; 以及 确定所述T个候选实体中所述第二相似度最大的候选实体, 为所述实体提及的链接实 体。 2.根据权利要求1所述的方法, 其中, 所述获取所述T个候选实体中每个候选实体的实 体差异化编码表示包括: 从所述知识图谱中获取 所述候选实体对应的所述 N个相似实体; 获取所述候选实体和所述 N个相似实体各自的编码表示; 以及 基于所述候选实体的编码表示分别与所述N个相似实体的编码表示的差异信息, 得到 所述实体差异化编码表示。 3.根据权利要求2所述的方法, 其中, 所述基于所述候选实体的编码表示分别与所述N 个相似实体的编码表示的差异信息, 得到所述实体差异化编码表示包括: 计算所述候选实体的编码表示对应的向量与所述N个相似实体中每个相似实体的编码 表示对应的向量的差, 得到与每个相似实体对应的表示差 向量; 其中, 与所述N个相似实体 一一对应得到N个所述表示差向量; 以及 基于N个所述表示差向量, 得到所述实体差异化编码表示。 4.根据权利要求3所述的方法, 其中, 所述基于N个所述表示差向量, 得到所述实体差异 化编码表示包括: 将N个所述表示差向量按位求平均, 得到平均表示差向量, 其中, 以所述平均表示差向 量作为所述实体差异化编码表示。 5.根据权利要求3所述的方法, 其中, 所述基于N个所述表示差向量, 得到所述实体差异 化编码表示包括: 利用第二编码器编码所述用户问句的字符串, 得到所述用户问句的编码表示矩阵; 通过每个所述表示差向量和所述用户问句的编码表示矩阵相乘再加和, 得到所述表示 差向量与所述用户问句的匹配度; 归一化处理N个所述表示差向量各自对应的所述匹配度, 得到与每个所述表示差向量 对应的权 重系数; 通过所述候选实体的编码表示对应的向量, 减去利用所述权重系数对与所述表示差向权 利 要 求 书 1/3 页 2 CN 114880991 A 2量差对应的相似实体的编 码表示进行权重调节后的向量, 得到用户交互表示差向量; 其中, 与所述N个相似实体一 一对应得到N个所述用户交 互表示差向量; 以及 对N个所述用户交互表示差向量按位求平均, 得到平均交互表示差向量, 其中, 以所述 平均交互表示差向量作为所述实体差异化编码表示。 6.根据权利要求2所述的方法, 其中, 所述从所述知识图谱中获取所述候选实体对应的 所述N个相似实体包括: 基于所述候选实体的编码表示与 所述知识图谱中的其他实体的编码表示, 计算所述候 选实体与所述知识图谱中的其 他实体的所述第一相似度; 以及 从所述知识图谱中选择所述第一相似度满足所述预设条件的N个实体, 得到所述候选 实体对应的所述 N个相似实体。 7.根据权利要求1所述的方法, 其中, 在所述获取用户问句之前, 所述方法还 包括: 利用第一文本编码器编码所述知识图谱中的实体, 得到所述知识图谱中的实体的编码 表示。 8.根据权利要求1所述的方法, 其中, 所述提取所述用户问句中的实体提及还包括: 利用全连接神经网络预测所述用户问句 中的所述实体提及 及其预测概 率; 所述方法还 包括: 归一化处理与所述T个候选实体分别对应的T个所述第二相似度, 得到表征所述T个候 选实体中每 个候选实体链接正确的链接概 率; 以及 在所述实体提及的预测概率与所述实体提及的链接实体的链接概率的乘积大于概率 阈值时, 确定所述实体提及 及其链接实体的链接关系可信。 9.根据权利要求1所述的方法, 其中, 所述从所述知识图谱中检索出与 所述实体提及匹 配的T个候选实体包括: 基于所述实体提及的字符串与所述知识图谱中的实体的名称字符串的对比, 计算匹配 分数; 以及 从所述知识图谱中筛 选出所述匹配分数最高的T个实体, 以得到所述T个候选实体。 10.根据权利要求1所述的方法, 其中, 所述获取 所述实体提及的编码表示包括: 利用第二编码器编码所述用户问句的字符串, 得到所述用户问句的编码表示矩阵; 从所述用户问句的编码表示矩阵中, 截取与所述实体提及的字符串所处位置范围对应 的向量, 得到所述实体提及对应的编码矩阵; 以及 对所述实体提及对应的编码矩阵中的向量按位求平均, 得到所述实体提及的编码表 示。 11.根据权利要求1所述的方法, 其中, 所述方法还 包括: 利用第一文本编码器编码所述知识图谱中的实体, 得到所述知识图谱中的实体的编码 表示; 其中, 所述第一相似度为基于实体的编码表示的向量计算得到的; 利用第二文本编码器编码所述用户问句的字符串, 得到所述用户问句的编码表示矩 阵; 其中, 所述 实体提及的编码表示是基于从所述用户问句的编码表示矩阵中, 截取与所述 实体提及的字符串在所述用户问句中的位置范围对应的向量而得到的; 以及 利用全连接神经网络预测所述用户问句中的所述实体提及;权 利 要 求 书 2/3 页 3 CN 114880991 A 3

.PDF文档 专利 知识图谱问答问句实体链接方法、装置、设备及介质

文档预览
中文文档 33 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共33页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 知识图谱问答问句实体链接方法、装置、设备及介质 第 1 页 专利 知识图谱问答问句实体链接方法、装置、设备及介质 第 2 页 专利 知识图谱问答问句实体链接方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:00:52上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。