说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210555605.1 (22)申请日 2022.05.20 (71)申请人 北京明略昭辉科技有限公司 地址 100098 北京市海淀区北三环西路25 号27号楼二层2020室 (72)发明人 刘伟硕 王展 于皓 李犇 张杰  罗华刚  (74)专利代理 机构 北京华夏泰和知识产权代理 有限公司 1 1662 专利代理师 曾军 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/36(2019.01) G06N 5/02(2006.01) G06F 40/211(2020.01) (54)发明名称 实体类型识别方法、 装置、 计算机设备和存 储介质 (57)摘要 本申请涉及一种实体类型识别方法、 装置、 计算机设备和存储介质。 所述方法包括: 获取实 体序列, 实体序列包括多个待识别实体相应的句 法信息向量, 每个句法信息向量包含目标实体与 各个待识别实体 之间的句法关系, 目标实体为任 意一个待识别实体, 即每个待识别实体相应的句 法信息向量包含该待识别实体与其他待识别实 体之间的句法关系, 再将实体序列与目标实体对 应的知识信息向量拼接形成目标序列, 根据所述 目标序列确定所述目标 实体相应的实体类别, 由 于目标序列融合了目标实体相应的句法信息和 知识信息, 因此根据目标序列可准确确定目标 实 体对应的实体类别, 从而提高了实体类型识别的 准确率。 权利要求书2页 说明书8页 附图2页 CN 114880476 A 2022.08.09 CN 114880476 A 1.一种实体 类型识别方法, 其特 征在于, 所述方法包括: 获取实体序列, 其中, 所述实体序列包括多个待识别实体相应的句法信息向量, 所述句 法信息向量包含目标实体与各个所述待识别实体之 间的句法关系, 所述目标实体为任意一 个所述待识别实体; 获取所述目标实体对应的知识信息向量; 将所述实体序列 与所述知识信息向量 拼接形成目标序列; 根据所述目标序列确定所述目标实体相应的实体 类别。 2.根据权利要求1所述的方法, 其特 征在于, 所述获取实体序列, 包括: 获取文本序列, 其中, 所述文本序列包括所述多个待识别实体; 根据所述文本序列构建相应的句法依存树, 其中, 所述句法依存树包括多个子节点以 及各个所述子节点之间的句法关系, 每 个所述子节点对应一个所述待识别实体; 对所述句法依存树和所述文本序列进行向量初始化, 得到相应的句法向量树和文本向 量序列, 其中, 所述句法向量树包括多个 关系向量, 所述关系向量用于指示各个所述待识别 实体之间的句法关系, 所述文本向量序列包括多个所述待识别实体相应的初始向量; 根据所述句法向量树和所述文本向量序列, 确定各个所述待识别实体相应的所述句法 信息向量。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述句法向量树和所述文本向量 序列, 确定各个所述待识别实体相应的所述句法信息向量, 包括: 获取语义向量; 将所述句法向量树中根节点的初始向量更新为所述语义向量, 其中, 所述根节点用于 指示任意 一个所述待识别实体; 基于所述句法向量树确定所述目标实体与 各个所述待识别实体之间的指向路径, 所述 指向路径为所述待识别实体经 过至少一个所述关系向量指向所述目标实体; 根据各个所述指向路径上所述待识别实体的初始向量和所述关系向量, 确定所述目标 实体相应的所述句法信息向量。 4.根据权利要求3所述的方法, 其特征在于, 所述根据各个所述指向路径上所述待识别 实体的初始向量和所述关系向量, 确定所述目标实体相应的所述句法信息向量, 包括: 将各个所述指向路径上所述待识别实体的初始向量和所述关系向量相加, 得到句法向 量; 将所述句法 向量与所述目标实体相应的初始向量相加, 得到所述目标实体相应的所述 句法信息向量。 5.根据权利要求3所述的方法, 其特征在于, 所述获取所述目标实体对应的知识信 息向 量, 包括: 在语料知识图谱中获取与候选实体相关的知识信息, 其中, 所述候选实体为所述多个 待识别实体中除目标实体以外的实体; 将所述知识信息转换为相应的向量表示, 得到所述知识信息向量。 6.根据权利要求5所述的方法, 其特征在于, 所述将所述实体序列与 所述知识信 息向量 拼接形成目标序列, 包括: 添加所述语义向量至所述实体序列的首位, 并添加分隔标识向量至所述实体序列的末权 利 要 求 书 1/2 页 2 CN 114880476 A 2位, 得到拼接序列; 在所述拼接序列中所述分隔标识向量后拼接所述知识信息向量, 形成所述目标序列。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述目标序列确定所述目标实体 相应的实体 类别, 包括: 对所述目标序列进行深度 学习, 得到相应的输出序列, 其中, 所述输出序列包括各个所 述待识别实体对应的输出向量; 在所述输出序列中所述目标实体对应的输出向量中提取出特征向量, 其中, 所述特征 向量包括所述目标实体的首字向量和末字向量; 根据所述特 征向量确定所述目标实体属于各个分类 类别的分类概 率; 将数值最大的所述分类概 率相应所述分类 类别作为所述目标实体对应的实体 类别。 8.一种实体 类型识别装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取实体序列, 其中, 所述实体序列包括多个待识别实体相应的句法信 息向量, 所述句法信息 向量包含目标实体与各个所述待识别实体之间的句法关系, 所述 目 标实体为任意 一个所述待识别实体; 获取 所述目标实体对应的知识信息向量; 拼接模块, 用于将所述实体序列 与所述知识信息向量 拼接形成目标序列; 分类模块, 用于根据所述目标序列确定所述目标实体相应的实体 类别。 9.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至7中任一项所 述方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至7中任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114880476 A 3

.PDF文档 专利 实体类型识别方法、装置、计算机设备和存储介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 实体类型识别方法、装置、计算机设备和存储介质 第 1 页 专利 实体类型识别方法、装置、计算机设备和存储介质 第 2 页 专利 实体类型识别方法、装置、计算机设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:59:25上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。