说明:收录各省市地方标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210555605.1 (22)申请日 2022.05.20 (71)申请人 北京明略昭辉科技有限公司 地址 100098 北京市海淀区北三环西路25 号27号楼二层2020室 (72)发明人 刘伟硕 王展 于皓 李犇 张杰 罗华刚 (74)专利代理 机构 北京华夏泰和知识产权代理 有限公司 1 1662 专利代理师 曾军 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/36(2019.01) G06N 5/02(2006.01) G06F 40/211(2020.01) (54)发明名称 实体类型识别方法、 装置、 计算机设备和存 储介质 (57)摘要 本申请涉及一种实体类型识别方法、 装置、 计算机设备和存储介质。 所述方法包括: 获取实 体序列, 实体序列包括多个待识别实体相应的句 法信息向量, 每个句法信息向量包含目标实体与 各个待识别实体 之间的句法关系, 目标实体为任 意一个待识别实体, 即每个待识别实体相应的句 法信息向量包含该待识别实体与其他待识别实 体之间的句法关系, 再将实体序列与目标实体对 应的知识信息向量拼接形成目标序列, 根据所述 目标序列确定所述目标 实体相应的实体类别, 由 于目标序列融合了目标实体相应的句法信息和 知识信息, 因此根据目标序列可准确确定目标 实 体对应的实体类别, 从而提高了实体类型识别的 准确率。 权利要求书2页 说明书8页 附图2页 CN 114880476 A 2022.08.09 CN 114880476 A 1.一种实体 类型识别方法, 其特 征在于, 所述方法包括: 获取实体序列, 其中, 所述实体序列包括多个待识别实体相应的句法信息向量, 所述句 法信息向量包含目标实体与各个所述待识别实体之 间的句法关系, 所述目标实体为任意一 个所述待识别实体; 获取所述目标实体对应的知识信息向量; 将所述实体序列 与所述知识信息向量 拼接形成目标序列; 根据所述目标序列确定所述目标实体相应的实体 类别。 2.根据权利要求1所述的方法, 其特 征在于, 所述获取实体序列, 包括: 获取文本序列, 其中, 所述文本序列包括所述多个待识别实体; 根据所述文本序列构建相应的句法依存树, 其中, 所述句法依存树包括多个子节点以 及各个所述子节点之间的句法关系, 每 个所述子节点对应一个所述待识别实体; 对所述句法依存树和所述文本序列进行向量初始化, 得到相应的句法向量树和文本向 量序列, 其中, 所述句法向量树包括多个 关系向量, 所述关系向量用于指示各个所述待识别 实体之间的句法关系, 所述文本向量序列包括多个所述待识别实体相应的初始向量; 根据所述句法向量树和所述文本向量序列, 确定各个所述待识别实体相应的所述句法 信息向量。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述句法向量树和所述文本向量 序列, 确定各个所述待识别实体相应的所述句法信息向量, 包括: 获取语义向量; 将所述句法向量树中根节点的初始向量更新为所述语义向量, 其中, 所述根节点用于 指示任意 一个所述待识别实体; 基于所述句法向量树确定所述目标实体与 各个所述待识别实体之间的指向路径, 所述 指向路径为所述待识别实体经 过至少一个所述关系向量指向所述目标实体; 根据各个所述指向路径上所述待识别实体的初始向量和所述关系向量, 确定所述目标 实体相应的所述句法信息向量。 4.根据权利要求3所述的方法, 其特征在于, 所述根据各个所述指向路径上所述待识别 实体的初始向量和所述关系向量, 确定所述目标实体相应的所述句法信息向量, 包括: 将各个所述指向路径上所述待识别实体的初始向量和所述关系向量相加, 得到句法向 量; 将所述句法 向量与所述目标实体相应的初始向量相加, 得到所述目标实体相应的所述 句法信息向量。 5.根据权利要求3所述的方法, 其特征在于, 所述获取所述目标实体对应的知识信 息向 量, 包括: 在语料知识图谱中获取与候选实体相关的知识信息, 其中, 所述候选实体为所述多个 待识别实体中除目标实体以外的实体; 将所述知识信息转换为相应的向量表示, 得到所述知识信息向量。 6.根据权利要求5所述的方法, 其特征在于, 所述将所述实体序列与 所述知识信 息向量 拼接形成目标序列, 包括: 添加所述语义向量至所述实体序列的首位, 并添加分隔标识向量至所述实体序列的末权 利 要 求 书 1/2 页 2 CN 114880476 A 2位, 得到拼接序列; 在所述拼接序列中所述分隔标识向量后拼接所述知识信息向量, 形成所述目标序列。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述目标序列确定所述目标实体 相应的实体 类别, 包括: 对所述目标序列进行深度 学习, 得到相应的输出序列, 其中, 所述输出序列包括各个所 述待识别实体对应的输出向量; 在所述输出序列中所述目标实体对应的输出向量中提取出特征向量, 其中, 所述特征 向量包括所述目标实体的首字向量和末字向量; 根据所述特 征向量确定所述目标实体属于各个分类 类别的分类概 率; 将数值最大的所述分类概 率相应所述分类 类别作为所述目标实体对应的实体 类别。 8.一种实体 类型识别装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取实体序列, 其中, 所述实体序列包括多个待识别实体相应的句法信 息向量, 所述句法信息 向量包含目标实体与各个所述待识别实体之间的句法关系, 所述 目 标实体为任意 一个所述待识别实体; 获取 所述目标实体对应的知识信息向量; 拼接模块, 用于将所述实体序列 与所述知识信息向量 拼接形成目标序列; 分类模块, 用于根据所述目标序列确定所述目标实体相应的实体 类别。 9.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至7中任一项所 述方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至7中任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114880476 A 3
专利 实体类型识别方法、装置、计算机设备和存储介质
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 10:59:25
上传分享
举报
下载
原文档
(437.0 KB)
分享
友情链接
T-ZAQ 10105—2022 耐久型不干胶标签.pdf
GB 9706.204-2022 医用电气设备 第2-4部分:心脏除颤器的基本安全和基本性能专用要求.pdf
GB-T 17744-2020 石油天然气工业 钻井和修井设备.pdf
GB-T 19438.1-2004 禽流感病毒通用荧光 RT-PCR 检测方法.pdf
DB3305-T 216-2021 计量检定、校准数据交互规范 湖州市.pdf
GB-T 4622.1-2022 管法兰用缠绕式垫片 第1部分:PN系列.pdf
GB-T 41572-2022 脉冲激光时域主要参数测量方法.pdf
DB34-T 310016-2023 工业园区挥发性有机物光离子化传感器(PID)网格化监测技术规范 安徽省.pdf
数据分类分级管理制度.pdf
GB-T 26269-2010 网络入侵检测系统技术要求.pdf
ISO IEC 19770-11 2021 Information technology — IT asset management — Part 11 Requirements for bodies providing audit and certification of IT asset management systems.pdf
青藤云安全 ATT&CK 实战指南.pdf
GB-T 8769-2010 锆及锆合金棒材和丝材.pdf
GB-T 6499-2022 原棉含杂率试验方法.pdf
T-FJTEA 002—2023 小白茶林下栽培技术规程.pdf
GB-T 42137-2022 离散型智能制造能力建设指南.pdf
GB-T 36261-2018 建筑用节能玻璃光学及热工参数现场测量技术条件与计算方法.pdf
GB-T 41192-2021 岩土工程仪器 振弦式反力计.pdf
GB-T 34346-2017 基于风险的油气管道安全隐患分级导则.pdf
YD-T 4251-2023 电信运营商大数据安全管控分类分级技术要求.pdf
1
/
3
13
评价文档
赞助2.5元 点击下载(437.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。