说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210855091.1 (22)申请日 2022.07.20 (65)同一申请的已公布的文献号 申请公布号 CN 115080705 A (43)申请公布日 2022.09.20 (73)专利权人 神州医疗科技股份有限公司 地址 100080 北京市海淀区北四环西路6 6 号16层1901室 (72)发明人 朱宁 许娟 杨雅婷 宋佳祥  白焜太 刘硕  (74)专利代理 机构 北京星通盈泰知识产权代理 有限公司 1 1952 专利代理师 夏晶 (51)Int.Cl. G06F 16/33(2019.01)G06F 16/36(2019.01) G06F 40/211(2020.01) G06F 40/216(2020.01) G06F 40/295(2020.01) (56)对比文件 CN 113901825 A,202 2.01.07 US 2011251984 A1,201 1.10.13 CN 113779260 A,2021.12.10 审查员 余益明 (54)发明名称 基于双模型增强的垂直领域关系抽取方法 及系统 (57)摘要 本发明涉及信息处理技术领域, 且公开了基 于双模型增强的垂直领域关系抽取方法及系统, 本发明采用原始文本的实体信息配合设置双模 型的方式, 利用从垂直领域现有的知识图谱中的 提取的属性信息文本进行关系抽取, 最后结合双 模型的关系抽取, 能够在少量样 本结合现有的知 识图谱情况下, 共同得出更准确的结果, 节省大 量的预训练计算资源。 权利要求书2页 说明书6页 附图2页 CN 115080705 B 2022.11.11 CN 115080705 B 1.基于双模型增强的垂直领域关系抽取 方法, 其特 征在于, 包括: 采集原始文本, 基于所述原 始文本抽取实体信息; 基于所述实体信 息嵌入所述原始文本获取第 一句子输入序列; 基于所述实体信 息在知 识图谱中提取属性信息, 并将所述实体信息与属性信息拼接获取第二句子 输入序列; 设置主模型和辅模型, 将所述第一句子输入序列输入主模型, 将所述第二句子输入序 列输入辅模型, 基于主模型和辅模型的输出 结果加权并获取关系概 率值; 基于主模型的输出结果预测主关系类型, 基于辅模型的输出结果预测辅关系类型, 基 于所述主关系类型、 辅关系类型和关系概 率值获取最终预测结果; 所述采集原 始文本, 基于所述原 始文本抽取实体信息, 包括: 采集原始文本, 提取所述原始文本中的实体头、 实体尾和实体跨度, 并基于所述实体 头、 实体尾和实体跨度获取实体跨度信息; 基于所述实体跨度信息获取实体 类型信息; 所述基于所述实体信 息嵌入所述原始文本获取第 一句子输入序列; 基于所述实体信 息 在知识图谱中提取属 性信息, 并将所述实体信息与属 性信息拼接获取第二句 子输入序列, 包括: 将实体跨度信息和实体 类型信息嵌入所述原 始文本获取第一句子 输入序列; 基于实体头和实体尾在知识图谱中提取属性信息, 并将实体跨度信息、 实体类型信息 和属性信息拼接获取第二句子 输入序列。 2.根据权利要求1所述的方法, 其特征在于, 所述设置主模型和辅模型, 将所述第一句 子输入序列输入主模型, 将所述第二句 子输入序列输入辅模型, 基于主模型和辅模型 的输 出结果加权并获取关系概 率值, 包括: 设置主模型和辅模型; 将所述第一句子 输入序列输入主模型获取主实体对向量; 将所述第二句子 输入序列输入辅模型获取辅实体对向量; 基于所述主实体对向量和辅实体对向量加权并获取关系概 率值。 3.根据权利要求2所述的方法, 其特征在于, 所述基于主模型的输出结果预测主关系类 型, 基于辅模型的输出结果预测辅 关系类型, 基于所述主关系类型、 辅 关系类型和关系概率 值获取最终预测结果, 包括: 基于主实体对向量预测主关系类型, 基于 辅实体对向量预测辅关系类型; 基于所述主关系类型、 辅关系类型和关系概 率值获取最终预测结果。 4.基于双模型增强的垂直领域关系抽取系统, 其特 征在于, 包括: 原始文本处 理模块, 用于采集原 始文本, 基于所述原 始文本抽取实体信息; 句子输入序列获取模块, 用于基于所述实体信 息嵌入所述原始文本获取第 一句子输入 序列; 基于所述实体信息在知识图谱中提取属 性信息, 并将所述实体信息与属 性信息拼接 获取第二句子 输入序列; 关系概率值计算模块, 用于设置主模型和辅模型, 将所述第一句子输入序列输入主模 型, 将所述第二句 子输入序列输入辅模型, 基于主模型和辅模型 的输出结果加权并获取关 系概率值; 最终关系抽取模块, 用于基于主模型的输出结果预测主关系类型, 基于辅模型的输出权 利 要 求 书 1/2 页 2 CN 115080705 B 2结果预测辅关系类型, 基于所述主关系类型、 辅关系类型和关系概 率值获取最终预测结果; 所述原始文本处 理模块, 包括: 实体跨度信 息获取子模块, 用于采集原始文本, 提取所述原始文本中的实体头、 实体尾 和实体跨度, 并基于所述实体头、 实体 尾和实体跨度获取实体跨度信息; 实体类型信息获取子模块, 用于基于所述实体跨度信息获取实体 类型信息; 所述句子 输入序列获取模块, 包括: 第一序列获取子模块, 用于将 实体跨度信 息和实体类型信 息嵌入所述原始文本获取第 一句子输入序列; 第二序列获取子模块, 用于基于实体头和实体尾在知识图谱中提取属性信息, 并将实 体跨度信息、 实体 类型信息和 属性信息拼接获取第二句子 输入序列。 5.根据权利要求 4所述的系统, 其特 征在于, 所述关系概 率值计算模块, 包括: 双模型设置 子模块, 用于设置主模型和辅模型; 主实体对向量获取子模块, 用于将所述第 一句子输入序列输入主模型获取主实体对向 量; 辅实体对向量获取子模块, 用于将所述第 二句子输入序列输入辅模型获取辅实体对向 量; 关系概率值计算子模块, 用于基于所述主实体对向量和辅实体对向量加权并获取关系 概率值。 6.根据权利要求5所述的系统, 其特 征在于, 所述 最终关系抽取模块, 包括: 关系类型预测子模块, 用于基于主实体对向量预测主关系类型, 基于辅实体对向量预 测辅关系类型; 最终预测结果抽取子模块, 用于基于所述主关系类型、 辅关系类型和关系概率值获取 最终预测结果。权 利 要 求 书 2/2 页 3 CN 115080705 B 3

.PDF文档 专利 基于双模型增强的垂直领域关系抽取方法及系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于双模型增强的垂直领域关系抽取方法及系统 第 1 页 专利 基于双模型增强的垂直领域关系抽取方法及系统 第 2 页 专利 基于双模型增强的垂直领域关系抽取方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:57:54上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。