说明:收录各省市地方标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210841108.8 (22)申请日 2022.07.18 (71)申请人 中国人民解 放军国防科技大 学 地址 410003 湖南省长 沙市开福区德雅路 109号 (72)发明人 陈洪辉 王梦如 江苗 蔡飞 舒振 郑建明 邵太华 张鑫 宋城宇 (74)专利代理 机构 北京风雅颂专利代理有限公 司 11403 专利代理师 曾志鹏 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/126(2020.01)G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于规则知识增强的数据关系抽取方法及 相关装置 (57)摘要 本申请提供一种基于规则知识增强的数据 关系抽取方法及相关装置; 该法包括: 根据实例 的头实体和尾实体的结构化知识图谱, 确定头实 体类型集和尾实体类型集, 并输入图神经网络编 码器, 基于实例的关系得到对应的头实体原型和 尾实体原型; 从各实例的非结构化知识文本中确 定关系描述, 将该实例和该关系描述输入至文本 编码器, 得到实例表示和关系描述表示; 通过将 实例表示和关系描述表示相互作用得到上下文 语义和上下文语义原型; 分别构建头实体、 尾实 体类型和上下文语义属于关系的概率关系, 据此 确定交叉熵损失函数、 实例级对比学习损失函数 和类别级对比学习损失函数; 将三者进行结合得 到目标函数, 并用于以对待抽取的数据集进行数 据关系抽取。 权利要求书5页 说明书19页 附图3页 CN 115186064 A 2022.10.14 CN 115186064 A 1.一种基于规则知识增强的数据关系抽取 方法, 其特 征在于, 包括: 根据预置的支持集中各实例的头实体和尾实体的结构化知识图谱, 分别确定该实例的 头实体类型集和尾实体类型集, 将该头实体类型集和该尾实体类型集输入 预置的图神经网 络编码器, 并基于该实例的关系, 分别得到该头实体和该尾实体对应的头实体原型和尾实 体原型; 从各所述实例的非结构化知识文本中, 确定该实例的关系描述, 将该实例和该关系描 述输入至预置的文本编码器, 得到该实例的实例表示和关系描述表示; 通过将该实例表示 和该关系描述表示相互作用得到该实例的上 下文语义和上 下文语义原型; 对于各所述实例, 基于所述头实体原型、 所述尾实体原型和所述上下文语义原型, 分别 构建所述头实体、 所述尾实体类型和所述上下文语义属于所述关系的概率关系, 并根据所 述概率关系确定交叉熵损失函数; 基于该实例的实例表示和其他实例的实例表示, 确定实例级对比学习损 失函数, 基于 所述上下文语义原型和获取的所述关系的关系描述原型, 确定类别级对比学习损失函数; 结合所述交叉熵损失函数、 所述实例级对比学习损失函数和所述类别级对比学习损失 函数, 得到目标函数, 将所述目标函数用于 关系抽取模型中, 以对待抽取的数据进 行数据集 关系抽取。 2.根据权利要求1所述的方法, 其特征在于, 所述将该头实体类型集和该尾实体类型集 输入预置的图神经网络编码器, 并基于该实例的关系, 分别得到该头实体和该尾实体对应 的头实体原型和尾实体原型, 包括: 将该头实体类型集中的各头实体类型和该尾实体类型中的各尾实体类型分别输入至 所述图神经网络编码器, 并得到如下 所示的头实体 类型表示和尾实体 类型表示: 其中, f1(*)表示图神经网络编码器的映射方式; 为头实体 类型表示, Ch表示头实体 类型集, c1表示Ch中的任意类型; 为尾实体 类型表示, Ct表示尾实体 类型集, c2表示Ct中的任意类型; 分别利用所述头实体类型表示和所述尾实体类型表示, 构建如下所示的所述头实体原 型和所述尾实体原型: 权 利 要 求 书 1/5 页 2 CN 115186064 A 2其中, r表示该实例的任意关系, Sr表示关于该关系r的实例集合, K表示Sr中具备的实例 数量; 表示所述头实体原型, eh表示头实体, 表示所述尾实体原型, et表示尾实体。 3.根据权利要求1所述的方法, 其特征在于, 所述通过将该实例表示和该关系 描述表示 相互作用得到该实例的上 下文语义和上 下文语义原型, 包括: 将所述头实体和所述尾实体以向量的形式连接, 得到如下 所示的实体表示: 其中, 为所述实体表示, R表示全部所述关系对应的全部关系类型, d表示所述文本 编码器的嵌入维度; 采取如下所示的第一交互方式, 将该实例表示和该关系描述表示进行相互作用, 得到 精细化实例表示: 其中, 为所述细化实例表示, 角标ar表示关于所述关系 r的所述关系描述, αj表示多 个实例权重中的第j个实例权重; 为所述实例表示, 为所述关系描述表示, sum(*)表 示行求和函数, [j:]表示矩阵的第j行, 角标T表示对矩阵执 行转置的操作; 采取如下所示的第二交互方式, 将该实例表示和该关系描述表示进行相互作用, 得到 实例感知关系描述表示: 其中, 为所述实例感知关系描述表示, βj表示多个注意权 重中的第j个注意权 重; 利用所述精细化实例表示和所述实例感知关系描述表示, 采用 如下所述的公式, 确定 上下文语义: 其中, 为所述上 下文语义表示, Mul(*)表示多层感知器; 采用如下 所述的公式表示所述上 下文语义原型: 其中, 表示所述上 下文语义原型。权 利 要 求 书 2/5 页 3 CN 115186064 A 3
专利 基于规则知识增强的数据关系抽取方法及相关装置
文档预览
中文文档
28 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 10:59:11
上传分享
举报
下载
原文档
(1.3 MB)
分享
友情链接
ISO 11551 2019 Optics and photonics — Lasers and laser-related equipment — Test method for absorptance of optical laser components.pdf
GB-T 34766-2017 矿物源总腐殖酸含量的测定.pdf
GB-T 3782-2016 乙炔炭黑.pdf
T ZJHIA XX-2014 医疗健康数据分类分级规范.pdf
DB-T 64-2016 强震动观测技术规程.pdf
GB-T 28458-2020 信息安全技术 网络安全漏洞标识与描述规范.pdf
GB-T 40711.2-2021 乘用车循环外技术-装置节能效果评价方法 第2部分:怠速起停系统.pdf
GB-T 34934-2017 机械电气安全 安全相关设备中的通信系统使用指南.pdf
DB5133-T 63-2022 牦牛标准化育肥场布局及圈舍建设规范 甘孜藏族自治州.pdf
腾讯 银行业数据安全体系建设指南 2020.pdf
ISO 31101 2023 Robotics — Application services provided by service robots — Safety man.pdf
清华大学自动化系:2023预训练大模型与医疗:从算法研究到应用.pdf
GB-T 20201-2006 灌溉用聚乙烯(PE)压力管机械连接管件.pdf
JY-T 0590-2020 旋转流变仪测量方法通则.pdf
GB-T 22522-2021 测量螺纹用米制系列量针.pdf
GB-T 19392-2013 车载卫星导航设备通用规范.pdf
T-CSTM 00461—2022 晶体硅光伏电池电极剥离强度测试方法.pdf
阿里 云上数字政府之数据安全建设指南.pdf
GB-T 36030-2018 制药机械(设备 在位清洗、灭菌通用技术要求.pdf
DB41-T 1435-2017 独山玉饰品质量等级评价 河南省.pdf
1
/
3
28
评价文档
赞助2.5元 点击下载(1.3 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。