说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210841108.8 (22)申请日 2022.07.18 (71)申请人 中国人民解 放军国防科技大 学 地址 410003 湖南省长 沙市开福区德雅路 109号 (72)发明人 陈洪辉 王梦如 江苗 蔡飞  舒振 郑建明 邵太华 张鑫  宋城宇  (74)专利代理 机构 北京风雅颂专利代理有限公 司 11403 专利代理师 曾志鹏 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/126(2020.01)G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于规则知识增强的数据关系抽取方法及 相关装置 (57)摘要 本申请提供一种基于规则知识增强的数据 关系抽取方法及相关装置; 该法包括: 根据实例 的头实体和尾实体的结构化知识图谱, 确定头实 体类型集和尾实体类型集, 并输入图神经网络编 码器, 基于实例的关系得到对应的头实体原型和 尾实体原型; 从各实例的非结构化知识文本中确 定关系描述, 将该实例和该关系描述输入至文本 编码器, 得到实例表示和关系描述表示; 通过将 实例表示和关系描述表示相互作用得到上下文 语义和上下文语义原型; 分别构建头实体、 尾实 体类型和上下文语义属于关系的概率关系, 据此 确定交叉熵损失函数、 实例级对比学习损失函数 和类别级对比学习损失函数; 将三者进行结合得 到目标函数, 并用于以对待抽取的数据集进行数 据关系抽取。 权利要求书5页 说明书19页 附图3页 CN 115186064 A 2022.10.14 CN 115186064 A 1.一种基于规则知识增强的数据关系抽取 方法, 其特 征在于, 包括: 根据预置的支持集中各实例的头实体和尾实体的结构化知识图谱, 分别确定该实例的 头实体类型集和尾实体类型集, 将该头实体类型集和该尾实体类型集输入 预置的图神经网 络编码器, 并基于该实例的关系, 分别得到该头实体和该尾实体对应的头实体原型和尾实 体原型; 从各所述实例的非结构化知识文本中, 确定该实例的关系描述, 将该实例和该关系描 述输入至预置的文本编码器, 得到该实例的实例表示和关系描述表示; 通过将该实例表示 和该关系描述表示相互作用得到该实例的上 下文语义和上 下文语义原型; 对于各所述实例, 基于所述头实体原型、 所述尾实体原型和所述上下文语义原型, 分别 构建所述头实体、 所述尾实体类型和所述上下文语义属于所述关系的概率关系, 并根据所 述概率关系确定交叉熵损失函数; 基于该实例的实例表示和其他实例的实例表示, 确定实例级对比学习损 失函数, 基于 所述上下文语义原型和获取的所述关系的关系描述原型, 确定类别级对比学习损失函数; 结合所述交叉熵损失函数、 所述实例级对比学习损失函数和所述类别级对比学习损失 函数, 得到目标函数, 将所述目标函数用于 关系抽取模型中, 以对待抽取的数据进 行数据集 关系抽取。 2.根据权利要求1所述的方法, 其特征在于, 所述将该头实体类型集和该尾实体类型集 输入预置的图神经网络编码器, 并基于该实例的关系, 分别得到该头实体和该尾实体对应 的头实体原型和尾实体原型, 包括: 将该头实体类型集中的各头实体类型和该尾实体类型中的各尾实体类型分别输入至 所述图神经网络编码器, 并得到如下 所示的头实体 类型表示和尾实体 类型表示: 其中, f1(*)表示图神经网络编码器的映射方式; 为头实体 类型表示, Ch表示头实体 类型集, c1表示Ch中的任意类型; 为尾实体 类型表示, Ct表示尾实体 类型集, c2表示Ct中的任意类型; 分别利用所述头实体类型表示和所述尾实体类型表示, 构建如下所示的所述头实体原 型和所述尾实体原型: 权 利 要 求 书 1/5 页 2 CN 115186064 A 2其中, r表示该实例的任意关系, Sr表示关于该关系r的实例集合, K表示Sr中具备的实例 数量; 表示所述头实体原型, eh表示头实体, 表示所述尾实体原型, et表示尾实体。 3.根据权利要求1所述的方法, 其特征在于, 所述通过将该实例表示和该关系 描述表示 相互作用得到该实例的上 下文语义和上 下文语义原型, 包括: 将所述头实体和所述尾实体以向量的形式连接, 得到如下 所示的实体表示: 其中, 为所述实体表示, R表示全部所述关系对应的全部关系类型, d表示所述文本 编码器的嵌入维度; 采取如下所示的第一交互方式, 将该实例表示和该关系描述表示进行相互作用, 得到 精细化实例表示: 其中, 为所述细化实例表示, 角标ar表示关于所述关系 r的所述关系描述, αj表示多 个实例权重中的第j个实例权重; 为所述实例表示, 为所述关系描述表示, sum(*)表 示行求和函数, [j:]表示矩阵的第j行, 角标T表示对矩阵执 行转置的操作; 采取如下所示的第二交互方式, 将该实例表示和该关系描述表示进行相互作用, 得到 实例感知关系描述表示: 其中, 为所述实例感知关系描述表示, βj表示多个注意权 重中的第j个注意权 重; 利用所述精细化实例表示和所述实例感知关系描述表示, 采用 如下所述的公式, 确定 上下文语义: 其中, 为所述上 下文语义表示, Mul(*)表示多层感知器; 采用如下 所述的公式表示所述上 下文语义原型: 其中, 表示所述上 下文语义原型。权 利 要 求 书 2/5 页 3 CN 115186064 A 3

.PDF文档 专利 基于规则知识增强的数据关系抽取方法及相关装置

文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于规则知识增强的数据关系抽取方法及相关装置 第 1 页 专利 基于规则知识增强的数据关系抽取方法及相关装置 第 2 页 专利 基于规则知识增强的数据关系抽取方法及相关装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:59:11上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。