说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210910514.5 (22)申请日 2022.07.29 (71)申请人 燕山大学 地址 066004 河北省秦皇岛市河北 大街西 段438号 (72)发明人 李志明 郭唯健 李婷婷  (74)专利代理 机构 北京孚睿湾知识产权代理事 务所(普通 合伙) 11474 专利代理师 刘翠芹 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) (54)发明名称 基于邻域关系表征向量的知识图谱嵌入表 示方法及系统 (57)摘要 本发明涉及一种基于邻域关系表征向量的 知识图谱嵌入表示方法及系统, 包括实体的邻域 关系表征向量的生成、 同类型实体集的划分以及 同类型实体特征的提取与融合, 本发 明的目的基 于实体的邻域关系类型及其数量, 采用邻域关系 表征向量的形式对实体的邻域关系特性进行数 值性刻画, 奠定了使用聚类方法对实体邻域关系 向量相似性度量的基础, 在知识图谱嵌入模型的 训练过程中完成同类型实体特征的提取以及同 类型实体特征与实体嵌入向量的融合。 本发明为 提取高质量的同类型实体特征以及增强知识图 谱嵌入表 示的准确性奠定了基础, 给出了一种新 的知识图谱嵌入表示方法, 本发 明方法还具有计 算复杂度低、 适用性好、 同类型实体划分结果的 可解释好 等优点。 权利要求书2页 说明书10页 附图3页 CN 115329094 A 2022.11.11 CN 115329094 A 1.一种基于邻域关系表征向量的知识图谱嵌入表示方法, 其特征在于, 其包括以下子 步骤: S1、 生成实体的邻域关系表征向量, 得到实体的邻域关系表征向量 集合Ω; S2、 生成同类型实体集, 具体包括如下子步骤: S21、 定义维度为2*m的向量max和mi n; S22、 对max和mi n向量进行 赋值; S23、 对集合Ω中的任意实体邻域关系表征向量vi进行归一化处理, 得到归一化处理后 的邻域关系表征向量 集合Ω'; S24、 采用聚类方法将邻域关系表征向量集合Ω'中的实体邻域关系表征向量聚为K个 簇, 则按同簇的邻域关系表征向量从实体集合E中挑选相对应的实体ei, 从而完成同类型实 体集Ck(k∈[1,K])的划分; S3、 进行同类型实体特 征的提取与融合, 具体包括如下子步骤: S31、 根据步骤S2生成的同类型实体集, 确定实体ei所属的同类型实体集Ck; S32、 根据同类 型实体集Ck从基准知 识图谱嵌入模型的实体嵌入矩阵中挑取相应的实体 嵌入向量, 并将各个实体嵌入向量按式(2)拼接为同类型实体嵌入矩阵Ek; 其中, ||表示拼接操作, hi为同类型实体集Ck中实体ei的嵌入向量; S33、 在基准知识图谱嵌入模型的训练过程中, 采用式(3)所示的线性降维方式实现从 同类型实体嵌入矩阵Ek中提取蕴含的实体 类型特征tk; tk=σ(WkEk)              (3) 其中, σ(·)为mish激活函数, Wk为线性变换矩阵, 模型训练结束后, 最终得到的tk即为 同类型实体集Ck中所有实体的类型 特征; S34、 将实体类型特征tk与实体ei的嵌入向量hi进行串联拼接后, 按式(4)所示将拼接后 的特征向量输入至全连接层, 从而得到融合实体 类型特征tk后的实体嵌入向量e'i; e′i=concat(hi,tk)W+b                 (4) 其中, concat为将两个特征向量串行拼接的操作, hi为通过知 识图谱嵌入模型得到的实 体ei的嵌入向量, tk为实体ei所属类别的实体类型的特征向量表示, W∈R(dim1+dim2) ×dim1为权 重矩阵, dim1为实体ei嵌入向量hi的维度, dim2为实体类型特征向量tk的维度, e'i为实体ei 的嵌入向量hi融合实体 类型特征向量tk后的嵌入向量表示, b为偏置参数; S35、 按式(5)更新实体嵌入矩阵中实体ei的嵌入向量hi; hi=e′i                          (5) S36、 在以基准知识图谱嵌入模型的评分函数和损失函数为约束的训练过程中, 通过反 向传播实现模型参数的不断更新, 待模型训练结束时输出结果从而获得最终的实体类型特 征tk以及融合实体 类型特征后的实体嵌入向量hi。 2.根据权利要求1所述的基于邻域关系表征向量的知识图谱嵌入表示方法, 其特征在 于, 步骤S1具体包括以下步骤: S11、 将某知识图谱表示为G=(E,R), E为实体集合, R为关系集合, E={e0,...,ei,..., en‑1}, 其中i∈[0,n ‑1], n为实体数量; R={r0,...,rj,...,rm‑1}, 其中j∈[0,m ‑1], m为关系权 利 要 求 书 1/2 页 2 CN 115329094 A 2数量; S12、 根据知识图谱G中的关系 数量m定义长度为m*2的实体ei的邻域关系表征向量vi= [d0,...,dj,...,dm+j,...,d2m‑1], 并将其各元素初始化为0; 其中, 前m维用于存放实体ei作 为头实体时与其直接关联的各类关系的数量, 后m维用于存放实体ei作为尾实体时与其直 接关联的各类关系的数量; S13、 统计实体ei作为头实体时与其直接关联的各类关系的数量, 若关系 rj出现pj次, 则 将邻域关系表征向量vi的dj维更新为pj; S14、 统计实体ei作为尾实体时与其直接关联的各类关系的数量, 若关系rj出现pj'次, 则将邻域关系表征向量vi的dm+j维更新为pj'; S15、 对实体集合E中的任意实体执行S12至S14的操作, 得到实体的邻域关系表征向量 集合Ω={v0,...,vi,...,vn‑1}。 3.根据权利要求1所述的基于邻域关系表征向量的知识图谱嵌入表示方法, 其特征在 于: 步骤S22的具体方法为将步骤S1生成的实体的邻域关系表征向量集合Ω中所有实体邻 域关系表征向量dj维中的最 大值赋值 给向量max中的dj维; 将集合Ω中所有实体邻域关系表 征向量dj维中的最小值赋值给向量mi n中的dj维, 其中j∈[0,2*m ‑1]。 4.根据权利要求1所述的基于邻域关系表征向量的知识图谱嵌入表示方法, 其特征在 于: 步骤S23中归一化处理的具体方法如下: 对集合Ω中 的任意实体邻域关系表征向量vi按 式(1)进行归一化处理, 从而使得归一化处理后邻域关系表征向量集合 Ω'中所有邻域关系 表征向量的各维度数值均介于[0,1]区间内。 其中, vi*为实体ei邻域关系表征向量vi经过归一化处理后的向量。 5.一种用于权利要求1所述的基于邻域关系表征向量的知识图谱嵌入表示方法的系 统, 其特征在于: 其包括 实体的邻域关系表征向量生成模块、 同类型实体集生成模块以及同 类型实体特征的提取与融合模块, 所述 实体的邻域关系表征向量生成模块用于得到实体的 邻域关系表征向量集合Ω, 所述同类型实体集生成模块用于生成同类型实体集, 从而完成 同类型实体集Ck(k∈[1,K])的划分, 所述同类型实体特征的提取与融合模块用于进行同类 型实体特 征的提取和融合, 从而完成知识图谱的嵌入表示。权 利 要 求 书 2/2 页 3 CN 115329094 A 3

.PDF文档 专利 基于邻域关系表征向量的知识图谱嵌入表示方法及系统

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于邻域关系表征向量的知识图谱嵌入表示方法及系统 第 1 页 专利 基于邻域关系表征向量的知识图谱嵌入表示方法及系统 第 2 页 专利 基于邻域关系表征向量的知识图谱嵌入表示方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:59:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。