说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210432872.X (22)申请日 2022.04.22 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 王鑫 孙明明 李平  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 吴晓兵 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/211(2020.01) G06F 40/30(2020.01) G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 结构图生成方法、 模型的训练方法、 图谱生 成方法及装置 (57)摘要 本公开提供了一种结构图生成方法、 结构图 生成模型的训练方法、 图谱生 成方法、 装置、 电子 设备、 存储介质以及程序产品, 涉及数据处理技 术领域, 尤其涉及图谱、 深度学习等技术领域。 具 体实现方案为: 对待处理语句进行上下文编码, 得到编码向量序列; 基于编码向量序列, 确定用 于生成结构图的节点信息、 拓扑结构信息和边信 息, 节点信息用于表征结构图的节点的属性信 息, 拓扑结构信息用于表征多个节 点彼此之间是 否存在边, 边信息用于表征多个节 点彼此之间的 关联关系; 以及基于节点信息、 拓扑结构信息和 边信息, 生成针对 待处理语句的目标结构图。 权利要求书3页 说明书12页 附图8页 CN 114756691 A 2022.07.15 CN 114756691 A 1.一种结构图生成方法, 包括: 对待处理语句进行 上下文编码, 得到编码向量序列; 基于所述编码向量序列, 确定用于生成结构图的节点信 息、 拓扑结构信息和边信 息, 其 中, 所述节点信息用于表征结构图的节点的属 性信息, 所述拓扑结构信息用于表征多个节 点彼此之间是否存在边, 所述 边信息用于表征 所述多个节点彼此之间的关联关系; 以及 基于所述节点信息、 所述拓扑结构信息和所述边信息, 生成针对所述待处理语句的目 标结构图。 2.根据权利要求1所述的方法, 其中, 所述基于所述编码向量序列, 确定用于生成结构 图的节点信息、 拓扑 结构信息和边信息, 包括: 对所述编码向量序列进行第一变换处 理, 得到拓扑结构表示; 对所述编码向量序列进行第二变换处 理, 得到关系表示; 基于所述编码向量序列, 确定所述节点信息; 基于所述拓扑 结构表示, 确定所述拓扑 结构信息; 以及 基于所述关系表示, 确定所述 边信息。 3.根据权利要求2所述的方法, 其中, 所述待处理语句包括多个节点, 所述编码向量序 列包括多个编码向量, 所述多个节点与所述多个编码向量 一一对应; 所述对所述编码向量序列进行第一变换处 理, 得到拓扑结构表示, 包括: 针对所述待处理语句中的任意两个节点, 从所述编码向量序列中确定与所述两个节点 相对应的编码向量对; 以及 对所述编码向量对进行第一变换处 理, 得到关于所述两个节点之间的拓扑 结构表示。 4.根据权利要求2或3所述的方法, 其中, 所述待处理语句包括多个节点, 所述编码向量 序列包括多个编码向量, 所述多个节点与所述多个编码向量 一一对应; 所述对所述编码向量序列进行第二变换处 理, 得到关系表示, 包括: 针对所述待处理语句中的任意两个节点, 从所述编码向量序列中确定与所述两个节点 相对应的编码向量对; 以及 基于边信息的类别数量, 对所述编码向量对进行第二变换处理, 得到关于所述两个节 点之间的关系表示。 5.根据权利要求1至4中任一项所述的方法, 其中, 所述基于所述编码向量序列, 确定所 述节点信息, 包括: 通过对所述编码向量序列进行节点属性处 理, 确定所述节点信息; 其中, 所述节点信息包括以下至少一项: 节点词性信息、 用于表征 是否生成派生节点的派生节点信息 。 6.一种结构图生成模型的训练方法, 其中, 所述结构图生成模型包括上下文编码子模 型、 节点标签生 成子模型、 拓扑结构生成子模型和边标签生成子模型, 所述结构图生成模型 的训练方法包括: 将与样本结构图相对应的样本语句输入至所述上下文编码子模型, 得到样本编码向量 序列, 其中, 所述样本结构图包括样本节点标签、 样本 拓扑结构标签以及样本边标签; 将所述样本编码向量序列输入至所述节点标签生成子模型, 得到样本节点信息; 将所述样本语句输入至所述拓扑 结构生成子模型, 得到样本 拓扑结构信息;权 利 要 求 书 1/3 页 2 CN 114756691 A 2将所述样本语句输入至所述 边标签生成子模型, 得到样本边信息; 以及 基于所述样本结构图、 所述样本节点信 息、 所述样本拓扑结构信 息和所述样本边信 息, 训练所述结构图生成模型, 得到经训练的结构图生成模型。 7.一种图谱生成方法, 包括: 基于结构图生成目标图谱, 其中, 所述结构图是利用根据权利要求1至 5中任一项所述的结构图生成方法生成的。 8.一种结构图生成装置, 包括: 编码模块, 用于对待处 理语句进行 上下文编码, 得到编码向量序列; 确定模块, 用于基于所述编码向量序列, 确定用于生成结构图的节点信息、 拓扑结构信 息和边信息, 其中, 所述节点信息用于表征结构图的节点的属性信息, 所述拓扑结构信息用 于表征多个节点彼此之 间是否存在边, 所述边信息用于表征所述多个节点彼此之 间的关联 关系; 以及 结构图生成模块, 用于基于所述节点信 息、 所述拓扑结构信 息和所述边信息, 生成针对 所述待处 理语句的目标 结构图。 9.根据权利要求8所述的装置, 其中, 所述确定模块包括: 第一变换 单元, 用于对所述编码向量序列进行第一变换处 理, 得到拓扑结构表示; 第二变换 单元, 用于对所述编码向量序列进行第二变换处 理, 得到关系表示; 第一确定单 元, 用于基于所述编码向量序列, 确定所述节点信息; 第二确定单 元, 用于基于所述拓扑 结构表示, 确定所述拓扑 结构信息; 以及 第三确定单 元, 用于基于所述关系表示, 确定所述 边信息。 10.根据权利要求9所述的装置, 其中, 所述待处理语句包括多个节点, 所述编码向量序 列包括多个编码向量, 所述多个节点与所述多个编码向量 一一对应; 所述第一变换 单元包括: 第一确定子单元, 用于针对所述待处理语句中的任意两个节点, 从所述编码向量序列 中确定与所述两个节点相对应的编码向量对; 以及 第一变换子单元, 用于对所述编码向量对进行第一变换处理, 得到关于所述两个节点 之间的拓扑 结构表示。 11.根据权利要求9或10所述的装置, 其中, 所述待处理语句包括多个节点, 所述编码向 量序列包括多个编码向量, 所述多个节点与所述多个编码向量 一一对应; 所述第二变换 单元包括: 第二确定子单元, 用于针对所述待处理语句中的任意两个节点, 从所述编码向量序列 中确定与所述两个节点相对应的编码向量对; 以及 第二变换子单元, 用于基于边信息的类别数量, 对所述编码向量对进行第 二变换处理, 得到关于所述两个节点之间的关系表示。 12.根据权利要求8至1 1中任一项所述的装置, 其中, 所述第一确定单 元包括: 属性处理子单元, 用于通过对所述编码向量序列进行节点属性处理, 确定所述节点信 息; 其中, 所述节点信息包括以下至少一项: 节点词性信息、 用于表征 是否生成派生节点的派生节点信息 。权 利 要 求 书 2/3 页 3 CN 114756691 A 3

.PDF文档 专利 结构图生成方法、模型的训练方法、图谱生成方法及装置

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 结构图生成方法、模型的训练方法、图谱生成方法及装置 第 1 页 专利 结构图生成方法、模型的训练方法、图谱生成方法及装置 第 2 页 专利 结构图生成方法、模型的训练方法、图谱生成方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:01:01上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。