说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210871372.6 (22)申请日 2022.07.22 (71)申请人 中国科学院计算机网络信息中心 地址 100190 北京市海淀区中关村南四街 4 号 (72)发明人 沈志宏 赵子豪 路长发  (74)专利代理 机构 北京君尚知识产权代理有限 公司 11200 专利代理师 余长江 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/31(2019.01) G06F 16/36(2019.01) (54)发明名称 面向多版本非结构化数据语义信息的查询 方法及装置 (57)摘要 本发明公开了一种面向多版本非结构化数 据语义信息的查询方法及装置。 所述方法包括: 获取各版本的非结构化数据; 针对每一版本的非 结构化数据, 基于提取语义信息使用的人工智能 模型, 获取所述语义信息的版本; 基于各人工智 能模型之间的修改关系, 构建并保存非结构化数 据的语义信息版本树; 依据所述语义信息版本树 的存储方式, 建立所述语义信息版本树中父节点 与子节点之间的表达方式; 查询非结构化数据的 语义信息时, 基于查询过滤条件与所述表达方 式, 对所述语义信息版本树进行检索, 得到语义 信息的查询结果。 本发明可以实现可以管理并查 询多版本的非结构化数据语义信息 。 权利要求书2页 说明书6页 附图1页 CN 115438146 A 2022.12.06 CN 115438146 A 1.一种面向多版本非结构化数据语义信息的查询方法, 所述方法包括: 获取各版本的非结构化数据; 针对每一版本的非结构化数据, 基于提取语义信息使用的人工智能模型, 获取所述语 义信息的版本; 基于各人工智能模型之间的修改关系, 构建并保存非结构化数据的语义信息版本树; 其中, 所述语义信息版本树中的每一节点表示 一版本的语义信息; 依据所述语义信 息版本树的存储方式, 建立所述语义信 息版本树中父节点与子节点之 间的表达方式; 查询非结构化数据的语义信息时, 基于查询过滤条件与所述表达方式, 对所述语义信 息版本树进行检索, 得到语义信息的查询结果。 2.如权利要求1所述的方法, 其特征在于, 所述查询过滤条件包括: 待查询层级和待查 询语义信息对应的非结构化数据对象的id、 待查询语义信息对应的非结构化数据对象的版 本号、 待查询语义信息的名称以及待查询语义信息的实际内容中的一种或多种。 3.如权利要求2所述的方法, 其特征在于, 所述存储方式包括: 将所述语义信息版本树 保存在硬 盘或所述语义信息版本树保存在K ey‑Value数据库。 4.如权利要求3所述的方法, 其特征在于, 将所述语义信息版本树保存在硬盘的情况 下, 所述依据所述语义信息版本树的存储方式, 建立所述语义信息版本树中父节点与子节 点之间的表达方式, 包括: 使用三向指针保持父节点与子节点之间的关联; 其中, 所述三向指针包括: 指向父版本 的指针、 指向语义信息实际内容的指针和指向所有子节点的指针。 5.如权利要求4所述的方法, 其特征在于, 所述查询 非结构化数据的语义信息时, 基于 查询过滤条件对所述语义信息版本树进行检索, 得到语义信息的查询结果, 包括: 基于所述待查询语义信 息对应的非结构化数据对象的id、 待查询语义信息对应的非结 构化数据对 象的版本号、 待查询语义信息的名称或待查询语义信息, 得到指向待查询 语义 信息的三向指针的指针; 根据指向语义信息实际内容的指针, 得到目标节点的语义信息实际内容; 利用目标节点中指向父版本的指针和/或指向所有子节点的指针, 并根据所述待查询 层级, 得到相应的父节点和/或子节点; 基于该父节点和/或子节点中指向语义信 息实际内容的指针, 得到父节点和/或子节点 的语义信息实际内容; 综合获取的语义信息实际内容, 得到语义信息的查询结果。 6.如权利要求3所述的方法, 其特征在于, 将所述语义信息版本树保存在Key ‑Value数 据库的情况下, 所述依据所述语义信息版本树的存储方式, 建立所述语义信息版本树中父 节点与子节点之间的表达方式, 包括: 将具有同一类 语义信息名称的节点存 储在一个Kv数据库中; 基于父节点与子节点之间的关联, 得到任一Kv数据库中各 版本的Key值。 7.如权利要求6所述的方法, 其特征在于, 所述查询 非结构化数据的语义信息时, 基于 查询过滤条件对所述语义信息版本树进行检索, 得到语义信息的查询结果, 包括: 找到符合该 过滤条件的语义信息的版本, 获取 该版本的语义信息实际内容;权 利 要 求 书 1/2 页 2 CN 115438146 A 2根据该版本的Key值与所述待查询层级, 得到父节点和/或子节点的版本; 获取父节点和/或子节点的版本的语义信息实际内容; 综合获取的语义信息实际内容, 得到语义信息的查询结果。 8.如权利要求1 ‑7任一项所述的方法, 其特征在于, 在所述语义信 息版本树中删除一版 本的语义信息, 包括: 将该版本及其全部 子版本的相应节点从所述语义信息树中删除; 或, 将该版本的相应节点从所述语义信 息树中删除, 且将该版本的直接子节点的父节点设 置为该版本的相应节点的父节点。 9.一种存储介质, 所述存储介质中存储有计算机程序, 其中, 所述计算机程序被设置为 运行时执 行权利要求1 ‑8中的任一方法。 10.一种电子装置, 包括存储器和 处理器, 所述存储器中存储有计算机程序, 所述处理 器被设置为 运行所述计算机程序以执 行权利要求1 ‑8中的任一方法。权 利 要 求 书 2/2 页 3 CN 115438146 A 3

.PDF文档 专利 面向多版本非结构化数据语义信息的查询方法及装置

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 面向多版本非结构化数据语义信息的查询方法及装置 第 1 页 专利 面向多版本非结构化数据语义信息的查询方法及装置 第 2 页 专利 面向多版本非结构化数据语义信息的查询方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:01:42上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。