(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210699556.9
(22)申请日 2022.06.20
(71)申请人 广州伟宏智能科技有限公司
地址 510000 广东省广州市天河区车陂启
明大街93号B401房
(72)发明人 黄志春 陈嘉朗 张定国 李韧
卢小锋 丁杰
(74)专利代理 机构 广州蓝晟专利代理事务所
(普通合伙) 44452
专利代理师 栾洋洋 陈梓赫
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 15/16(2006.01)
(54)发明名称
基于智能中心基础构成的知识图谱
(57)摘要
本发明公开的属于知识图谱系统技术领域,
具体为基于智能中心基础构成的知识图谱, 包括
Dgraph模块和管理服务系统, 所述Dgraph模 块由
Zero和Alpha两种节点角色组成, Zero服务器组
成专有的Raft服务组第0号, Alpha服务器 可以组
成各个Raft小组, 分别为第一组, 第二组及以上,
每个小组 内遵循Raft协议的要求, 集群节点的数
量是1, 3, 5 ……奇数个, 本发明的有 益效果是: 解
决了在对非标准和非结构化数据进行处理时, 传
统的产品和方案通常采取搜索 的方式来进行处
理, 将企业对大量数据进行分析计算的需求, 转
化为使用若干关键词进行近似查找存在的无法
满足在生产环节中对结果的精度和召回率要求
的问题。
权利要求书2页 说明书4页 附图2页
CN 114860958 A
2022.08.05
CN 114860958 A
1.基于智能中心基础构成的知识图谱, 包括Dgraph模块和管理服务系统, 其特征在于:
所述Dgraph模块由Zero 和 Alpha 两种节点角色组成, Zero服务器组成专有的Raft服务组
第0号, Alpha服务器可以组成各个Raft小组, 分别为第一组, 第二组及以上, 每个小组内遵
循Raft协议的要求, 集群节点的数量是1, 3, 5......奇数个, 整个集群的元数据配置, 会由
zero传播给所有alpha节点, alpha通过这些配置信息, 路由或者命中查询(或突变), 集群中
的所有节点彼此 连接, 产生2*N^2个连接(N 位集群节点的数量);
所述管理服务系统包括UI层单元、 业务层单元、 接口层单元和持久层单元, 所述UI层单
元电性连接业务层单元, 所述业务层单元电性连接接口层单元, 所述接口层单元电性连接
持久层单 元。
2.根据权利要求1所述的基于智能中心基础构 成的知识图谱, 其特征在于, 所述集群节
点的数量可以是1个、 3个、 5个或2n ‑1个, 其中n 为大于零的自然数。
3.根据权利 要求1所述的基于智能中心基础构成的知识图谱, 其特征在于, 所述Dgraph
模块对集群内所有的状态变更操作都会基于Raft共识 算法来保证一致性, 按raft的日志顺
序应用于每个小组的领导者与追随者, Z ero存储和传播有关集群的元数据, 而Alpha存储用
户数据, Zer o负责成员的身份信息, 该信息跟踪每个Alpha服务器正在服务的gr oup, 以及在
集群内通信的内部IP, 正在服 务的分片信息 。
4.根据权利要求1所述的基于智能中心基础构 成的知识图谱, 其特征在于, 作为图数据
库选择目标, Dgraph 的目标是提供 Google 生产水平的规模和吞吐量, 在超过TB的结构
数据里, 为用户提供足够低延迟的实时查询。
5.根据权利要求1所述的基于智能中心基础构成的知识图谱, 其特征在于, 所述zeros
不跟踪Alpha的健康状态并对其进 行操作, 这被认 为是运维人员的操作, 使用这些信息zer o
可以告诉新的alpha加入并服 务于现有的group, 或者 新建一个group。
6.根据权利要求1所述的基于智能中心基础构 成的知识图谱, 其特征在于, 所述管理服
务系统由知识工程师和进行维护和管理; 所述UI层单元包括知识库管理模块、 实体管理模
块、 同义词管理模块、 聚合检索模块、 业务模型管理模块、 知识融合管理模块、 数据同步管 理
模块、 文本分析模块, 以及用户管理模块、 日志管理模块、 统计报表模块。
7.根据权利要求1所述的基于智能中心基础构 成的知识图谱, 其特征在于, 所述业务层
单元包括ET_服务模块、 图谱推理服务模块、 非结构化文本抽取服务模块、 样本标注服务模
块、 知识融创服 务模块、 报表统计服 务模块、 知识搜索服 务模块合日志服 务模块。
8.根据权利要求1所述的基于智能中心基础构 成的知识图谱, 其特征在于, 所述接口层
单元包括图数据库访问接口模块、 Mysql访问接口模块、 Redis访问接口模块、 RESTful访问
接口模块、 报表统计服 务模块、 ETL接口模块、 日志服 务模块。
9.根据权利要求1所述的基于智能中心基础构 成的知识图谱, 其特征在于, 所述持久层
单元包括图谱数据库模块、 关系数据库模块和文件目录模块。
10.根据权利要求1所述的基于智能中心基础构成的知识图谱, 其特征在于, 所述业务
模型管理模块用来实现对业务模型的管理, 包括模型属性管理、 同义词管理和实体管理;
ET_服务模块采用阿里云开源离线同步工具DataX, DataX 是一个异构数据源离线同步工
具, 致力于实现包括关系型数据库(MySQL、 Oracle等)、 HDFS、 Hive、 ODPS、 HBase、 FTP等各种
异构数据源之 间稳定高效的数据同步功能; 非结构化文本抽取服务模块主要用于实现实体权 利 要 求 书 1/2 页
2
CN 114860958 A
2抽取、 概念抽取、 关系抽取和属性抽取; 知识融创服务模块用于对得到的原始图谱执行进一
步的对齐和归一化, 消除矛盾、 歧义和冗余, 使之充分融合起来, 以便进一步进 行数据降噪,
为实现感知计算与认知计算的无缝衔接打下坚实的基础, 知识融合包括属 性值对齐、 角色
值对齐、 属性对齐、 角色对齐、 实体对齐、 事 件对齐、 本体关系构建及校正 等功能模块。权 利 要 求 书 2/2 页
3
CN 114860958 A
3
专利 基于智能中心基础构成的知识图谱
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:58:27上传分享