说明:收录各省市地方标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210496077.7 (22)申请日 2022.05.07 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融大街31号 (72)发明人 刘康 李馨迟 杨明川 张凯程 夏晓晴 闫汇 (74)专利代理 机构 北京律智知识产权代理有限 公司 11438 专利代理师 孙宝海 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 16/38(2019.01) (54)发明名称 基于元数据 的知识图谱构建方法、 装置、 设 备及存储介质 (57)摘要 本申请的实施例揭示了一种基于元数据的 知识图谱构建方法、 装置、 设备及存储介质, 该方 法包括: 对采集的元数据集中的元数据进行类别 划分, 并基于隶属于同一类别的元数据之间的共 同数据特征确定对应的主数据名称; 根据主数据 名称对元数据集中的元数据进行聚类处理, 得到 多个元数据子集; 根据各元数据子集中元数据包 含的实体构建对应的子知识图谱; 基于各元数据 子集对应的子知识 图谱确定元数据集的知识图 谱。 本申请揭示的基于元数据的知识图谱构建方 法提高了元 数据管理效率。 权利要求书2页 说明书14页 附图10页 CN 114840686 A 2022.08.02 CN 114840686 A 1.一种基于元 数据的知识图谱构建方法, 其特 征在于, 所述方法包括: 对采集的元数据集中的元数据进行类别划分, 并基于隶属于同一类别的元数据之间的 共同数据特 征确定对应的主数据名称; 根据所述主数据名称对所述元数据集中的元数据进行聚类处理, 得到多个元数据子 集; 根据各元数据子集中元 数据包含的实体构建对应的子知识图谱; 基于各元数据子集对应的子知识图谱确定所述元 数据集的知识图谱。 2.根据权利要求1所述的方法, 其特征在于, 所述对采集的元数据集中的元数据进行类 别划分的步骤, 包括: 对所述采集的元 数据集中的元 数据进行语义识别处 理, 得到各 元数据的语义特 征; 计算各元数据的语义特 征与预设特 征之间的第一特 征相似度; 若所述第一特征相似度 大于或等于第 一预设相似度阈值, 则确定对应元数据的数据类 别为所述预设特 征对应的数据类别。 3.根据权利要求1所述的方法, 其特征在于, 所述根据所述主数据名称对所述元数据集 中的元数据进行聚类处 理, 得到多个元 数据子集的步骤, 包括: 根据所述主数据名称选取 所述元数据集中的元 数据, 并将选取的元 数据作为类中心; 计算所述类中心与所述元 数据集中其它元 数据之间的数据相似度; 将所述数据相似度大于或等于第二预设相似度阈值的其它元数据作为所述类中心所 在的元数据子集中的元 数据。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述主数据名称选取所述元数据 集中的元 数据, 并将选取的元 数据作为类中心的步骤, 包括: 提取所述主数据名称的名称特 征, 以及所述元 数据集中各 元数据的数据特 征; 将数据特 征与所述名称特 征相匹配的元 数据作为所述类中心。 5.根据权利要求1所述的方法, 其特征在于, 所述根据各元数据子集中元数据包含的实 体构建对应的子知识图谱的步骤, 包括: 对所述元 数据子集中的各 元数据进行实体抽取; 从自定义实体关系规则中确定任意两实体之间的目标实体关系规则, 所述自定义实体 关系规则包括 不同实体之间的关联关系; 基于所述目标实体关系规则和对应的实体构建所述子知识图谱。 6.根据权利要求1所述的方法, 其特征在于, 所述基于各元数据子集对应的子知识图谱 确定所述元 数据集的知识图谱的步骤, 包括: 根据自定义实体关系规则确定不同子知识图谱之间具有关联关系的实体, 并基于所述 具有关联关系的实体汇总各子知识图谱, 得到所述元 数据集的知识图谱。 7.根据权利要求1所述的方法, 其特征在于, 在所述基于各元数据子集对应的子知识图 谱确定所述元 数据集的知识图谱的步骤之后, 所述方法还 包括: 根据接收到的元 数据调取指令调取 所述元数据集的知识图谱中的元 数据; 发送调取的元数据至数据编织终端, 以使所述数据编 织终端基于所述调取的元数据进 行应用。 8.一种基于元 数据的知识图谱构建装置, 其特 征在于, 所述装置包括:权 利 要 求 书 1/2 页 2 CN 114840686 A 2类别划分模块, 配置为对采集的元数据集中的元数据进行类别划分, 并基于隶属于同 一类别的元 数据之间的共同数据特 征确定对应的主数据名称; 聚类模块, 配置为根据所述主数据名称对所述元数据集中的元数据进行聚类处理, 得 到多个元 数据子集; 子知识图谱构建模块, 配置为根据 各元数据子集中的元数据包含的实体构建对应的子 知识图谱; 知识图谱构建模块, 配置为基于各元数据子集对应的子知识图谱确定所述元数据集的 知识图谱。 9.一种电子设备, 其特 征在于, 包括: 存储器, 存储有计算机可读指令; 处理器, 读取存储器存储的计算机可读指令, 以执行权利要求1 ‑7中的任一项所述的基 于元数据的知识图谱构建方法。 10.一种计算机可读存储介质, 其特征在于, 其上存储有计算机可读指令, 当所述计算 机可读指令被计算机的处理器执行时, 使计算机执行权利要求1 ‑7中的任一项所述的基于 元数据的知识图谱构建方法。权 利 要 求 书 2/2 页 3 CN 114840686 A 3
专利 基于元数据的知识图谱构建方法、装置、设备及存储介质
文档预览
中文文档
27 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 10:57:47
上传分享
举报
下载
原文档
(1.5 MB)
分享
友情链接
GB-T 32894-2016 抽水蓄能机组工况转换技术导则.pdf
GB 4943.1-2022 音视频、信息技术和通信技术设备 第1部分:安全要求.pdf
GB-T 40753-2021 供应链安全管理体系 ISO 28000实施指南 ISO 28004-2007.pdf
GB-T 712-2022 船舶及海洋工程用结构钢.pdf
信通院 车联网白皮书 2023年.pdf
GB-T 42392-2023 洁净手术部通用技术要求.pdf
GB-T 30285-2013 信息安全技术 灾难恢复中心建设与运维管理规范.pdf
DB3502-T 009-2022 琯溪蜜柚栽培技术规程 厦门市.pdf
GB-T 33563-2017 信息安全技术 无线局域网客户端安全技术要求(评估保障级2级增强).pdf
GA 1800.2-2021 电力系统治安反恐防范要求 第2部分:火力发电企业.pdf
思度安全-DSMM-019 数据安全事件应急管理规范V1.0.pdf
T-CAEPI 66—2023 水污染源自动监控监测系统 运行维护技术指南.pdf
TTAF 077.18—2022 APP收集使用个人信息最小必要评估规范 第18部分:剪切板信息.pdf
GB-T 23935-2009 圆柱螺旋弹簧设计计算.pdf
NY-T 1240-2021 草原鼠荒地治理技术规范.pdf
GB-T 19487-2004 电子政务业务流程设计方法 通用规范.pdf
DB3305-T 216-2021 计量检定、校准数据交互规范 湖州市.pdf
DB 52-T 1123-2016 贵州省 政府数据 数据分类分级指南.pdf
GB-T 42381.140-2023 数据质量 第140部分:主数据:特征数据交换:完整性.pdf
DB11-T 2046.1-2022 智慧停车系统技术要求 第1部分:总则 北京市.pdf
1
/
3
27
评价文档
赞助2.5元 点击下载(1.5 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。