(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210881292.9
(22)申请日 2022.07.26
(71)申请人 钟珍珍
地址 410003 湖南省长 沙市开福区伍家岭
街道栖凤路凯乐微谷商务中心9栋710
室
(72)发明人 钟珍珍
(74)专利代理 机构 北京恒和顿知识产权代理有
限公司 1 1014
专利代理师 林涛
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/35(2019.01)
(54)发明名称
结合数据可视化的知识图谱大数据处理方
法及系统
(57)摘要
本公开实施例公开了结合数据可视化的知
识图谱大数据处理方法及系统; 通过多个处理周
期对待拆解用户活动事件的活动事件区分标签、
活动事件知识短语和事件信息拆解窗口进行深
度挖掘处理, 每个处理周期获取前一轮处理周期
生成的活动事件知识短语以及基于区分标签拆
解补全的特征要素, 可以尽可能地保障待拆解用
户活动事件的事件信息拆解质量, 从而将不同的
用户活动事件对应的事件信息集从复杂的数字
服务互动大数据拆解出来, 提高大数据拆解和信
息分类的准确性, 便于后续针对不同的事件信息
集进行独立的用户需求挖掘和大 数据推送。
权利要求书3页 说明书16页 附图2页
CN 115168615 A
2022.10.11
CN 115168615 A
1.一种结合数据可视化的知识图谱大数据处理方法, 其特征在于, 应用于知识图谱大
数据系统, 所述方法包括:
获得数字服务互动大数据的第 一活动事件区分标签, 以及所述数字服务互动大数据中
的待拆解用户活动事件的第一活动事件知识短语和与所述第一活动事件知识短语对应的
第一事件信息拆解窗口;
利用所述第 一活动事件区分标签、 所述第 一活动事件知识短语和所述第 一事件信 息拆
解窗口, 进行不少于 两个处理周期的区分标签加权操作, 得到第二事 件信息拆解窗口;
其中, 将上一处理周期所述 区分标签加权操作生成的第 一活动事件知识短语进行知识
扩展得到下一处理周期的活动事件知识短语, 并利用所述下一处理周期的活动事件知识短
语得到该活动事件知识短语对应的事件信息拆解窗口, 将所述下一处理周期的所述活动事
件知识短语、 所述下一处理周期的事件信息拆解窗口和所述下一处理周期对应的活动事件
区分标签作为下一处理周期区分标签加权操作的待处理知识; 各 处理周期对应的所述区分
标签加权操作的待处理知识中的活动事件区分标签的质量评分与 活动事件知识短语的质
量评分一 致。
2.根据权利要求1所述的方法, 其特征在于, 所述利用所述第一活动事件区分标签、 所
述第一活动事件知识短语和所述第一事件信息拆解窗口, 进 行不少于两个处理周期的区分
标签加权操作, 得到第二事 件信息拆解窗口, 包括:
利用所述第 一活动事件区分标签、 所述第 一活动事件知识短语和所述第 一事件信 息拆
解窗口, 进行第一处 理周期的区分标签加权操作, 得到第二活动事 件知识短语;
利用所述第 二活动事件知识短语、 与所述第 二活动事件知识短语对应的周期化事件信
息拆解窗口和 第二活动事件区分标签进行不少于一个处理周期的区分标签加权操作, 得到
所述第二事件信息拆解窗口; 其中, 所述第二活动事件区分标签的质量评分与所述第二活
动事件知识短语的质量评分一 致。
3.根据权利要求2所述的方法, 其特征在于, 所述利用所述第一活动事件区分标签、 所
述第一活动事件知识短语和所述第一事件信息拆解窗口, 进 行第一处理周期的区分标签加
权操作, 得到第二活动事 件知识短语, 包括:
将所述第一活动事件区分标签中的第一个性化知识短语和所述第一活动事件知识短
语进行组合, 得到第一联动知识短语;
将所述第一联动知识短语、 所述第 一活动事件区分标签中第 一窗口化描述内容和所述
第一事件信息拆解窗口进行加权组合, 得到所述第二活动事 件知识短语。
4.根据权利要求3所述的方法, 其特征在于, 所述将所述第 一活动事件区分标签中的第
一个性化知识短语和所述第一活动事 件知识短语进行组合, 得到第一联动知识短语, 包括:
通过第一细节特征挖掘处理, 对所述第 一个性化知识短语和所述第 一活动事件知识短
语进行处 理, 得到第一知识特 征挖掘结果;
分别通过若干个第二细节特征挖掘处理, 对所述第一知识特征挖掘结果进行处理, 得
到若干个第二知识特征挖掘结果; 其中, 所述第一细节特征挖掘处理的特征滤波单元小于
所述第二细节特征挖掘处理的特征滤波单元, 且所述若干个第二细节特征挖掘处理的膨胀
变量不同;
利用所述若干个第二知识特 征挖掘结果, 确定所述第一联动知识短语。权 利 要 求 书 1/3 页
2
CN 115168615 A
25.根据权利要求2所述的方法, 其特征在于, 所述利用所述第二活动事件知识短语、 与
所述第二活动事件知识短语对应的周期化事件信息拆解窗口和第二活动事件区分标签进
行不少于一个处 理周期的区分标签加权操作, 得到所述第二事 件信息拆解窗口, 包括:
对所述第二活动事件知识短语、 所述周期化事件信 息拆解窗口和所述第 二活动事件区
分标签进 行第二处理周期的区分标签加权操作, 得到第三活动事件知识短语和所述第三活
动事件知识短语对应的第一 膨胀处理窗口;
利用所述第 一膨胀处理窗口和所述周期化事件信 息拆解窗口, 确定第 三事件信 息拆解
窗口;
对所述第三活动事件知识短语、 所述第 一膨胀处理窗口和第 三活动事件区分标签进行
第三处理周期的区分标签加权操作, 得到第四活动事件知识短语和所述第四活动事件知识
短语对应的第二 膨胀处理窗口;
利用所述第 二膨胀处理窗口和所述第 三事件信 息拆解窗口, 确定所述第 二事件信 息拆
解窗口。
6.根据权利要求5所述的方法, 其特征在于, 所述对所述第二活动事件知识短语、 所述
周期化事件信息拆解窗口和所述第二活动事件区分标签进行第二处理周期的区分标签加
权操作, 得到第三活动事件知识短语和所述第三活动事件知识短语对应的第一膨胀处理 窗
口, 包括:
对所述第二活动事件知识短语、 所述周期化事件信 息拆解窗口和所述第 二活动事件区
分标签进行第二处 理周期的区分标签加权操作, 得到所述第三活动事 件知识短语;
对所述第三活动事件知识短语中的目标知识字段集进行解析, 得到所述第 一膨胀处理
窗口。
7.根据权利要求6所述的方法, 其特征在于, 所述利用所述第 一膨胀处理窗口和所述周
期化事件信息拆解窗口, 确定第三事 件信息拆解窗口, 包括:
确定所述周期化事 件信息拆解窗口中的目标知识字段集;
利用所述目标知识字段集和所述第 一膨胀处理窗口, 确定表征所述待拆解用户活动事
件的目标知识字段集的字段集区分窗口;
利用所述目标知识字段集和所述周期化事件信 息拆解窗口, 确定表征所述待拆解用户
活动事件的非目标知识字段集的非字段集区分窗口;
利用所述非字段集区分窗口和所述字段集区分窗口, 确定所述第三事件信息拆解窗
口;
其中, 所述利用所述目标知识字段集和所述第一膨胀处理窗口, 确定表征所述待拆解
用户活动事 件的目标知识字段集的字段集区分窗口, 包括:
利用所述第 一膨胀处理窗口的质量评分, 对所述周期化事件信 息拆解窗口中的目标知
识字段集进行知识扩展, 得到第一目标知识字段集;
利用所述第一目标知识字段集和所述第一 膨胀处理窗口, 得到所述字段集区分窗口。
8.根据权利要求7所述的方法, 其特征在于, 所述利用所述目标知识字段集和所述周期
化事件信息拆解窗口, 确定表征所述待拆解用户活动事件的非目标知识字段集的非字段集
区分窗口, 包括:
利用所述第一膨胀处理窗口的质量评分对所述周期化事件信息拆解窗口进行知识扩权 利 要 求 书 2/3 页
3
CN 115168615 A
3
专利 结合数据可视化的知识图谱大数据处理方法及系统
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 11:01:01上传分享