说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210804315.6 (22)申请日 2022.07.07 (71)申请人 上海金融期 货信息技 术有限公司 地址 200122 上海市浦东 新区自由贸易试 验区杨高南路28 8号19-21层 (72)发明人 高姜豪 范永丹 程元杰  (74)专利代理 机构 上海专利商标事务所有限公 司 31100 专利代理师 施浩 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/36(2019.01) G06N 5/02(2006.01) G06N 5/04(2006.01) G06K 9/62(2022.01)G06F 40/289(2020.01) G06F 40/216(2020.01) G06F 40/242(2020.01) (54)发明名称 融合专家推荐与文本聚类的智能事件分析 方法和系统 (57)摘要 本发明公开了一种融合专家推荐与文本聚 类的智能事件分析方法和系统, 能够提升事件关 联分析效率, 精准推荐事件知识库中的处置方案 以提升事件分析效率, 能够根据人工对监控事件 分类结果的更正来做动态调整, 以不断优化事件 分类结果, 保持算法正确稳定运行, 使得匹配结 果保持正确且 稳定。 其技术方案为: 数据预处理, 完成事件数据库中的已知事件类和已知事件的 预处理, 通过分析事件类, 获取关键词库, 并剔除 事件中的冗余信息, 提取事件的关键字; 为建立 事件分类模型, 进行预聚类; 计算事件类别分类 相似度阈值, 从而建立事件分类模型; 处理未分 类的监控 事件数据; 更新事 件分类模型。 权利要求书4页 说明书12页 附图3页 CN 115146062 A 2022.10.04 CN 115146062 A 1.一种融合专 家推荐与文本聚类的智能事 件分析方法, 其特 征在于, 方法包括: 步骤1: 数据预处理, 完成事件数据库中的已知事件类和已知事件的预处理, 通过分析 事件类, 获取关键词库, 并剔除事 件中的冗余信息, 提取事 件的关键 字; 步骤2: 为建立事 件分类模型, 进行 预聚类; 步骤3: 计算事 件类别分类相似度阈值, 从而建立事 件分类模型; 步骤4: 处 理未分类的监控 事件数据; 步骤5: 更新事 件分类模型。 2.根据权利要求1所述的融合专家推荐与文本聚类的智能事件分析方法, 其特征在于, 步骤1进一 步包括: 步骤1‑1: 事件类别数据预处 理; 步骤1‑2: 训练数据预处 理; 其中步骤1 ‑1进一步包括: 步骤1‑1‑1: 构建自定义字典, 向 自定义字典中添加某些固定短语, 建立 起关键字字典; 步骤1‑1‑2: 基于所建立的关键 字字典, 提取 未分类监控 事件的关键 字; 步骤1‑1‑3: 用BERT预训练模型对关键字字典中的所有关键字进行词向量转化, 获取关 键字字典中的关键 字对应的词向量列表; 步骤1‑1‑4: 获取各事件类别的文本描述中的关键词, 根据关键词词典获取各事件类别 的文本描述中的关键词所对应的词向量, 建立 三维词向量矩阵; 其中步骤1 ‑2进一步包括: 步骤1‑2‑1: 使用正则表达式按照固定格式识别和删除冗余信息; 步骤1‑2‑2: 通过动态更新和加载自定义字典和停止词列表, 使用训练数据的分词结 果; 步骤1‑2‑3: 根据关键字字典, 将分词结果中权重前列的分词作为监控事件报警信息的 关键字; 步骤1‑2‑4: 在关键字字典中找到对应于训练数据中所有关键字的单词向量和单词权 重, 并使用加权平均方法生成训练数据的代 表性向量。 3.根据权利要求1所述的融合专家推荐与文本聚类的智能事件分析方法, 其特征在于, 步骤2进一 步包括: 步骤2‑1: 训练数据聚类; 步骤2‑2: 聚类结果处 理; 其中, 步骤2 ‑1进一步包括: 步骤2‑1‑1: 使用T‑SNE方法对训练数据进行 可视化; 步骤2‑1‑2: 使用DBSCAN聚类算法的轮廓系数和噪声率 来评估聚类效果; 其中, 步骤2 ‑2进一步包括: 步骤2‑2‑1: 为保证每个聚类 中的所有监控事件只对应于同一个类, 将聚类结果进行二 次划分, 将初始聚类按照打上的类标签顺次生成新的聚类; 步骤2‑2‑2: 根据新的聚类结果, 对每个聚类使用K ‑means算法获得聚类中心向量来表 示聚类。 4.根据权利要求1所述的融合专家推荐与文本聚类的智能事件分析方法, 其特征在于,权 利 要 求 书 1/4 页 2 CN 115146062 A 2步骤3进一 步包括: 步骤3‑1: 获取各事件类别与其对应的聚类中心和噪点数据间的相似度; 步骤3‑2: 获取各事件类别的分类相似度阈值; 其中步骤3 ‑1进一步包括: 步骤3‑1‑1: 采用注意力机制, 计算每个聚类中心向量或噪声数据向量对应的事件类别 代表向量; 步骤3‑1‑2: 计算聚类中心向量或噪声数据向量与事件类别代表向量之间的余弦相似 度; 其中步骤3 ‑2进一步包括: 以每个事件类别对应的最小相似度值作为阈值, 生成所有事件类别的分类相似度阈值 表。 5.根据权利要求1所述的融合专家推荐与文本聚类的智能事件分析方法, 其特征在于, 步骤4进一 步包括: 步骤4‑1: 数据预处 理; 步骤4‑2: 获取分类结果; 其中步骤4 ‑1中, 根据训练数据预处理的方法, 对未分类的新监测事件的报警信息进行 分词, 提取关键 字, 并生成其代 表向量; 其中步骤4 ‑2进一步包括: 步骤4‑2‑1: 查询已形成的事 件知识库中事 件关键字‑类的映射关系; 步骤4‑2‑2: 计算未分类的监控事件数据的代表向量, 并计算其和各个聚类中心向量之 间的相似度; 步骤4‑2‑3: 如果新事件未被分配到任何聚类, 则将其标记为噪声数据; 步骤4‑2‑4: 计算噪声数据的代 表向量与每 个事件类别之间的余弦相似度。 6.根据权利要求1所述的融合专家推荐与文本聚类的智能事件分析方法, 其特征在于, 步骤5进一 步包括: 步骤5‑1: 更新关键 字字典; 步骤5‑2: 更新监控事件数据库; 其中, 步骤5 ‑1进一步包括: 步骤5‑1‑1: 更新事 件类别; 步骤5‑1‑2: 更新关键 字字典; 其中, 步骤5 ‑2进一步包括: 步骤5‑2‑1: 更新监视事件数据; 步骤5‑2‑2: 更新词向量矩阵; 步骤5‑2‑3: 更新事 件分类模型。 7.一种融合专 家推荐与文本聚类的智能事 件分析系统, 其特 征在于, 系统包括: 数据预处理模块, 用于完成事件数据库中的已知事件类和已知事件的预处理, 通过分 析事件类, 获取关键词库, 并剔除事 件中的冗余信息, 提取事 件的关键 字; 预聚类模块, 用于为建立事 件分类模型, 进行 预聚类; 事件类别分类相似度阈值计算模块, 用于计算事 件类别分类相似度阈值;权 利 要 求 书 2/4 页 3 CN 115146062 A 3

.PDF文档 专利 融合专家推荐与文本聚类的智能事件分析方法和系统

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 融合专家推荐与文本聚类的智能事件分析方法和系统 第 1 页 专利 融合专家推荐与文本聚类的智能事件分析方法和系统 第 2 页 专利 融合专家推荐与文本聚类的智能事件分析方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:01:10上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。