说明:收录各省市地方标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210012865.4 (22)申请日 2022.01.07 (71)申请人 太原科技大 学 地址 030024 山西省太原市万柏林区窊流 路66号太原科技大 学 (72)发明人 宋思楠 蔡江辉 杨海峰  (74)专利代理 机构 北京沃知思真知识产权代理 有限公司 1 1942 代理人 周俊华 (51)Int.Cl. G06F 16/23(2019.01) G06F 16/2458(2019.01) G06F 21/56(2013.01) (54)发明名称 基于隔离算法的异常数据检测方法 (57)摘要 本发明公开了基于隔离算法的异常数据检 测方法, 属于数据处理技术领域, 该检测方法具 体步骤如下: (1)收集并筛选数据; (2)构建学习 神经网络以进行参数设置; (3)对数据进行数据 隔离; (4)对异常数据进行溯源处理并记录; (5) 修复异常数据并反馈用户; 本发 明无需人工设置 参数且不需要人工建模, 能够方便用户对计算机 中的异常数据进行检测, 提高用户异常处理效 率, 操作简单, 能够快速对不符合许可规则的软 件进行中断处理, 有效的保证计算机的安全性, 同时节省用户处 理方案设计时间。 权利要求书2页 说明书4页 附图1页 CN 114356947 A 2022.04.15 CN 114356947 A 1.基于隔离算法的异常数据检测方法, 其特 征在于, 该检测方法具体步骤如下: (1)收集并筛选数据: 对计算机数据进行收集, 并对收集的数据进行数据分类, 同时分 别生成数据黑名单以及数据白名单对数据进行记录, 同时对两组名单 数据进行实时更新; (2)构建学习神经网络以进行参数设置: 将数据黑名单上的数据分为训练集和测试集, 并通过训练样本对学习神经网络进行训练, 再用测试样本对训练得到的学习神经网络进 行 数据验证, 并获取最佳参数; (3)对数据进行数据隔离: 参数设置完成后, 构建隔离模型并将参数导入隔离模型中, 同时将数据黑名单中的数据导入隔离模型中进行隔离检测, 并将其中检测出的异常数据进 行记录, 同时构建风险管控数据库对相关软件进行监控; (4)对异常数据进行溯源处理并记录: 依次对检测出的异常数据进行数据溯源, 并对溯 源结果进行判断分类, 同时对分类完成的异常数据进行二次分析, 并将分析结果反馈给用 户; (5)修复异常数据并反馈用户: 对风险指数高的异常数据进行数据修复处理, 同时生成 修复日志, 并将修复日志上传至云端服务器进行存储, 将修复信息上传至共享平台进行数 据共享。 2.根据权利要求1所述的基于隔离算法的异常数据检测方法, 其特征在于, 步骤(1)中 所述数据分类具体步骤如下: 步骤一: 收集计算机中所有软件数据, 并将其按照系统软件数据以及应用软件数据进 行分类; 步骤二: 将系统软件数据录入数据白名单中, 将应用软件数据录入数据黑名单中, 同时 将相关软件名称分别录入两组名单中; 步骤三: 将两组名单记录的软件名称按照名称首字母A~Z进行排序, 同时将各组软件 数据与相关软件名称进行关联。 3.根据权利要求1所述的基于隔离算法的异常数据检测方法, 其特征在于, 步骤(2)中 所述数据验证具体步骤如下: 第一步: 统计数据黑名单中的数据总量 n, 并从中 中选择一个数据作为验证数据; 第二步: 用数据黑名单中剩余的数据拟合一个测试模型, 并用最先被排除的那个验证 数据来验证测试模型的精度; 第三步: 对测试模型的平均路径长度进行计算, 其具体 计算公式如下: 其中, c(n)代 表平均路径长度, H(n ‑1)代表调和数, n代 表数据黑名单中的数据总量。 4.根据权利要求3所述的基于隔离算法的异常数据检测方法, 其特征在于, 步骤(3)中 所述隔离检测具体步骤如下: S1.1: 隔离模型随机 选择一个属性A, 并随机 选择该属性的一个值V; S1.2: 根据属性A对每组数据进行分类, 并递归的构 建隔离树, 同时分别构 建MAX表以及 MIN表; S1.3: 当A<V的软件数据录入MI N表中, 当A≥C的软件数据录入MAX表中; S1.4: 对分类完成的数据进行预测, 并对预测结果进行归一化处理, 其具体计算公式如权 利 要 求 书 1/2 页 2 CN 114356947 A 2下: 其中, s(x,n)代表数据x在由n个数据构成的隔离树的异常指数, h(x)代表用来标准化 数据x的路径长度, E(h(x) )代表数据x在一批孤立 树中的路径长度的期望; S1.5: 当E(h(x)) →c(n)时, s →0.5, 即数据x的路径平均长度与树的平均路径长度相近 时, 则不能区分是不是异常; 当E(h(x)) →0时, s→1, 即x的异常分数接近1时, 则判定为异常 数据; 当E(h(x) )→n‑1时, s→0, 则判定为 正常数据。 5.根据权利要求4所述的基于隔离算法的异常数据检测方法, 其特征在于, 步骤(4)中 所述判断分类具体步骤如下: S2.1: 依据数据黑名单对异常数据对应的软件进行提取, 并构建反馈名单记录各组软 件名称; S2.2: 收集软件许可规则, 并构建规则判断库, 同时将反馈名单中的软件导入构 建规则 判断库中, 将不符合许可规则的软件强制停止运行, 并将各组软件运行状态录入数据黑名 单中。 6.根据权利要求4所述的基于隔离算法的异常数据检测方法, 其特征在于, 步骤(5)中 所述修复处理具体步骤如下: S3.1: 与方案共享平台通信连接, 并提取相应处理方案, 同时将提取出的处理方案反馈 给用户; S3.2: 用户选择处理方案, 计算机依据用户选择的处理方案对异常数据进行修复, 并生 成修复日志 记录修复时间以及数据信息 。权 利 要 求 书 2/2 页 3 CN 114356947 A 3

.PDF文档 专利 基于隔离算法的异常数据检测方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于隔离算法的异常数据检测方法 第 1 页 专利 基于隔离算法的异常数据检测方法 第 2 页 专利 基于隔离算法的异常数据检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:19:13上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。