(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210461327.3
(22)申请日 2022.04.28
(71)申请人 上海微波技 术研究所 (中国电子科
技集团公司第五十 研究所)
地址 200063 上海市普陀区武宁路423号
(72)发明人 谢凌云 王馨雨 杨紫柠 潘乐炳
王艺婷 帅源
(74)专利代理 机构 上海段和段律师事务所
31334
专利代理师 郭国中
(51)Int.Cl.
H04L 9/40(2022.01)
H04L 41/14(2022.01)
H04L 41/142(2022.01)
G06F 16/36(2019.01)G06F 16/28(2019.01)
(54)发明名称
基于知识图谱的网络安全测试方法及系统
(57)摘要
本发明提供了一种基于知识图谱的网络安
全测试方法及系统, 包括: 步骤S1: 从 网络安全领
域文本中抽取知识三元组; 步骤S2: 将抽取的知
识三元组以预设形式存储到数据库, 构建网络安
全测试知识图谱; 步骤S3: 基于网络安全测试知
识图谱, 通过查询获取信息; 步骤S4: 加载网络安
全测试方案模板, 利用查询到的信息生成网络安
全测试方案。 本发明通过结合Encoder编码结构
和条件随机场CRF的三元组抽取模型, 抽取了网
络安全文本中与网络安全测试相关的知识三元
组, 并用之构建了网络安全测试知识图谱, 网络
安全测试人员可以利用此知识图谱, 查询与网络
安全测试相关的信息, 降低了对网络安全测试人
员自身知识储备的要求。
权利要求书3页 说明书10页 附图3页
CN 114900346 A
2022.08.12
CN 114900346 A
1.一种基于知识图谱的网络安全测试 方法, 其特 征在于, 包括:
步骤S1: 从网络安全领域文本中抽取知识三元组;
步骤S2: 将抽取的知识三元组以预设形式存 储到数据库, 构建网络安全测试知识图谱;
步骤S3: 基于网络安全测试知识图谱, 通过查询获取信息;
步骤S4: 加载网络安全测试 方案模板, 利用查询到的信息生成网络安全测试 方案。
2.根据权利要求1所述的基于知识图谱的网络安全测试方法, 其特征在于, 在所述步骤
S1中:
基于Transformer的编码网络结构, 结合条件随机场, 从网络安全领域文本中抽取与网
络安全测试相关的知识三元组;
分析网络安全文本, 确定要抽取的实体类别, 标注每段文本 中存在的实体关系三元组,
标志形式为: 主实体, 关系, 客实体; 将标注文本作为模型的训练测试 数据;
对标注后的文本, 采用独热编码, 将输入文本转化为向量, 通过编码网络结构对输入的
文本向量进行矩阵运算, 得到网络安全文本序列的上下文特征向量, 并利用多头注意力机
制, 捕获上下文中符合预设条件的局部特征, 基于提取的特征向量, 利用条件随机场, 预测
输入文本中的三元组;
对抽取知识三元组的模型, 根据训练结果调整模型参数, 多次训练模型, 使知识抽取的
准确率达到预设要求; 其中, 可调整的模型参数包括训练次数、 批次大小、 学习率、 丢弃率、
优化函数; 利用训练好的模型, 抽取 未标注的网络安全文本中的知识三元组。
3.根据权利要求1所述的基于知识图谱的网络安全测试方法, 其特征在于, 在所述步骤
S2中:
将抽取的知识三元组存储到Neo4j数据库, 构建网络安全测试知识图谱, 存储形式为:
节点, 属性, 属性 值; 或者存 储形式为: 节点, 关系, 节点;
根据先验知识, 确定抽取的网络安全知识三元组在Neo 4j中的存 储形式;
利用Cypher语言将处理后的知识三元组分别存入Neo4j中; 存储形式为: 节点, 属性, 属
性值; 或者, 存 储形式为: 节点, 关系, 节点。
4.根据权利要求1所述的基于知识图谱的网络安全测试方法, 其特征在于, 在所述步骤
S3中:
基于构建的知识图谱, 通过节点查询 获取网络安全实体及其属性信息, 通过路径查询
获取与实体节点相关的信息;
将通过Cypher语言查询与网络安全测试相关的信息, 具体包括两种信息查询方式:
a、 节点信息查询: 输入实体名称, 利用WHERE命令设置查询条件, 通过MATCH命令在网络
安全测试知识图谱中匹配与输入实体名称相同的节点, 通过RETURN命令 返回满足预设查询
条件的实体信息;
b、 节点路径查询: 输入实体名称和 路径名称, 通过MATCH和WHERE命令在网络安全测试
知识图谱匹配满足预设条件的节点与节点路径, 利用RETURN命令返回该路径上的节 点属性
信息及其关联关系。
5.根据权利要求1所述的基于知识图谱的网络安全测试方法, 其特征在于, 在所述步骤
S4中:
利用Python ‑docx库, 加载网络安全测试方案模板, 获取模板与测试方案 的映射关系;权 利 要 求 书 1/3 页
2
CN 114900346 A
2模板内容包括被测对象、 测试 方法、 测试工具;
将模板与测试方案的映射关系以字典的形式表示, 模板信 息为字典中的key, 从知识图
谱中查询到的知识为字典中key对应的value;
将字典中的key和value转化为对应的测试大纲和测试细则, 生成对应的网络安全测试
方案。
6.一种基于知识图谱的网络安全测试系统, 其特 征在于, 包括:
模块M1: 从网络安全领域文本中抽取知识三元组;
模块M2: 将抽取的知识三元组以预设形式存 储到数据库, 构建网络安全测试知识图谱;
模块M3: 基于网络安全测试知识图谱, 通过查询获取信息;
模块M4: 加载网络安全测试 方案模板, 利用查询到的信息生成网络安全测试 方案。
7.根据权利要求6所述的基于知识图谱的网络安全测试系统, 其特征在于, 在所述模块
M1中:
基于Transformer的编码网络结构, 结合条件随机场, 从网络安全领域文本中抽取与网
络安全测试相关的知识三元组;
分析网络安全文本, 确定要抽取的实体类别, 标注每段文本 中存在的实体关系三元组,
标志形式为: 主实体, 关系, 客实体; 将标注文本作为模型的训练测试 数据;
对标注后的文本, 采用独热编码, 将输入文本转化为向量, 通过编码网络结构对输入的
文本向量进行矩阵运算, 得到网络安全文本序列的上下文特征向量, 并利用多头注意力机
制, 捕获上下文中符合预设条件的局部特征, 基于提取的特征向量, 利用条件随机场, 预测
输入文本中的三元组;
对抽取知识三元组的模型, 根据训练结果调整模型参数, 多次训练模型, 使知识抽取的
准确率达到预设要求; 其中, 可调整的模型参数包括训练次数、 批次大小、 学习率、 丢弃率、
优化函数; 利用训练好的模型, 抽取 未标注的网络安全文本中的知识三元组。
8.根据权利要求6所述的基于知识图谱的网络安全测试系统, 其特征在于, 在所述模块
M2中:
将抽取的知识三元组存储到Neo4j数据库, 构建网络安全测试知识图谱, 存储形式为:
节点, 属性, 属性 值; 或者存 储形式为: 节点, 关系, 节点;
根据先验知识, 确定抽取的网络安全知识三元组在Neo 4j中的存 储形式;
利用Cypher语言将处理后的知识三元组分别存入Neo4j中; 存储形式为: 节点, 属性, 属
性值; 或者, 存 储形式为: 节点, 关系, 节点。
9.根据权利要求6所述的基于知识图谱的网络安全测试系统, 其特征在于, 在所述模块
M3中:
基于构建的知识图谱, 通过节点查询 获取网络安全实体及其属性信息, 通过路径查询
获取与实体节点相关的信息;
将通过Cypher语言查询与网络安全测试相关的信息, 具体包括两种信息查询方式:
a、 节点信息查询: 输入实体名称, 利用WHERE命令设置查询条件, 通过MATCH命令在网络
安全测试知识图谱中匹配与输入实体名称相同的节点, 通过RETURN命令 返回满足预设查询
条件的实体信息;
b、 节点路径查询: 输入实体名称和 路径名称, 通过MATCH和WHERE命令在网络安全测试权 利 要 求 书 2/3 页
3
CN 114900346 A
3
专利 基于知识图谱的网络安全测试方法及系统
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:59:00上传分享