(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210822379.9
(22)申请日 2022.07.12
(71)申请人 浙江中控技 术股份有限公司
地址 310053 浙江省杭州市滨江区六和路
309号
(72)发明人 褚健 梁攀飞 娄海川
(74)专利代理 机构 杭州宇信联合知识产权代理
有限公司 3 3401
专利代理师 王健
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 16/35(2019.01)
G06F 16/36(2019.01)
G06F 40/242(2020.01)
G06F 40/295(2020.01)G06Q 50/04(2012.01)
B01J 19/00(2006.01)
(54)发明名称
基于加氢裂化装置知识图谱的智能问答系
统的构建方法
(57)摘要
本发明公开了一种基于加氢裂化装置知识
图谱的智能问答系统的构建方法, 包括: 11、 获取
加氢裂化装置的数据; 12、 对加氢裂化装置的数
据的数据进行预处理; 13、 构建实体列表和关系
列表; 14、 对实体列表和关系列表进行去重操作,
然后将实体列表和关系 列表写入图数据库, 完成
加氢裂化装置异常工况处理知识图谱的构建和
可视化; 15、 对预设的用户问题进行分类和解析,
再从知识图谱中检索答案并对答案进行处理, 然
后通过后端Django框架和前端Boostrap框架完
成智能问答系统的构建和可视化。 在加氢裂化装
置发生故障时, 本发明能及时提出解决办法, 快
速和精准的处理异常情况, 提高异常处理的效
率, 为企业减 小损失, 同时打破了该 领域的空白。
权利要求书3页 说明书9页 附图3页
CN 115357693 A
2022.11.18
CN 115357693 A
1.一种基于加氢裂化装置知识图谱的智能问答系统的构建方法, 其特征在于, 应用于
加氢裂化装置异常工况的处 理, 包括如下步骤:
步骤11、 获取加氢裂化装置的数据, 分为两部分: 一部分至少包括工厂实时数据库和工
艺操作规 程数据, 另一部分是应急处 理文档数据;
步骤12、 对工厂实时数据库和工艺操作规程数据进行预处理, 得到命名实体识别数据
和词向量; 对应急处理文档数据进 行预处理, 至少得到包括装置名称、 工况名称、 操作人员、
处置要点、 关键步骤、 操作内容、 汇报的信息;
步骤13、 从工厂实时数据库和工艺操作规程数据中获得实体和实体间关系三元组, 从
应急处理文档数据中获取应急方案三元组, 将实体和实体间关系三元组与应急方案三元组
相结合得到最终的三元组<实体, 关系, 实体>, 并构建实体列表和关系列表;
步骤14、 对实体列表和关系列表进行去重操作, 得到每个实体和每个关系均唯一的实
体列表和关系列表, 然后将实体列表和关系列表写入图数据库, 完成加氢裂化装置异常工
况处理知识图谱的构建和可视化;
步骤15、 对预设的用户问题进行分类和解析, 再从知识图谱中检索答案并对答案进行
处理, 然后通过后端Django框架和前端Bo ostrap框架完成智能问答系统的构建和可视化。
2.根据权利要求1所述的基于加氢裂化装置知识图谱的智能问答系统的构建方法, 其
特征在于, 步骤11 中, 从工厂实时数据库和工艺操作规程数据中, 至少获取加氢裂化装置的
故障诊断和异常处 理数据。
3.根据权利要求1所述的基于加氢裂化装置知识图谱的智能问答系统的构建方法, 其
特征在于, 步骤12中, 对工厂实时数据库和工艺操作规 程数据进行 预处理, 具体包括:
步骤121、 从工厂实时数据库和工艺操作规程数据中获得非结构化文档和半结构化文
档并进行预处理, 以提取所有文本数据, 然后至少通过Jieba分词和停用词过滤方法处理所
得到的文本数据;
步骤122、 对经过步骤121处 理后的文本数据构建命名实体识别数据;
步骤123、 对经步骤121处 理后得到的文本数据, 通过W ord2vec和BERT方法建立词向量。
4.根据权利要求1所述的基于加氢裂化装置知识图谱的智能问答系统的构建方法, 其
特征在于, 步骤13具体包括:
步骤131、 对从工厂实时数据库和工艺操作规程数据中获得的非结构化文档和半结构
化文档进行预处理后的数据, 采用BERT ‑BiLSTM‑CRF方法进 行命名实体识别, 存储所识别到
的实体, 通过 人工标注进一 步确定命名实体识别方法得到的实体的准确性;
步骤132、 采用CasRel联合抽取框架, 抽取从工厂实时数据库和工艺操作 规程数据中获
得的非结构化文档和半结构化文档中的各实体间的关系, 构建实体和实体间关系三元组;
步骤133、 对从应急处理文档数据中得到的处置要点、 关键步骤和操作内容这三部分,
首先针对流 程性操作内容进行实体处 理, 进一步构建应急方案三元组;
步骤134、 将步骤132 获得的实体和实体 间关系三元组, 与 步骤133获得的应急方案三元
组通过实体对齐和实体融合方法相结合, 得到最终的三元组<实体, 关系, 实体>, 并构建包
括装置名称、 工况名称、 操作人员的实体列表以及包括处置要点、 关键步骤、 操作内容和汇
报的关系列表。
5.根据权利要求4所述的基于加氢裂化装置知识图谱的智能问答系统的构建方法, 其权 利 要 求 书 1/3 页
2
CN 115357693 A
2特征在于, 步骤13 3具体包括:
步骤1331、 对于处置要点、 关键步骤和操作内容三部分, 按照操作内容, 以每条步骤为
粒度进行实体截取;
步骤1332、 针对同一操作内容在不同加氢裂化装置异常工况处理中具有不同顺序的问
题, 通过对相关重复步骤加入在当前加氢裂化装置异常工况处理流程的操作顺序标签作为
区分依据。
6.根据权利要求1所述的基于加氢裂化装置知识图谱的智能问答系统的构建方法, 其
特征在于, 步骤14中, 将实体列表和关系列表写入图数据库, 完成加氢裂化装置异常工况 处
理知识图谱的构建和可视化, 具体包括:
首先, 安装py2neo包, 通过py2neo包实现pytho n与Neo4j的交互;
其次, 启动Neo4j图数据库, 通过py2neo包中的Graph函数将实体列表和关系列表分别
写入Neo4j图数据库中, 完成加氢裂化装置异常工况处 理知识图谱的构建;
最后, 打开 Neo4j Browser, 即可 得到所构建的知识图谱的可视化页面。
7.据权利要求1所述的基于加氢裂化装置知识图谱的智能问答系统的构建方法, 其特
征在于, 步骤15中, 对预设的用户问题进行分类, 具体包括:
首先、 对步骤14中获得的实体列表进行加载, 构建领域act ree;
其次、 通过步骤12中数据 预处理后得到的实体, 构建不同种类的实体词 表, 根据实体词
表构建相应的问句疑问词;
最后、 对预设的用户问题进行实体规范, 从而与知识图谱中的节点名称一 致。
8.根据权利要求7所述的基于加氢裂化装置知识图谱的智能问答系统的构建方法, 其
特征在于, 对预设的用户问题进行实体规范, 具体包括:
首先、 加载自定义的加氢裂化装置词典, 利用jieba分词, 对预设的用户问题进行预处
理, 得到分词列表;
其次、 结合加氢裂化装置异常工况处 理知识图谱中包 含的实体进行实体规范;
最后、 根据分类主函数, 提取 出用户所提出的问句中包 含的实体名称和查询类别。
9.据权利要求1所述的基于加氢裂化装置知识图谱的智能问答系统的构建方法, 其特
征在于, 步骤15中, 对预设的用户问题进行解析, 具体包括:
首先、 实体类型处理:
根据对预设的用户问题分类后的结果, 提取实体名称和查询类别;
构建实体列表, 提取预设的用户问题中所有的实体名称, 并判断实体列表长度, 若长度
为一, 即只有一个实体, 则根据实体内容确认实体所属的类别; 否则, 即, 至少有两个实体,
则进一步判断实体列表中的实体是否具有上下文关系, 若有上下文关系, 则确定预设的用
户问题所要询问的实体为知识图谱中出现的哪一个, 然后删除其他的实体, 若没有上下文
关系, 则将全部实体作为预设的用户问题中所要询问的实体;
其次、 查询类型处 理:
针对从应急处 理文档数据中得到的实体, 构建相应的sql 查询语句模板;
根据从预设的用户问题中得到的实体类型, 按照所构建的sql查询语句模板返回相应
的sql查询语句。
10.据权利要求9所述的基于加氢裂化装置知识图谱的智能问答系统的构建方法, 其特权 利 要 求 书 2/3 页
3
CN 115357693 A
3
专利 基于加氢裂化装置知识图谱的智能问答系统的构建方法
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:57:49上传分享