(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210587664.7
(22)申请日 2022.05.27
(71)申请人 青岛文达通科技股份有限公司
地址 266500 山东省青岛市黄岛区望江路
500号
(72)发明人 管洪清 徐亮 王伟 张元杰
张大千 尹广楹 孙浩云
(74)专利代理 机构 济南圣达知识产权代理有限
公司 372 21
专利代理师 董雪
(51)Int.Cl.
G06F 16/36(2019.01)
G06N 3/04(2006.01)
G06F 40/289(2020.01)
G06F 40/295(2020.01)G06F 16/335(2019.01)
G06F 16/35(2019.01)
G06F 16/903(2019.01)
(54)发明名称
基于事理知识图谱的虚假消息识别方法及
系统
(57)摘要
本发明提供一种基于事理知识图谱的虚假
消息识别方法及系统, 属于信息处理技术领域,
包括: 获取事件之间的逻辑关系; 基于事件之间
的逻辑关系, 抽取事件的名称; 基于事件的名称,
抽取事件的特征, 加入事理知识图谱中; 将舆情
事件与事理知识图谱进行对齐, 选择该舆情事件
的相关的子知识图谱; 通过预训练的编码模型对
子知识图谱进行处理, 得到消息识别结果。 本发
明通过LDA主题模型、 分词、 命名实体识别技术抽
取事件的特征并将事件的特征一同加入事理知
识图谱中, 增强图谱对事件的表征能力, 利用自
优化机制实现指代消解和事件特征更新, 降低图
谱冗余, 从而保证知识图谱的质量, 以有效准确
识别虚假消息 。
权利要求书1页 说明书6页 附图3页
CN 115391546 A
2022.11.25
CN 115391546 A
1.一种基于事理知识图谱的虚假消息识别方法, 其特 征在于, 包括:
获取事件之间的逻辑关系;
基于事件之间的逻辑关系, 抽取事 件的名称;
基于事件的名称, 抽取事 件的特征, 加入事理知识图谱中;
将舆情事 件与事理知识图谱进行对齐, 选择 该舆情事 件的相关的子知识图谱;
通过预训练的编码模型对子知识图谱进行处 理, 得到消息识别结果。
2.根据权利要求1所述的基于事理知识图谱的虚假消息识别方法, 其特征在于, 事件之
间的逻辑关系包括: 因果关系 、 顺承关系 、 转折关系、 条件关系和并发关系。
3.根据权利要求1所述的基于事理知识图谱的虚假消息识别方法, 其特征在于, 分割头
事件与尾事件的文本描述范围, 通过端到端的融合词性信息的BiLSTM ‑CRF事件抽取模 型抽
取事件的名称。
4.根据权利要求1所述的基于事理知识图谱的虚假消息识别方法, 其特征在于, 利用
LDA主题模 型、 分词、 命名实体识别技术抽取事件的特征并将事件的特征一同加入事理知识
图谱中, 增强图谱 对事件的表征能力。
5.根据权利要求1所述的基于事理知识图谱的虚假消息识别方法, 其特征在于, 利用自
优化机制实现事件中的文本指代消 解和事件特征更新, 降低图谱冗余, 保证事理知识图谱
的质量。
6.根据权利要求1所述的基于事理知识图谱的虚假消息识别方法, 其特征在于, 利用模
式匹配规则识别事 件之间的逻辑关系。
7.一种基于事理知识图谱的虚假消息识别系统, 其特 征在于, 包括:
获取模块, 用于获取事 件之间的逻辑关系;
抽取模块, 用于基于事 件之间的逻辑关系, 抽取事 件的名称;
添加模块, 用于基于事 件的名称, 抽取事 件的特征, 加入事理知识图谱中;
选择模块, 用于将舆情事件与事理知识图谱进行对齐, 选择该舆情事件的相关的子知
识图谱;
识别模块, 用于通过 预训练的编码模型对子知识图谱进行处 理, 得到消息识别结果。
8.一种非暂态计算机可读存储介质, 其特征在于, 所述非暂态计算机可读存储介质用
于存储计算机指 令, 所述计算机指 令被处理器执行时, 实现如权利要求 1‑6任一项所述的基
于事理知识图谱的虚假消息识别方法。
9.一种计算机程序产品, 其特征在于, 包括计算机程序, 所述计算机程序当在一个或多
个处理器上运行时, 用于实现如权利要求1 ‑6任一项所述的基于事理知识图谱的虚假消息
识别方法。
10.一种电子设备, 其特征在于, 包括: 处理器、 存储器以及计算机程序; 其中, 处理器与
存储器连接, 计算机程序被存储在 存储器中, 当电子 设备运行时, 所述处理器执行所述存储
器存储的计算机程序, 以使电子设备执行实现如权利要求1 ‑6任一项所述的基于事理知识
图谱的虚假消息识别方法的指令 。权 利 要 求 书 1/1 页
2
CN 115391546 A
2基于事理知识图谱的虚假消 息识别方 法及系统
技术领域
[0001]本发明涉及信息处理技术领域, 具体涉及一种基于事理知识图谱的虚假 消息识
别方法及系统。
背景技术
[0002]现有的一种虚假消息的识别方法及其设备, 其技术方案为: 获取包含目 标消息的
多个载体文本, 以及各个载体文本的传播路径: 基于载体文本以及 传播用户的标识, 得到
各个载体文本的文本矩阵; 将各个文本矩阵导入至预 设的特征向量计算模型, 得到目标消
息的文本特征向量; 根据所有载体文本 的传播路径, 生成关千目标消息的用户传播矩阵;
将用户传播矩阵导入到预 设的用户特征计算模型, 得到目标消息对应的用户传播特征向
量; 根据用户 传播特征向量以及文本特征向量, 计算目标消息的真伪指数; 若在预设的虚
假指数范围内, 则识别所述目标消息为虚假消息 。
[0003]而上述现有的虚假消息识别模型, 多直接使用预训练模型进行编码, 然 后通过
softmax层分类, 仅能证明该文本是否由机器人自动生成, 而忽略了消 息本身是由人类故
意放出, 消息 本身与事实不符, 因此 无法准确鉴别消息的 真伪。
发明内容
[0004]本发明的目的在于提供一种以事理知识图谱作为虚假消息识别的底层知 识库,
从而提高真伪消息鉴别的准确 率的基于事理知识图谱的虚假消息识别 方法及系统, 以解
决上述背景技 术中存在的至少一项技 术问题。
[0005]为了实现上述目的, 本发明采取了如下技 术方案:
[0006]一方面, 本发明提供一种基于事理知识图谱的虚假消息识别方法, 包 括:
[0007]获取事件之间的逻辑关系;
[0008]基于事件之间的逻辑关系, 抽取事 件的名称;
[0009]基于事件的名称, 抽取事 件的特征, 加入事理知识图谱中;
[0010]将舆情事 件与事理知识图谱进行对齐, 选择 该舆情事 件的相关的子知识 图谱;
[0011]通过预训练的编码模型对子知识图谱进行处 理, 得到消息识别结果。
[0012]可选的, 事件之间的逻辑关系, 包括: 因果关系、 顺承关系、 转折关 系、 条件关系和
并发关系。
[0013]可选的, 分割头事件与尾事件的文本描述范围, 通过端到端的融合词性 信息的
BiLSTM‑CRF事件抽取模型抽取事 件的名称。
[0014]可选的, 利用LDA主题模型、 分词、 命名实体识别技术抽取事件的特征 并将事件的
特征一同加入 事理知识图谱中, 增强图谱 对事件的表征能力。
[0015]可选的, 利用自优化机制实现事件中的文本指代消解和事件特征更新, 降低图谱
冗余, 保证事理知识图谱的质量。
[0016]可选的, 利用模式匹配规则识别事 件之间的逻辑关系。说 明 书 1/6 页
3
CN 115391546 A
3
专利 基于事理知识图谱的虚假消息识别方法及系统
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:57:42上传分享