说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210446994.4 (22)申请日 2022.04.26 (71)申请人 济南大学 地址 250022 山东省济南市 市中区南 辛庄 西路336号 (72)发明人 马坤 崔本宽 纪科 陈贞翔  杨波  (74)专利代理 机构 济南圣达知识产权代理有限 公司 372 21 专利代理师 赵妍 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/253(2020.01)G06F 40/30(2020.01) (54)发明名称 基于图内图间联合信息传播的假新闻检测 方法及系统 (57)摘要 本发明属于自然语 言处理技术领域, 提供了 基于图内图间联合信息传播的假新闻检测方法 及系统, 包括: 获取待检测文本, 并进行预处理 后, 分别构建文本顺序图、 文本语法图和文本语 义图; 基于文本顺序图、 文本语法图和文本语义 图, 先进行图内信息交互, 再进行图间信息交互 后, 得到联合信息文本顺序图、 联合信息文本语 法图和联合信息文本语义图, 通过图注意力机制 和节点注意力机制, 得到待检测文本的向量表 示, 输入到分类器, 得到待检测文本是否属于假 新闻的结果。 解决了短文本向量化时存在的特征 稀疏问题, 丰富了文本向量表示, 解决了长距离 和非连续文本信息交互缺失问题, 提高文本表示 的精确度。 权利要求书2页 说明书8页 附图3页 CN 114911933 A 2022.08.16 CN 114911933 A 1.基于图内图间联合信息传播的假 新闻检测方法, 其特 征在于, 包括: 获取待检测文本, 并进行 预处理; 基于预处理后的文本, 分别提取文本顺序 特征、 文本语法特征和文本语义特征, 进而构 建文本顺序图、 文本语法图和文本语义图; 基于文本顺序图、 文本语法图和文本语义图, 先进行图内信 息交互, 再进行图间信 息交 互后, 得到联合信息文本顺序图、 联合信息文本语法图和联合信息文本语义图; 基于联合信息文本顺序图、 联合信息文本语法图和联合信息文本语义图, 通过图注意 力机制和节点注意力机制, 得到待检测文本的向量表示; 将待检测文本的向量表示输入到分类 器, 得到待检测文本是否属于假 新闻的结果。 2.如权利要求1所述的基于图内 图间联合信 息传播的假新闻检测方法, 其特征在于, 所 述预处理为对所述待检测文本进行归一 化处理后, 进行 数据增强。 3.如权利要求2所述的基于图内 图间联合信 息传播的假新闻检测方法, 其特征在于, 所 述归一化处理包括: 去除特殊字符、 分词、 删除停用词、 词干提取和单词小 写。 4.如权利要求2所述的基于图内 图间联合信 息传播的假新闻检测方法, 其特征在于, 所 述数据增强包括同义词替换、 随机插 入、 随机交换和随机删除。 5.如权利要求1所述的基于图内 图间联合信 息传播的假新闻检测方法, 其特征在于, 所 述文本顺序特 征的提取 方法为: 利用滑动窗口机制遍历所述预处理后的文本, 计算每个单词对在同一滑动窗口中出现 的次数, 以及每 个单词在所有滑动窗口中出现的次数; 基于所述每个单词对在同一滑动窗口中出现的次数和每个单词在所有滑动窗口中出 现的次数, 获取文本顺序特 征。 6.如权利要求1所述的基于图内 图间联合信 息传播的假新闻检测方法, 其特征在于, 所 述图内信息交互采用重置门和更新 门, 分别对文本顺序图、 文本语法图和文本语义图中的 节点表示以及节点之间的权 重进行更新。 7.如权利要求1所述的基于图内 图间联合信 息传播的假新闻检测方法, 其特征在于, 所 述图间信息交互在进 行图内信息交互后的文本顺序图、 文本语法图和文本语义图之 间进行 信息传播。 8.基于图内图间联合信息传播的假 新闻检测系统, 其特 征在于, 包括: 预处理模块, 其被 配置为: 获取待检测文本, 并进行 预处理; 图构建模块, 其被配置为: 基于预处理后的文本, 分别提取文本顺序特征、 文本语法特 征和文本语义特 征, 进而构建文本顺序图、 文本语法图和文本语义图; 信息传播模块, 其被配置为: 基于文本顺序图、 文本语法图和文本语义图, 先进行图内 信息交互, 再进行图间信息交互后, 得到联合信息文本顺序图、 联合信息文本语法图和联合 信息文本语义图; 向量表示模块, 其被配置为: 基于联合信 息文本顺序图、 联合信 息文本语法图和联合信 息文本语义图, 通过图注意力机制和节点注意力机制, 得到待检测文本的向量表示; 分类模块, 其被配置为: 将待检测文本的向量表示输入到分类器, 得到待检测文本是否 属于假新闻的结果。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执权 利 要 求 书 1/2 页 2 CN 114911933 A 2行时实现如权利要求1 ‑7中任一项 所述的基于图内图间联合信息传播的假新闻检测方法中 的步骤。 10.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求 1‑7中任一项 所述的基 于图内图间联合信息传播的假 新闻检测方法中的步骤。权 利 要 求 书 2/2 页 3 CN 114911933 A 3

.PDF文档 专利 基于图内图间联合信息传播的假新闻检测方法及系统

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于图内图间联合信息传播的假新闻检测方法及系统 第 1 页 专利 基于图内图间联合信息传播的假新闻检测方法及系统 第 2 页 专利 基于图内图间联合信息传播的假新闻检测方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:57:59上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。