说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210859304.8 (22)申请日 2022.07.20 (71)申请人 首都师范大学 地址 100048 北京市海淀区西三环北路5 6 号 申请人 北方工业大 学 (72)发明人 刘杰 许妍欣  (74)专利代理 机构 北京易捷胜知识产权代理有 限公司 1 1613 专利代理师 齐胜杰 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/332(2019.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 语篇要素和要素关系联合抽取方法、 知识图 谱构建方法 (57)摘要 本申请属于人工智能技术领域, 具体涉及一 种语篇要素和要素关系联合抽取方法、 知识图谱 构建方法, 其中联合抽取方法包括: S10、 针对目 标议论文文本, 获取预设的要素类型问题模板, 通过要素类型问题模板生成要素问题; S2 0、 将要 素问题输入到预先建立的问答框架中, 得到头部 要素; 其中, 问答框架为基于机器阅读理解建立 的问答框架; S30、 将头部要素和目标议论文文本 输入到预先建立的要素关系预测模 型中, 得到要 素关系; S40、 基于要素关系和头部要素生成关系 问题; S50、 将关系问题输入到预先建立的问答框 架中, 得到相应的尾部要素。 本申请的方法将语 篇要素和要素关系进行联合抽取, 缓解了错误传 播; 通过多轮问答避免了提取区域的限制。 权利要求书2页 说明书10页 附图2页 CN 115309910 A 2022.11.08 CN 115309910 A 1.一种基于多轮问答的议论文语篇要素和要素关系联合抽取方法, 其特征在于, 该方 法包括: S10、 针对目标议论文文本, 获取预设的要素类型问题模板, 通过所述要素类型问题模 板生成要素问题; S20、 将所述要素问题输入到预先建立的问答框架中, 得到头部要素; 其中, 所述问答框 架为基于 机器阅读理解建立的问答框架; S30、 将所述头部要素和所述目标议论文文本输入到预先建立的要素关系预测模型中, 得到要素关系; 其中, 所述要素关系预测模型基于多分类 器建立; S40、 基于所述要素关系和所述头 部要素生成关系问题; S50、 将所述关系问题输入到预 先建立的问答框架中, 得到相应的尾部要素。 2.根据权利要求1所述的基于多轮问答的议论文语篇要素和要素关系联合抽取方法, 其特征在于, 在S10之前还 包括建立要素类型问题模板 。 3.根据权利要求1所述的基于多轮问答的议论文语篇要素和要素关系联合抽取方法, 其特征在于, S20包括: 将所述要素问题和所述目标议 论文文本输入BERT, 得到基于BERT的语义表示; 将所述语义表示输入到预 先建立的问答框架中, 得到多个问题答案; 基于预设的问题权 重确定头部要素。 4.根据权利要求3所述的基于多轮问答的议论文语篇要素和要素关系联合抽取方法, 其特征在于, 将所述语义表示输入到预 先建立的问答框架中, 得到多个问题答案, 包括: 使用softmax分类层对隐藏层输出ht进行BIOE标签分类; 根据标注后的隐藏层序列, 识别以B开始到 E结束位置上的片段, 作为问题答案 。 5.根据权利要求1所述的基于多轮问答的议论文语篇要素和要素关系联合抽取方法, 其特征在于, S3 0包括: 把BERT输出的上 下文表征 与头部要素的表征 进行串联, 作为要素关系的输入: 其中, 为头部要素的表征, 为上下文表征。 该输入经 过softmax分类 器, 提取要素 ei与每个要素关系类型rk的概率: Pr(label=rk|ei)=σ(Wr·li+br) 其中, σ(·)是S型函数, br∈R|R|, dl是要素标签嵌入的维度, |R|是要 素关系集的大小; 在分类器中得分高的要素关系类型作为要素 ei对应的要素关系。 6.根据权利要求1所述的基于多轮问答的议论文语篇要素和要素关系联合抽取方法, 其特征在于, 所述关系问题中包括头 部要素、 尾部要素类型和要素关系。 7.根据权利要求1所述的基于多轮问答的议论文语篇要素和要素关系联合抽取方法, 其特征在于, 在 模型建立过程中, 对头部语篇要 素、 尾部语篇要 素和要素之间关系的损失函 数进行组合优化, 并共享在 BERT上的训练参数, 每 个批次样本的平均损失 计算如下: 权 利 要 求 书 1/2 页 2 CN 115309910 A 2其中, 为头部语篇要素的损失函数, 为尾部语篇要素的损失函数, 为 要素之间关系的损失函数。 8.一种基于多轮问答的议 论文知识图谱构建方法, 其特 征在于, 该 方法包括: 通过如上权利要求1至8任一项所述的基于多轮问答的议论文语篇要素和要素关系联 合抽取方法抽取 得到头部要素、 尾部要素和要素关系; 将所述头 部要素、 所述要素关系和所述尾部要素作为 三元组, 建立 议论文知识图谱。 9.一种电子设备, 包括: 存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 所述计算机程序被所述处理器执行时实现如上权利要求 1至8任一项所述 的基于多轮问答的议 论文语篇要素和要素关系联合抽取 方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机 程序, 所述计算机程序被处理器执行时实现如上权利要求 1至8任一项 所述的基于多轮问答 的议论文语篇要素和要素关系联合抽取 方法的步骤。权 利 要 求 书 2/2 页 3 CN 115309910 A 3

.PDF文档 专利 语篇要素和要素关系联合抽取方法、知识图谱构建方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 语篇要素和要素关系联合抽取方法、知识图谱构建方法 第 1 页 专利 语篇要素和要素关系联合抽取方法、知识图谱构建方法 第 2 页 专利 语篇要素和要素关系联合抽取方法、知识图谱构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:01:20上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。