说明:收录各省市地方标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210859304.8 (22)申请日 2022.07.20 (71)申请人 首都师范大学 地址 100048 北京市海淀区西三环北路5 6 号 申请人 北方工业大 学 (72)发明人 刘杰 许妍欣 (74)专利代理 机构 北京易捷胜知识产权代理有 限公司 1 1613 专利代理师 齐胜杰 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/332(2019.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 语篇要素和要素关系联合抽取方法、 知识图 谱构建方法 (57)摘要 本申请属于人工智能技术领域, 具体涉及一 种语篇要素和要素关系联合抽取方法、 知识图谱 构建方法, 其中联合抽取方法包括: S10、 针对目 标议论文文本, 获取预设的要素类型问题模板, 通过要素类型问题模板生成要素问题; S2 0、 将要 素问题输入到预先建立的问答框架中, 得到头部 要素; 其中, 问答框架为基于机器阅读理解建立 的问答框架; S30、 将头部要素和目标议论文文本 输入到预先建立的要素关系预测模 型中, 得到要 素关系; S40、 基于要素关系和头部要素生成关系 问题; S50、 将关系问题输入到预先建立的问答框 架中, 得到相应的尾部要素。 本申请的方法将语 篇要素和要素关系进行联合抽取, 缓解了错误传 播; 通过多轮问答避免了提取区域的限制。 权利要求书2页 说明书10页 附图2页 CN 115309910 A 2022.11.08 CN 115309910 A 1.一种基于多轮问答的议论文语篇要素和要素关系联合抽取方法, 其特征在于, 该方 法包括: S10、 针对目标议论文文本, 获取预设的要素类型问题模板, 通过所述要素类型问题模 板生成要素问题; S20、 将所述要素问题输入到预先建立的问答框架中, 得到头部要素; 其中, 所述问答框 架为基于 机器阅读理解建立的问答框架; S30、 将所述头部要素和所述目标议论文文本输入到预先建立的要素关系预测模型中, 得到要素关系; 其中, 所述要素关系预测模型基于多分类 器建立; S40、 基于所述要素关系和所述头 部要素生成关系问题; S50、 将所述关系问题输入到预 先建立的问答框架中, 得到相应的尾部要素。 2.根据权利要求1所述的基于多轮问答的议论文语篇要素和要素关系联合抽取方法, 其特征在于, 在S10之前还 包括建立要素类型问题模板 。 3.根据权利要求1所述的基于多轮问答的议论文语篇要素和要素关系联合抽取方法, 其特征在于, S20包括: 将所述要素问题和所述目标议 论文文本输入BERT, 得到基于BERT的语义表示; 将所述语义表示输入到预 先建立的问答框架中, 得到多个问题答案; 基于预设的问题权 重确定头部要素。 4.根据权利要求3所述的基于多轮问答的议论文语篇要素和要素关系联合抽取方法, 其特征在于, 将所述语义表示输入到预 先建立的问答框架中, 得到多个问题答案, 包括: 使用softmax分类层对隐藏层输出ht进行BIOE标签分类; 根据标注后的隐藏层序列, 识别以B开始到 E结束位置上的片段, 作为问题答案 。 5.根据权利要求1所述的基于多轮问答的议论文语篇要素和要素关系联合抽取方法, 其特征在于, S3 0包括: 把BERT输出的上 下文表征 与头部要素的表征 进行串联, 作为要素关系的输入: 其中, 为头部要素的表征, 为上下文表征。 该输入经 过softmax分类 器, 提取要素 ei与每个要素关系类型rk的概率: Pr(label=rk|ei)=σ(Wr·li+br) 其中, σ(·)是S型函数, br∈R|R|, dl是要素标签嵌入的维度, |R|是要 素关系集的大小; 在分类器中得分高的要素关系类型作为要素 ei对应的要素关系。 6.根据权利要求1所述的基于多轮问答的议论文语篇要素和要素关系联合抽取方法, 其特征在于, 所述关系问题中包括头 部要素、 尾部要素类型和要素关系。 7.根据权利要求1所述的基于多轮问答的议论文语篇要素和要素关系联合抽取方法, 其特征在于, 在 模型建立过程中, 对头部语篇要 素、 尾部语篇要 素和要素之间关系的损失函 数进行组合优化, 并共享在 BERT上的训练参数, 每 个批次样本的平均损失 计算如下: 权 利 要 求 书 1/2 页 2 CN 115309910 A 2其中, 为头部语篇要素的损失函数, 为尾部语篇要素的损失函数, 为 要素之间关系的损失函数。 8.一种基于多轮问答的议 论文知识图谱构建方法, 其特 征在于, 该 方法包括: 通过如上权利要求1至8任一项所述的基于多轮问答的议论文语篇要素和要素关系联 合抽取方法抽取 得到头部要素、 尾部要素和要素关系; 将所述头 部要素、 所述要素关系和所述尾部要素作为 三元组, 建立 议论文知识图谱。 9.一种电子设备, 包括: 存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 所述计算机程序被所述处理器执行时实现如上权利要求 1至8任一项所述 的基于多轮问答的议 论文语篇要素和要素关系联合抽取 方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机 程序, 所述计算机程序被处理器执行时实现如上权利要求 1至8任一项 所述的基于多轮问答 的议论文语篇要素和要素关系联合抽取 方法的步骤。权 利 要 求 书 2/2 页 3 CN 115309910 A 3
专利 语篇要素和要素关系联合抽取方法、知识图谱构建方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 11:01:20
上传分享
举报
下载
原文档
(719.2 KB)
分享
友情链接
T-CAAMTB 126—2023 铝合金车轮自动去毛刺 工艺规范.pdf
GB-T 18994-2014 电子工业用气体 高纯氯.pdf
YD-T 3763.4-2020 研发运营一体化(DevOps)能力成熟度模型 第4部分:技术运营.pdf
GB-T 22071.1-2018 互感器试验导则 第1部分:电流互感器.pdf
法律法规 南通市科技创新促进条例2023-12-11.pdf
GB-T 25058-2010 信息安全技术 信息系统安全等级保护实施指南.pdf
GB-T 29716.1-2013 机械振动与冲击 信号处理 第1部分:引论.pdf
GB-T 20042.1-2017 质子交换膜燃料电池 第1部分:术语.pdf
ISOIEC 30111-2019.pdf
GW0101-2014 国家电子政务外网 信息安全标准体系框架.pdf
CREST 应急响应指南 CSIR-Procurement-Guide 英文版.pdf
GB-T 37964-2019 信息安全技术 个人信息去标识化指南.pdf
DB4106-T 69-2022 数字乡村平台建设指南 鹤壁市.pdf
GB-T 36558-2018 电力系统电化学储能系统通用技术条件.pdf
GB-T 12688.5-2019 工业用苯乙烯试验方法 第5部分:总醛含量的测定 滴定法.pdf
GB-T 17799.2-2023 电磁兼容 通用标准 第2部分:工业环境中的抗扰度标准.pdf
GB-T 18936-2020 高致病性禽流感诊断技术.pdf
DB15-T 2824—2022 敖汉沙棘油加工技术规程 内蒙古自治区.pdf
T-NAIA 0215—2023 煤基厨灶用液体燃料.pdf
GB-T 32293-2015 真空技术 真空设备的检漏方法选择.pdf
1
/
3
15
评价文档
赞助2.5元 点击下载(719.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。