说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210676002.7 (22)申请日 2022.06.15 (71)申请人 北京捷通 华声科技股份有限公司 地址 100193 北京市海淀区东北旺西路8号 9号楼3层2区318 (72)发明人 杨春阳 邢启洲 李健 陈明  武卫东  (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 专利代理师 苏培华 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/289(2020.01)G06F 40/211(2020.01) G06F 40/295(2020.01) G06N 3/04(2006.01) (54)发明名称 问答处理方法、 装置、 电子设备和计算机可 读介质 (57)摘要 本发明公开了一种问答处理方法、 装置、 电 子设备和计算机可读介质, 涉及自然语 言处理技 术领域。 该方法包括: 获取用户的查询文本, 对所 述查询文本进行分词, 得到多个第一分词; 对所 述查询文本进行命名实体识别, 根据命名实体识 别结果对所述多个第一分词进行修正, 得到多个 第二分词; 根据所述多个第二分词和预构建的依 存句法分析模 型, 确定所述多个第二分词之间的 依赖关系; 根据所述多个第二分词、 所述依赖关 系和预构建的知识图谱, 确定所述查询文本的查 询意图; 根据所述查询意图进行查询, 确定所述 查询文本的答案。 该实施方式能够准确理解复杂 问题的意图, 向用户反馈精准的答案, 并且提高 了实体识别准确率。 权利要求书2页 说明书13页 附图7页 CN 115114419 A 2022.09.27 CN 115114419 A 1.一种问答处 理方法, 其特 征在于, 包括: 获取用户的查询文本, 对所述 查询文本进行分词, 得到多个第一分词; 对所述查询文本进行命名实体识别, 根据命名实体识别结果对所述多个第 一分词进行 修正, 得到多个第二分词; 根据所述多个第 二分词和预构建的依存句法分析模型, 确定所述多个第 二分词之间的 依赖关系; 根据所述多个第二分词、 所述依赖关系和预构建的知识图谱, 确定所述查询文本的查 询意图; 根据所述 查询意图进行查询, 确定所述 查询文本的答案 。 2.根据权利要求1所述的方法, 其特征在于, 所述命名实体识别结果包括多个命名实 体; 根据命名实体识别结果对所述多个第一分词进行修 正, 得到多个第二分词, 包括: 针对每一所述第一分词, 将所述第一分词与每个所述命名实体进行匹配, 确定所述第 一分词的开始位置和/或结束位置是否属于所述命名实体; 若 是, 则将所述命名实体作为所 述分词对应的目标命名实体; 根据所述第一分词及所述目标命名实体, 对所述多个第一分词进行组合, 得到多个第 二分词。 3.根据权利要求1或2所述的方法, 其特 征在于, 所述方法还 包括: 构建命名实体分类体系; 所述命名实体分类体系包括以下至少一项: 实体、 实体类别、 属性词、 关系词、 条件值、 约束条件和聚合 函数; 根据所述命名实体分类体系 对训练样本数据进行标注, 确定所述训练样本数据中的命 名实体; 对标注后的所述训练样本数据进行训练, 得到命名实体识别模型; 对所述查询文本进行命名实体识别包括: 利用所述命名实体识别模型, 对所述查询文 本进行命名实体识别。 4.根据权利要求3所述的方法, 其特征在于, 所述依存句法分析模型包括第 一分析模型 和第二分析模型; 所述第一分析模型用于确定所述第二分词之间的中文句法关系, 所述第 二分析模型用于确定所述第二分词之间的问答逻辑关系; 所述中文句法关系包括以下至少一项: 主谓关系、 动宾关系、 间宾关系、 定中关系、 状 中 结构、 动补结构、 并列关系 、 介宾关系和附加关系; 所述问答逻辑关系包括以下至少一项: 主实体关系、 主实体约束关系、 主实体主体关 系、 主关系、 关系约束、 无意 义成分、 并列关系。 5.根据权利要求4所述的方法, 其特征在于, 根据所述多个第二分词、 所述依赖关系和 预构建的知识图谱, 确定所述 查询文本的查询意图包括: 对所述多个第二分词和所述知识图谱进行实体链接、 属性链接和关系链接, 确定候选 实体、 候选属性和候选关系; 根据所述候选实体、 所述候选属性、 所述候选关系和所述依赖关系作为特征数据, 将所 述特征数据与预构建的知识图谱中的三元组进行匹配, 确定所述 查询文本的查询路径。 6.根据权利要求5所述的方法, 其特 征在于, 所述方法还 包括:权 利 要 求 书 1/2 页 2 CN 115114419 A 2根据所述依赖关系, 确定所述 查询文本属于多跳查询语句; 将所述特征数据与 所述知识图谱中的三元组进行匹配, 确定所述查询文本的查询路径 包括: 根据预设的限制规则, 将所述特征数据与所述知识图谱中的三元组进行匹配, 确定所 述查询文本的查询路径, 其中, 所述预设的限制规则用于指示将所述查询文本的跳数限制 在预设范围内。 7.根据权利要求6所述的方法, 其特 征在于, 所述方法还 包括: 在所述查询文本的命名实体识别结果中包括约束条件和/或聚合函数的情况下, 将所 述约束条件和/或聚合 函数挂载在所述 候选实体上。 8.一种问答处 理装置, 其特 征在于, 包括: 分词模块, 用于获取用户的查询文本, 对所述 查询文本进行分词, 得到多个第一分词; 修正模块, 用于对所述查询文本进行命名实体识别, 根据命名实体识别结果对所述多 个第一分词进行修 正, 得到多个第二分词; 关系确定模块, 用于根据所述多个第二分词和预构建的依存句法分析模型, 确定所述 多个第二分词之间的依赖关系; 意图识别模块, 用于根据 所述多个第 二分词、 所述依赖关系和预构建的知识图谱, 确定 所述查询文本的查询意图; 查询模块, 用于根据所述 查询意图进行查询, 确定所述 查询文本的答案 。 9.一种电子设备, 其特 征在于, 包括: 一个或多个处 理器; 存储装置, 用于存 储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理器执行, 使得所述一个或多个处理器实 现如权利要求1 ‑7中任一所述的方法。 10.一种计算机可读介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理器执 行时实现如权利要求1 ‑7中任一所述的方法。权 利 要 求 书 2/2 页 3 CN 115114419 A 3

.PDF文档 专利 问答处理方法、装置、电子设备和计算机可读介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 问答处理方法、装置、电子设备和计算机可读介质 第 1 页 专利 问答处理方法、装置、电子设备和计算机可读介质 第 2 页 专利 问答处理方法、装置、电子设备和计算机可读介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:01:33上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。