说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210908587.0 (22)申请日 2022.07.29 (71)申请人 招商局金融科技有限公司 地址 518000 广东省深圳市福田区华 富街 道皇岗路5001号深业上城(南区)二期 35层、 36层 (72)发明人 谢正文 欧阳此君  夏璨 王阳  刘屹 孙敬萍 孙猛 龙喜洋  (74)专利代理 机构 深圳市沃德知识产权代理事 务所(普通 合伙) 44347 专利代理师 高杰 于志光 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/332(2019.01) G06F 16/36(2019.01)G06F 40/268(2020.01) G06F 40/289(2020.01) (54)发明名称 问题扩展方法、 装置、 电子设备及计算机可 读存储介质 (57)摘要 本发明涉及人工智能技术, 揭露一种问题扩 展方法、 装置、 设备以及存储介质。 所述方法包 括: 提取待扩展问句中的询问方式词及实体名 词; 在问答库中抽取包含所述询问方式词的标准 问及与所述标准问含义相同的同义问, 将所述询 问方式词与同义问中包含的询问方式词记为关 键词; 对所述标准问和同义问进行分词及词性标 注, 得到句式结构; 根据所述句式结构提取所述 关键词在所述标准问及同义问中的前相邻实义 词和后相邻实义词; 在所述关键词中抽取询问方 式词, 及抽取前相邻实义词及后相邻实义词, 根 据所述关键词、 前相邻实义词、 后相邻实义词及 所述专有名词按照预设的语 法格式, 组成预设数 量的扩展问。 本发明可以根据输入的问句自动生 成扩展问。 权利要求书2页 说明书9页 附图2页 CN 115269778 A 2022.11.01 CN 115269778 A 1.一种问题扩展方法, 其特 征在于, 所述方法包括: 获取待扩展问句, 提取 所述待扩展问句中的询问方式词及实体名词; 在预设的问答库中抽取包含所述询问方式词的问句记为标准问及与所述标准问含义 相同的问句记为同义问, 并将所述询问方式词 与所述同义问中包含的其他询问方式词统一 记为关键词; 对所述标准问和同义问进行分词及词性标注, 得到句式结构; 根据所述句式结构提取所述关键词在所述标准问及同义问中的前相邻实义词和后相 邻实义词, 将所述前相邻实义词和后相邻实义词组成二元组; 在所述关键词中随机抽取预设数量的询问方式词, 在所述二元组中抽取预设数量的前 相邻实义词及后相 邻实义词, 根据所述关键词、 前相 邻实义词、 后相 邻实义词及所述专有名 词按照预设的语法格式, 组成预设数量的扩展问。 2.如权利要求1所述的问题扩展方法, 其特征在于, 所述对所述标准问和同义问进行分 词, 包括: 按照预设的分词策略将所述标准问和同义问中的字符串和一个预先建立的分词词典 中的词进行匹配, 得到初始分词集 合; 根据所述初始分词集合, 利用预构建的概率分词模型计算得到所述标准问和同义问的 分词。 3.如权利要求2所述的问题扩展方法, 其特征在于, 所述根据所述初始分词集合, 利用 预构建的概 率分词模型计算得到所述标准问和同义问的分词, 包括: 利用下述 概率分词模型P(S)计算所述初始分词集 合中每个分词的概 率: 其中, W1,W2,…,Wm为所述初始分词集合, m为所述初始分词集合中分词的数量, p(Wi| Wi‑1)表示在分词Wi‑1出现的情况 下词Wi出现的概 率; 选取所述概率大于预设阈值的分词Wi‑1作为所述标准问和同义问的分词。 4.如权利要求1所述的问题扩展方法, 其特征在于, 所述根据所述句式结构提取所述关 键词在所述标准问及同义问中的前相邻实义词和后相邻实义词, 包括: 判断所述关键词在所述标准问及同义问中的索引位置m; 由所述句式结构提取索引在m之前的实义词, 记为前相邻实义词s1; 由所述句式结构提取索引在m之后的实义词, 记为后相邻实义词s2; 由所述s1与s2组成二元组(s1,s2)。 5.如权利要求1所述的问题扩展方法, 其特征在于, 所述提取所述待扩展问句中的询问 方式词, 包括: 将所述待扩展问句与 预设的扩展词库进行匹配, 将所述待扩展问句中与所述扩展词库 匹配成功的词作为所述扩展问句中的询问方式词。 6.如权利要求1所述的问题扩展方法, 其特征在于, 所述在预设的问答库中抽取包含所 述询问方式词的问句记为标准问及与所述标准问含义相同的问句记为同义问, 包括: 在预设的问答库中检索所述询问方式词, 并标注所述询问方式词所在的问句; 将所述标注的问句提取至预设的文本文档并记为标准问;权 利 要 求 书 1/2 页 2 CN 115269778 A 2将与所述标准问具有映射关系的问句提取至所述文本文档, 记为同义问。 7.如权利要求1所述的问题扩展方法, 其特 征在于, 所述获取待扩展问句包括: 接受用户输入的待扩展问句; 判断所述待扩展问句的文本格式; 当所述待扩展问句为文本格式为文本格式时, 直接获取 所述待扩展问句; 当所述待扩展问句为文本格式为语音格式时, 利用预设的文本转换工具将所述语音格 式的待扩展问句转换为文本格式的待扩展问句。 8.一种问题扩展装置, 其特 征在于, 所述装置包括: 问句解析模块, 用于获取待扩展问句, 提取所述待扩展问句中的询问方式词及实体名 词; 关键词提取模块, 用于在预设的问答库中抽取包含所述询问方式词的问句记为标准问 及与所述标准问含义相同的问句记为同义问, 并将所述询问方式词与所述同义问中包含的 其他询问方式词统一记为关键词; 句式结构生成模块, 用于对所述标准问和同义问进行分词及词性标注, 得到句式结构; 二元组提取模块, 用于根据 所述句式结构提取所述关键词在所述标准问及同义问中的 前相邻实义词和后相邻实义词, 将所述前相邻实义词和后相邻实义词组成二元组; 扩展问生成模块, 用于在所述关键词中随机抽取预设数量的询问方式词, 在所述二元 组中抽取预设数量的前相 邻实义词及后相 邻实义词, 根据所述关键词、 前相邻实义词、 后相 邻实义词及所述专有名词按照预设的语法格式, 组成预设数量的扩展问。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及, 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使 所述至少一个处理器能够执行如权利要求 1至7中任意一项 所 述的问题扩展方法。 10.一种计算机可读存储介质, 存储有计算机程序, 其特征在于, 所述计算机程序被处 理器执行时实现如权利要求1至7中任意 一项所述的问题扩展方法。权 利 要 求 书 2/2 页 3 CN 115269778 A 3

.PDF文档 专利 问题扩展方法、装置、电子设备及计算机可读存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 问题扩展方法、装置、电子设备及计算机可读存储介质 第 1 页 专利 问题扩展方法、装置、电子设备及计算机可读存储介质 第 2 页 专利 问题扩展方法、装置、电子设备及计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:01:36上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。