说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210476152.3 (22)申请日 2022.04.29 (71)申请人 广东美的厨房电器制造有限公司 地址 528311 广东省佛山市顺德区北滘镇 永安路6号 申请人 美的集团股份有限公司 (72)发明人 钱志达 孙裕文  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 张娜 (51)Int.Cl. G06F 16/332(2019.01) G06F 40/35(2020.01) G06F 16/35(2019.01) G06F 16/36(2019.01)G06F 16/31(2019.01) (54)发明名称 构建方法、 构建系统、 厨房电器、 计算机可读 存储介质 (57)摘要 本发明公开了一种构建方法、 构建系统、 厨 房电器、 计算机可读存储介质。 构建方法包括: 获 取关键词; 根据关键词获取菜谱相关的问答对; 对问答对进行筛选并形成问答库; 基于关键词, 对问答库进行聚类处理, 生成问答对的意图分 组。 上述构建方法, 可通过菜谱关键词匹配的方 式和基于菜谱关键词的聚类方法, 进行烹饪领域 菜谱知识问答数据库的自动构建, 能够省去大量 的人工且覆盖菜谱的多个知识方面, 对于每一个 问题意图能够获取不同用户的不同可能问法, 增 强了问答对数据库的覆盖范围和语义泛化 性。 权利要求书1页 说明书9页 附图4页 CN 114817503 A 2022.07.29 CN 114817503 A 1.一种菜 谱类知识问答对库的构建方法, 其特 征在于, 包括: 获取关键词; 根据所述关键词获取菜 谱相关的问答对; 对所述问答对进行筛 选并形成问答库; 基于所述关键词, 对所述问答库进行聚类处 理, 生成所述问答对的意图分组。 2.根据权利要求1所述的构建方法, 其特 征在于, 获取关键词, 包括: 从预设的相关文本中获取词频 大于或等于词频阈值的词语作为所述关键词。 3.根据权利要求1所述的构建方法, 其特 征在于, 获取关键词, 包括: 将预设的相关文本的问题中的词转 化为高维向量表示; 根据聚类算法对向量空间中的词进行聚类处 理; 获取与菜 谱中心词距离小于距离阈值的词作为所述关键词。 4.根据权利要求1所述的构建方法, 其特征在于, 根据所述关键词获取菜谱相关的问答 对, 包括: 利用所述关键词形成关键词组合; 基于所述关键词组合进行匹配以获取 所述问答对。 5.根据权利要求1所述的构建方法, 其特征在于, 对所述问答对进行筛选并形成问答 库, 包括以下至少一种筛 选条件: 设置问题长度阈值; 所述问答对中是否包括预设的关键词表中的词; 根据短文本语义距离衡量方法设置距离阈值。 6.根据权利要求1所述的构建方法, 其特 征在于, 所述构建方法还 包括: 对所述问答库进行扩充。 7.根据权利要求1所述的构建方法, 其特征在于, 基于所述关键词, 对所述问答库进行 聚类处理, 生成所述问答对的意图分组, 包括: 利用所述关键词对所述问答库进行意图初分以得到不同意图的问答对分组; 对所述问答对分组进行细聚类, 将相同问题意图的问答对归为同一类以得到所述问答 对的意图分组。 8.根据权利要求1所述的构建方法, 其特 征在于, 所述构建方法还 包括: 筛选所述问答对的意图分组。 9.一种菜 谱类知识问答对库的构建系统, 其特 征在于, 包括: 第一获取模块, 用于获取关键词; 第二获取模块, 用于根据所述关键词获取菜 谱相关的问答对; 筛选模块, 用于对所述问答对进行筛 选并形成问答库; 意图分类模块, 用于基于所述关键词, 对所述问答库进行聚类处理, 生成所述问答对的 意图分组。 10.一种厨房电器, 其特征在于, 包括存储器和处理器, 所述存储器存储有计算机程序, 所述处理器执行所述计算机程序时, 实现权利要求1 ‑8任一项所述的构建方法。 11.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 在被处理器执行时, 实现权利要求1 ‑8任一项所述的构建方法。权 利 要 求 书 1/1 页 2 CN 114817503 A 2构建方法、 构建系统、 厨房电器、 计算机可 读存储介质 技术领域 [0001]本发明涉及厨房智能化技术领域, 特别涉及一种构建方法、 构建系统、 厨房电器、 计算机可读存 储介质。 背景技术 [0002]在相关技术中, 烹饪知识智能问答系统分析用户提出的问题, 然后在已经构建的 问答数据库中寻找最相似的问题并返回对应的答案, 所以智能问答系统的基础是烹饪类知 识问答对数据库。 [0003]然而针对同一菜谱内容, 不 同用户提出的问题五花八门, 对于同一类问题的问法 也是各种各样, 完全通过 人工搜集问答库效率低且不全面。 发明内容 [0004]本发明提供了一种构建方法、 构建系统、 厨房电器、 计算机可读存 储介质。 [0005]本发明实施方式提供的一种菜 谱类知识问答对库的构建方法, 包括: [0006]获取关键词; [0007]根据所述关键词获取菜 谱相关的问答对; [0008]对所述问答对进行筛 选并形成问答库; [0009]基于所述关键词, 对所述问答库进行聚类处 理, 生成所述问答对的意图分组。 [0010]上述构建方法, 可通过菜谱关键词匹配的方式和基于菜谱关键词的聚类方法, 进 行烹饪领域菜谱知识问答数据库的自动构建, 能够省 去大量的人工且覆盖菜谱的多个知识 方面, 对于每一个 问题意图能够获取不同用户的不同可能问法, 增强了 问答对数据库的覆 盖范围和语义泛化 性。 [0011]在某些实施方式 中, 获取关键词, 包括: [0012]从预设的相关文本中获取词频 大于或等于词频阈值的词语作为所述关键词。 [0013]在某些实施方式 中, 获取关键词, 包括: [0014]将预设的相关文本的问题中的词转 化为高维向量表示; [0015]根据聚类算法对向量空间中的词进行聚类处 理; [0016]获取与菜 谱中心词距离小于距离阈值的词作为所述关键词。 [0017]在某些实施方式 中, 根据所述关键词获取菜 谱相关的问答对, 包括: [0018]利用所述关键词形成关键词组合; [0019]基于所述关键词组合进行匹配以获取 所述问答对。 [0020]在某些实施方式中, 对所述问答对进行筛选并形成问答库, 包括以下至少一种筛 选条件: [0021]设置问题长度阈值; [0022]所述问答对中是否包括预设的关键词表中的词; [0023]根据短文本语义距离衡量方法设置距离阈值。说 明 书 1/9 页 3 CN 114817503 A 3

.PDF文档 专利 构建方法、构建系统、厨房电器、计算机可读存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 构建方法、构建系统、厨房电器、计算机可读存储介质 第 1 页 专利 构建方法、构建系统、厨房电器、计算机可读存储介质 第 2 页 专利 构建方法、构建系统、厨房电器、计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:00:13上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。