说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210477954.6 (22)申请日 2022.04.29 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 鲍思琪 黄信娴 何煌 王凡  吴华 黄世维 何径舟  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 吴晓兵 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/36(2019.01)G06N 5/02(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 对话生成方法、 模 型的训练方法、 装置、 设备 及介质 (57)摘要 本公开提供了对话生成方法、 用于对话生成 的模型的训练方法、 装置、 电子设备、 存储介质以 及程序产品, 涉及人工智 能技术领域, 尤其涉及 深度学习、 智能搜索、 语音 技术等技术领域。 具体 实现方案为: 基于对话信息, 生成检索信息; 提取 检索信息中的检索对象; 从与检索对象相匹配的 数据源中, 确定与检索信息相匹配的知识信息; 以及基于知识信息, 生成与对话信息相匹配的知 识回复内容。 权利要求书4页 说明书12页 附图6页 CN 114840671 A 2022.08.02 CN 114840671 A 1.一种对话 生成方法, 包括: 基于对话信息, 生成检索信息; 提取所述检索信息中的检索对象; 从与所述检索对象相匹配的数据源中, 确定与所述检索信息相匹配的知识信息; 以及 基于所述知识信息, 生成与所述对话信息相匹配的知识回复内容。 2.根据权利要求1所述的方法, 还 包括: 基于所述对话信息, 生成通用回复内容; 以及 基于所述知识回复内容和所述 通用回复内容, 确定目标回复内容。 3.根据权利要求1或2所述的方法, 其中, 所述确定与所述检索信息相匹配的知识信息 包括: 确定与所述检索信息相匹配的多个候选知识信息; 以及 基于所述多个候选知识信 息各自的点击率, 从所述多个候选知识信 息中确定所述知识 信息。 4.一种用于对话 生成的模型的训练方法, 包括: 基于训练样本的样本对话信息, 生成样本检索信息, 其中, 所述训练样本还包括与所述 样本对话信息相匹配的样本参 考回复内容; 提取所述样本检索信息中的检索对象; 从与所述检索对象相匹配的数据源中, 确定与 所述样本检索信 息相匹配的样本知识信 息; 基于所述样本知识信息, 生成样本知识回复内容; 以及 利用所述样本知识回复内容和所述样本参考回复内容, 训练深度学习模型, 得到语言 处理模型。 5.根据权利要求4所述的方法, 其中, 所述利用所述样本知识回复内容和所述样本参考 回复内容, 训练所述深度学习模型, 得到语言处 理模型包括: 确定所述样本知识回复内容和所述样本参 考回复内容之间的第一目标匹配度; 以及 基于所述第一目标匹配度调整所述深度学习模型的参数, 得到所述语言处 理模型。 6.根据权利要求5所述的方法, 其中, 所述确定所述样本知识回复内容和所述样本参考 回复内容之间的第一目标匹配度包括: 确定所述样本知识回复内容的内容类型; 以及 采用与所述内容类型相匹配的相关性确定方式, 确定所述样本知识回复内容和所述样 本参考回复内容之间的所述第一目标匹配度。 7.根据权利要求 4至6中任一项所述的方法, 还 包括: 基于所述样本对话信息, 得到样本通用回复内容; 所述利用所述样本知识回复内容和所述样本参考回复内容, 训练所述深度学习模型, 得到语言处 理模型包括: 利用所述样本知识回复内容、 所述样本通用回复内容和所述样本参考回复内容, 训练 所述深度学习模型, 得到所述语言处 理模型。 8.根据权利要求7所述的方法, 其中, 所述利用所述样本知识回复内容、 所述样本通用 回复内容和所述样本参 考回复内容, 训练所述深度学习模型, 得到所述语言处 理模型包括:权 利 要 求 书 1/4 页 2 CN 114840671 A 2确定所述样本知识回复内容与所述样本参 考回复内容之间的第一匹配度; 确定所述样本通用回复内容与所述样本参 考回复内容之间的第二匹配度; 从所述第一匹配度和所述第二匹配度中确定第二目标匹配度; 以及 基于所述第二目标匹配度调整所述深度学习模型的参数, 得到所述语言处 理模型。 9.根据权利要求6所述的方法, 其中, 所述第一目标匹配度包括以下至少一项: 语义相似度、 特 征相似度、 共现词频率; 其中, 所述内容类型包括以下至少一项: 链接、 图像、 文本 。 10.根据权利要求4至9中任一项所述的方法, 其中, 所述确定与 所述样本检索信 息相匹 配的样本知识信息包括: 确定与所述样本检索信息相匹配的多个样本候选知识信息; 以及 基于所述多个样本候选知识信 息各自的点击率, 从所述多个样本候选知识信 息中确定 所述样本知识信息 。 11.一种对话 生成方法, 包括: 将对话信息 输入至语言处 理模型中, 得到与所述对话信息相匹配的知识回复内容, 其中, 所述语言处 理模型是利用根据权利要求 4至10中任一项所述的方法训练的。 12.一种对话 生成装置, 包括: 第一生成模块, 用于基于对话信息, 生成检索信息; 提取模块, 用于提取 所述检索信息中的检索对象; 检索模块, 用于从与所述检索对象相匹配的数据源中, 确定与所述检索信息相匹配的 知识信息; 以及 第二生成模块, 用于基于所述知识信息, 生成与所述对话信息相匹配的知识回复内容。 13.根据权利要求12所述的装置, 还 包括: 第三生成模块, 用于基于所述对话信息, 生成通用回复内容; 以及 确定模块, 用于基于所述知识回复内容和所述 通用回复内容, 确定目标回复内容。 14.根据权利要求12或13所述的装置, 其中, 所述检索模块包括: 第一确定单 元, 用于确定与所述检索信息相匹配的多个候选知识信息; 以及 第二确定单元, 用于基于所述多个候选知识信息各自的点击率, 从所述多个候选知识 信息中确定所述知识信息 。 15.一种用于对话 生成的模型的训练装置, 包括: 第一样本生成模块, 用于基于训练样本的样本对话信息, 生成样本检索信息, 其中, 所 述训练样本还 包括与所述样本对话信息相匹配的样本参 考回复内容; 样本提取模块, 用于提取 所述样本检索信息中的检索对象; 样本检索模块, 用于从与所述检索对象相匹配的数据源中, 确定与所述样本检索信息 相匹配的样本知识信息; 第二样本生成模块, 用于基于所述样本知识信息, 生成样本知识回复内容; 以及 训练模块, 用于利用所述样本知识回复内容和所述样本参考回复内容, 训练深度学习 模型, 得到语言处 理模型。 16.根据权利要求15所述的装置, 其中, 所述训练模块包括: 匹配度确定单元, 用于确定所述样本知识回复内容和所述样本参考 回复内容之间的第权 利 要 求 书 2/4 页 3 CN 114840671 A 3

.PDF文档 专利 对话生成方法、模型的训练方法、装置、设备及介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 对话生成方法、模型的训练方法、装置、设备及介质 第 1 页 专利 对话生成方法、模型的训练方法、装置、设备及介质 第 2 页 专利 对话生成方法、模型的训练方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:59:35上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。