专利 对话生成方法、模型的训练方法、装置、设备及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210477954.6 (22)申请日 2022.04.29 (71)申请人北京百度网讯科技有限公司地址 100085 北京市海淀区上地十街10号百度大厦2层 (72)发明人鲍思琪　黄信娴　何煌　王凡　吴华　黄世维　何径舟　 (74)专利代理机构中科专利商标代理有限责任公司 11021 专利代理师吴晓兵 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/36(2019.01)G06N 5/02(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称对话生成方法、模型的训练方法、装置、设备及介质 (57)摘要本公开提供了对话生成方法、用于对话生成的模型的训练方法、装置、电子设备、存储介质以及程序产品，涉及人工智能技术领域，尤其涉及深度学习、智能搜索、语音技术等技术领域。具体实现方案为：基于对话信息，生成检索信息；提取检索信息中的检索对象；从与检索对象相匹配的数据源中，确定与检索信息相匹配的知识信息；以及基于知识信息，生成与对话信息相匹配的知识回复内容。权利要求书4页说明书12页附图6页 CN 114840671 A 2022.08.02 CN 114840671 A 1.一种对话生成方法，包括：基于对话信息，生成检索信息；提取所述检索信息中的检索对象；从与所述检索对象相匹配的数据源中，确定与所述检索信息相匹配的知识信息；以及基于所述知识信息，生成与所述对话信息相匹配的知识回复内容。 2.根据权利要求1所述的方法，还包括：基于所述对话信息，生成通用回复内容；以及基于所述知识回复内容和所述通用回复内容，确定目标回复内容。 3.根据权利要求1或2所述的方法，其中，所述确定与所述检索信息相匹配的知识信息包括：确定与所述检索信息相匹配的多个候选知识信息；以及基于所述多个候选知识信息各自的点击率，从所述多个候选知识信息中确定所述知识信息。 4.一种用于对话生成的模型的训练方法，包括：基于训练样本的样本对话信息，生成样本检索信息，其中，所述训练样本还包括与所述样本对话信息相匹配的样本参考回复内容；提取所述样本检索信息中的检索对象；从与所述检索对象相匹配的数据源中，确定与所述样本检索信息相匹配的样本知识信息；基于所述样本知识信息，生成样本知识回复内容；以及利用所述样本知识回复内容和所述样本参考回复内容，训练深度学习模型，得到语言处理模型。 5.根据权利要求4所述的方法，其中，所述利用所述样本知识回复内容和所述样本参考回复内容，训练所述深度学习模型，得到语言处理模型包括：确定所述样本知识回复内容和所述样本参考回复内容之间的第一目标匹配度；以及基于所述第一目标匹配度调整所述深度学习模型的参数，得到所述语言处理模型。 6.根据权利要求5所述的方法，其中，所述确定所述样本知识回复内容和所述样本参考回复内容之间的第一目标匹配度包括：确定所述样本知识回复内容的内容类型；以及采用与所述内容类型相匹配的相关性确定方式，确定所述样本知识回复内容和所述样本参考回复内容之间的所述第一目标匹配度。 7.根据权利要求 4至6中任一项所述的方法，还包括：基于所述样本对话信息，得到样本通用回复内容；所述利用所述样本知识回复内容和所述样本参考回复内容，训练所述深度学习模型，得到语言处理模型包括：利用所述样本知识回复内容、所述样本通用回复内容和所述样本参考回复内容，训练所述深度学习模型，得到所述语言处理模型。 8.根据权利要求7所述的方法，其中，所述利用所述样本知识回复内容、所述样本通用回复内容和所述样本参考回复内容，训练所述深度学习模型，得到所述语言处理模型包括：权　利　要　求　书 1/4 页 2 CN 114840671 A 2确定所述样本知识回复内容与所述样本参考回复内容之间的第一匹配度；确定所述样本通用回复内容与所述样本参考回复内容之间的第二匹配度；从所述第一匹配度和所述第二匹配度中确定第二目标匹配度；以及基于所述第二目标匹配度调整所述深度学习模型的参数，得到所述语言处理模型。 9.根据权利要求6所述的方法，其中，所述第一目标匹配度包括以下至少一项：语义相似度、特征相似度、共现词频率；其中，所述内容类型包括以下至少一项：链接、图像、文本。 10.根据权利要求4至9中任一项所述的方法，其中，所述确定与所述样本检索信息相匹配的样本知识信息包括：确定与所述样本检索信息相匹配的多个样本候选知识信息；以及基于所述多个样本候选知识信息各自的点击率，从所述多个样本候选知识信息中确定所述样本知识信息。 11.一种对话生成方法，包括：将对话信息输入至语言处理模型中，得到与所述对话信息相匹配的知识回复内容，其中，所述语言处理模型是利用根据权利要求 4至10中任一项所述的方法训练的。 12.一种对话生成装置，包括：第一生成模块，用于基于对话信息，生成检索信息；提取模块，用于提取所述检索信息中的检索对象；检索模块，用于从与所述检索对象相匹配的数据源中，确定与所述检索信息相匹配的知识信息；以及第二生成模块，用于基于所述知识信息，生成与所述对话信息相匹配的知识回复内容。 13.根据权利要求12所述的装置，还包括：第三生成模块，用于基于所述对话信息，生成通用回复内容；以及确定模块，用于基于所述知识回复内容和所述通用回复内容，确定目标回复内容。 14.根据权利要求12或13所述的装置，其中，所述检索模块包括：第一确定单元，用于确定与所述检索信息相匹配的多个候选知识信息；以及第二确定单元，用于基于所述多个候选知识信息各自的点击率，从所述多个候选知识信息中确定所述知识信息。 15.一种用于对话生成的模型的训练装置，包括：第一样本生成模块，用于基于训练样本的样本对话信息，生成样本检索信息，其中，所述训练样本还包括与所述样本对话信息相匹配的样本参考回复内容；样本提取模块，用于提取所述样本检索信息中的检索对象；样本检索模块，用于从与所述检索对象相匹配的数据源中，确定与所述样本检索信息相匹配的样本知识信息；第二样本生成模块，用于基于所述样本知识信息，生成样本知识回复内容；以及训练模块，用于利用所述样本知识回复内容和所述样本参考回复内容，训练深度学习模型，得到语言处理模型。 16.根据权利要求15所述的装置，其中，所述训练模块包括：匹配度确定单元，用于确定所述样本知识回复内容和所述样本参考回复内容之间的第权　利　要　求　书 2/4 页 3 CN 114840671 A 3

专利 对话生成方法、模型的训练方法、装置、设备及介质

专利对话生成方法、模型的训练方法、装置、设备及介质