说明:收录各省市地方标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210477954.6 (22)申请日 2022.04.29 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 鲍思琪 黄信娴 何煌 王凡 吴华 黄世维 何径舟 (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 吴晓兵 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/36(2019.01)G06N 5/02(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 对话生成方法、 模 型的训练方法、 装置、 设备 及介质 (57)摘要 本公开提供了对话生成方法、 用于对话生成 的模型的训练方法、 装置、 电子设备、 存储介质以 及程序产品, 涉及人工智 能技术领域, 尤其涉及 深度学习、 智能搜索、 语音 技术等技术领域。 具体 实现方案为: 基于对话信息, 生成检索信息; 提取 检索信息中的检索对象; 从与检索对象相匹配的 数据源中, 确定与检索信息相匹配的知识信息; 以及基于知识信息, 生成与对话信息相匹配的知 识回复内容。 权利要求书4页 说明书12页 附图6页 CN 114840671 A 2022.08.02 CN 114840671 A 1.一种对话 生成方法, 包括: 基于对话信息, 生成检索信息; 提取所述检索信息中的检索对象; 从与所述检索对象相匹配的数据源中, 确定与所述检索信息相匹配的知识信息; 以及 基于所述知识信息, 生成与所述对话信息相匹配的知识回复内容。 2.根据权利要求1所述的方法, 还 包括: 基于所述对话信息, 生成通用回复内容; 以及 基于所述知识回复内容和所述 通用回复内容, 确定目标回复内容。 3.根据权利要求1或2所述的方法, 其中, 所述确定与所述检索信息相匹配的知识信息 包括: 确定与所述检索信息相匹配的多个候选知识信息; 以及 基于所述多个候选知识信 息各自的点击率, 从所述多个候选知识信 息中确定所述知识 信息。 4.一种用于对话 生成的模型的训练方法, 包括: 基于训练样本的样本对话信息, 生成样本检索信息, 其中, 所述训练样本还包括与所述 样本对话信息相匹配的样本参 考回复内容; 提取所述样本检索信息中的检索对象; 从与所述检索对象相匹配的数据源中, 确定与 所述样本检索信 息相匹配的样本知识信 息; 基于所述样本知识信息, 生成样本知识回复内容; 以及 利用所述样本知识回复内容和所述样本参考回复内容, 训练深度学习模型, 得到语言 处理模型。 5.根据权利要求4所述的方法, 其中, 所述利用所述样本知识回复内容和所述样本参考 回复内容, 训练所述深度学习模型, 得到语言处 理模型包括: 确定所述样本知识回复内容和所述样本参 考回复内容之间的第一目标匹配度; 以及 基于所述第一目标匹配度调整所述深度学习模型的参数, 得到所述语言处 理模型。 6.根据权利要求5所述的方法, 其中, 所述确定所述样本知识回复内容和所述样本参考 回复内容之间的第一目标匹配度包括: 确定所述样本知识回复内容的内容类型; 以及 采用与所述内容类型相匹配的相关性确定方式, 确定所述样本知识回复内容和所述样 本参考回复内容之间的所述第一目标匹配度。 7.根据权利要求 4至6中任一项所述的方法, 还 包括: 基于所述样本对话信息, 得到样本通用回复内容; 所述利用所述样本知识回复内容和所述样本参考回复内容, 训练所述深度学习模型, 得到语言处 理模型包括: 利用所述样本知识回复内容、 所述样本通用回复内容和所述样本参考回复内容, 训练 所述深度学习模型, 得到所述语言处 理模型。 8.根据权利要求7所述的方法, 其中, 所述利用所述样本知识回复内容、 所述样本通用 回复内容和所述样本参 考回复内容, 训练所述深度学习模型, 得到所述语言处 理模型包括:权 利 要 求 书 1/4 页 2 CN 114840671 A 2确定所述样本知识回复内容与所述样本参 考回复内容之间的第一匹配度; 确定所述样本通用回复内容与所述样本参 考回复内容之间的第二匹配度; 从所述第一匹配度和所述第二匹配度中确定第二目标匹配度; 以及 基于所述第二目标匹配度调整所述深度学习模型的参数, 得到所述语言处 理模型。 9.根据权利要求6所述的方法, 其中, 所述第一目标匹配度包括以下至少一项: 语义相似度、 特 征相似度、 共现词频率; 其中, 所述内容类型包括以下至少一项: 链接、 图像、 文本 。 10.根据权利要求4至9中任一项所述的方法, 其中, 所述确定与 所述样本检索信 息相匹 配的样本知识信息包括: 确定与所述样本检索信息相匹配的多个样本候选知识信息; 以及 基于所述多个样本候选知识信 息各自的点击率, 从所述多个样本候选知识信 息中确定 所述样本知识信息 。 11.一种对话 生成方法, 包括: 将对话信息 输入至语言处 理模型中, 得到与所述对话信息相匹配的知识回复内容, 其中, 所述语言处 理模型是利用根据权利要求 4至10中任一项所述的方法训练的。 12.一种对话 生成装置, 包括: 第一生成模块, 用于基于对话信息, 生成检索信息; 提取模块, 用于提取 所述检索信息中的检索对象; 检索模块, 用于从与所述检索对象相匹配的数据源中, 确定与所述检索信息相匹配的 知识信息; 以及 第二生成模块, 用于基于所述知识信息, 生成与所述对话信息相匹配的知识回复内容。 13.根据权利要求12所述的装置, 还 包括: 第三生成模块, 用于基于所述对话信息, 生成通用回复内容; 以及 确定模块, 用于基于所述知识回复内容和所述 通用回复内容, 确定目标回复内容。 14.根据权利要求12或13所述的装置, 其中, 所述检索模块包括: 第一确定单 元, 用于确定与所述检索信息相匹配的多个候选知识信息; 以及 第二确定单元, 用于基于所述多个候选知识信息各自的点击率, 从所述多个候选知识 信息中确定所述知识信息 。 15.一种用于对话 生成的模型的训练装置, 包括: 第一样本生成模块, 用于基于训练样本的样本对话信息, 生成样本检索信息, 其中, 所 述训练样本还 包括与所述样本对话信息相匹配的样本参 考回复内容; 样本提取模块, 用于提取 所述样本检索信息中的检索对象; 样本检索模块, 用于从与所述检索对象相匹配的数据源中, 确定与所述样本检索信息 相匹配的样本知识信息; 第二样本生成模块, 用于基于所述样本知识信息, 生成样本知识回复内容; 以及 训练模块, 用于利用所述样本知识回复内容和所述样本参考回复内容, 训练深度学习 模型, 得到语言处 理模型。 16.根据权利要求15所述的装置, 其中, 所述训练模块包括: 匹配度确定单元, 用于确定所述样本知识回复内容和所述样本参考 回复内容之间的第权 利 要 求 书 2/4 页 3 CN 114840671 A 3
专利 对话生成方法、模型的训练方法、装置、设备及介质
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 10:59:35
上传分享
举报
下载
原文档
(822.8 KB)
分享
友情链接
GB-T 37204-2018 全钒液流电池用电解液.pdf
GB-T 411-2017 棉印染布.pdf
GB-T 35973-2018 集装箱环保技术要求.pdf
DB32-T 4553-2023 医疗机构医疗器械不良事件监测工作指南 江苏省.pdf
国测 电信和互联网行业数据安全治理白皮书 2020.pdf
DB52-T 1041-2015 贵州省红粘土和高液限土路基设计与施工技术规范 贵州省.pdf
山东省数字政府建设实施方案-2.3.pdf
ISO IEC 21122-2 2022 Amd 1 2022 Information technology — JPEG XS low-latency lig.pdf
YD-T 3834.1-2021 量子密钥分发(QKD)系统技术要求 第1部分:基于诱骗态BB84协议的QKD系统.pdf
DB14-T 1822-2019 旅游景区安全评估规范 山西省.pdf
GB-T 43256-2023 分布式光纤应变测试系统参数测试方法.pdf
GB-T 30307-2023 家用和类似用途饮用水处理装置.pdf
SN-T 0066-2015 进口散装铬矿石取样、制样方法.pdf
DB34-T 3379-2019 水利信息系统软件开发集成规范 安徽省.pdf
HJ 25.2-2019 建设用地土壤污染风险管控和修复监测技术导则.pdf
DB3206-T 1040-2022 叉车司机实际操作技能考核规范 南通市.pdf
GM-T 0096-2020 射频识别防伪系统密码应用指南.pdf
GB-T 34095-2017 信息安全技术 用于电子支付的基于近距离无线通信的移动终端安全技术要求.pdf
GB-T 43806-2024 资产管理系统通用技术要求.pdf
T-CIECCPA 009—2020 工业企业节能诊断改造效果评估指南.pdf
1
/
3
23
评价文档
赞助2.5元 点击下载(822.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。