(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210810625.9
(22)申请日 2022.07.11
(71)申请人 贝壳找房(北京)科技有限公司
地址 100085 北京市海淀区创业路2号1幢1
层102室
(72)发明人 陈开江 王杰 蔡健宇 陈佳俊
冯扬 张露露 叶杰平
(74)专利代理 机构 北京思源智汇知识产权代理
有限公司 1 1657
专利代理师 毛丽琴
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 16/36(2019.01)
G06K 9/62(2022.01)
G06Q 30/00(2012.01)
(54)发明名称
线上交互处理方法和装置、 存储介质和程序
产品
(57)摘要
本公开实施例公开了一种线上信息交互处
理方法和装置、 存储介质和程序产品, 其中, 该方
法包括: 响应于接收到第一用户发送的第一消
息, 确定第一消息对应的四元组信息, 该四元组
信息为预设四元组中的元素实例化后得到的信
息, 预设四元组中的元素包括: 话术动作, 头实
体, 尾实体, 头实体与尾实体 之间的关系; 基于第
一消息对应的四元组信息和第一消息的上文消
息对应的四元组信息, 预测本次对话中下一消息
对应的四元 组信息; 向第二用户推送下一消息对
应的四元 组信息, 以便第二用户基于下一消息对
应的四元 组信息生成第一消息的回复消息。 通过
上述线上信息交互处理方法, 可以提升服务人员
与客户之间的沟通效率并提升客户的用户体验。
权利要求书3页 说明书26页 附图7页
CN 115186092 A
2022.10.14
CN 115186092 A
1.一种线上交 互处理方法, 其特 征在于, 包括:
响应于接收到第 一用户发送的第 一消息, 确定所述第 一消息对应的四元组信 息; 其中,
所述四元组信息为预设四元组中的元素实例化后得到的信息, 所述预设四元组中的元素包
括: 话术动作, 头实体, 尾实体, 所述头实体与所述尾实体之间的关系;
基于所述第 一消息对应的四元组信 息和所述第 一消息的上文消息对应的四元组信 息,
预测本次对话中下一消息对应的四元 组信息; 其中, 所述上文消息包括: 本次对话中时序位
于所述第一消息之前、 且基于时序关系排列的至少一条历史消息;
向第二用户推送所述下一消息对应的四元组信 息, 以便所述第 二用户基于所述下一消
息对应的四元组信息生成所述第一消息的回复消息 。
2.根据权利要求1所述的方法, 其特征在于, 所述确定所述第一消息对应的四元组信
息, 包括:
基于所述第一消息和所述上文消息, 确定所述第一消息对应的四元组信息 。
3.根据权利要求2所述的方法, 其特征在于, 所述基于所述第一消息和所述上文消息,
确定所述第一消息对应的四元组信息, 包括:
基于预设消息窗口大小L, 从所述上文消息中选取所述第一消息的前L条历史消息; 其
中, 所述前L条历史消息为所述上文消息中的最后L条历史消息, L 为大于0的整数;
采用预设注意力机制, 确定所述前L条历史消息中的各条历史消息对所述第一消息的
注意力权重值, 并基于所述第一消息、 所述各条历史消息及所述各条历史消息对所述第一
消息的注意力权 重值, 获取 所述第一消息对应的第一权 重消息;
基于所述第一权 重消息, 确定所述第一权 重消息对应的四元组信息 。
4.根据权利要求3所述的方法, 其特征在于, 所述采用预设注意力 机制, 确定所述前L条
历史消息中的各条历史消息对所述第一消息的注意力权重值, 并基于所述第一消息、 所述
各条历史消息及所述各条历史消息对所述第一消息的注意力权重值, 获取所述第一消息对
应的第一权 重消息, 包括:
基于消息内部词级别的注意力机制, 确定所述第一消息中各词的注意力权重值; 分别
基于所述第一消息中各词的注意力权重值, 对所述第一消息中对应的词的词向量进行加权
处理, 得到所述第一消息对应的第一中间权 重消息;
分别针对所述前L条历史消息 中的各条历史消息: 基于消息外部词级别的注意力 机制,
确定所述历史消息中各词对所述第一消息的注意力权重值; 分别基于所述历史消息中各词
对所述第一消息的注意力权重值, 对所述历史消息中对应的词的词向量进行加权处理, 得
到所述历史消息对应的第一外 部权重消息;
基于消息级别的注意力机制, 确定所述各条历史消息对所述第一消息的注意力权重
值; 分别基于所述各条历史消息对所述第一消息的注意力权重值, 对对应的所述历史消息
对应的第一外部权重消息进行加权处理, 得到所述各条历史消息对应的第二外部权重消
息;
基于预设权重值, 对所述前L条历史消息对应的第 二外部权重消息进行加权处理, 得到
所述前L条历史消息对应的第三外 部权重消息;
基于所述第 一消息对应的第 一中间权重消息和所述前L条历史消息对应的第 三外部权
重消息, 得到所述第一消息对应的第二中间权 重消息;权 利 要 求 书 1/3 页
2
CN 115186092 A
2基于任务级别的注意力 机制, 得到所述各条历史消息对应的第 二中间权重消息的注意
力权重值; 分别基于所述各条历史消息对应的第二中间权重消息的注意力权重值, 对对应
的所述历史消息进行加权处 理, 得到所述各 条历史消息对应的第四外 部权重消息;
基于所述第 一消息对应的第 二中间权重消息和所述前L条历史消息对应的第四外部权
重消息, 得到所述第一消息对应的第一权 重消息。
5.根据权利要求3或4所述的方法, 其特征在于, 所述基于所述第一权重消息, 确定所述
第一权重消息对应的四元组信息, 包括:
基于所述第一权重消息, 利用预先训练得到的元素分类模型, 对所述第一权重消息对
应的话术动作、 头实体、 尾实体、 以及头实体与尾实体之间的关系分别进行分类, 得到话术
动作分类结果、 头实体 分类结果、 尾实体 分类结果、 以及头实体与尾实体之 间的关系分类结
果;
基于所述话术动作分类结果、 所述头实体分类结果、 所述尾实体分类结果、 以及所述关
系分类结果, 利用条件随机场模型, 确定所述第一权重消息对应的四元组信息; 其中, 基于
所述条件随机场模型确定的四元组信息对应的函数值最大, 所述条件随机场模型用于确定
所述四元组中的各元素分别被分类为各分类结果时的分数, 以及所述头实体分类结果、 所
述尾实体分类结果和所述关系分类结果中的任意两个分类结果之间的相关性分数之和。
6.根据权利要求3 ‑5任一所述的方法, 其特征在于, 还包括训练得到所述元素分类模型
的步骤:
获取至少一组训练样本, 所述训练样本包括: 一次对话中的消息序列中最后一条样本
消息对应的第一样本权重消息, 所述消息序列包括基于时序关系排序的多条样本消息, 所
述最后一条样本消息标注有所述四元组的第一实例化标注信息;
分别针对所述至少一组训练样本 中的各组训练样本, 将所述第 一样本权重消息输入待
训练元素分类模型, 经所述待训练元素分类模 型输出所述最后一条样本消息对应的第一四
元组预测信息;
基于所述第 一实例化标注信 息与所述第一四元组预测信 息, 对所述待训练元素分类模
型进行迭代训练, 直至达到第一预设训练完成条件, 得到预训练元素分类模型或者所述元
素分类模型; 其中, 所述预训练元 素分类模型用于经 过进一步训练得到所述元 素分类模型。
7.根据权利要求6所述的方法, 其特征在于, 所述得到预训练元素分类模型之后, 还包
括:
获取至少一组测试样本, 所述测试样本包括: 一次对话中的消息序列中最后一条样本
消息对应的第一样本 权重消息, 所述消息序列包括基于时序关系排序的多条样本消息;
分别针对所述至少一组测试样本 中的各组测试样本, 将所述测试样本中的第 一样本权
重消息输入所述预训练元素分类模型, 经所述预训练元素分类模型输出所述测试样本中最
后一条样本消息对应的第二四元组预测信息;
响应于接收到对所述第 二四元组预测信 息的修正操作, 获取修正后的第 二四元组预测
信息作为对应的测试样本中最后一条样本消息的第二 实例化标注信息, 基于所述对应的测
试样本和所述对应的测试样本中最后一条样本消息的第二实例化标注信息, 得到至少一组
新增训练样本;
分别针对所述至少一组新增训练样本 中的各组新增训练样本, 将所述新增训练样本中权 利 要 求 书 2/3 页
3
CN 115186092 A
3
专利 线上交互处理方法和装置、存储介质和程序产品
文档预览
中文文档
37 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共37页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 11:00:59上传分享