(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210562367.7
(22)申请日 2022.05.23
(71)申请人 山东大学
地址 266237 山东省青岛市 即墨滨海路72
号
(72)发明人 任昭春 田智 任鹏杰 陈竹敏
辛鑫 马军
(74)专利代理 机构 济南圣达知识产权代理有限
公司 372 21
专利代理师 黄海丽
(51)Int.Cl.
G06F 16/9535(2019.01)
G06F 16/332(2019.01)
G06F 16/36(2019.01)
G06F 40/30(2020.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06Q 30/06(2012.01)
(54)发明名称
基于用户偏好的对话式推荐方法及系统
(57)摘要
本发明公开了基于用户偏好的对话式推荐
方法及系统, 包括: 获取待对话推荐的用户编号、
用户对话上下文和对话主题线; 将获取的数据输
入到训练以及测试后的对话式推荐模 型中, 输出
对话式推荐结果; 其中, 对话式推荐模型的工作
原理是: 首先, 对获取的数据进行嵌入表示; 然
后, 对嵌入表示结果, 进行用户的长期偏好跟踪
和用户的短期偏好跟踪; 然后, 基于用户的长期
和短期偏好跟踪结果, 输出推荐结果; 最后, 将推
荐结果转换成自然语言回复给待对话推荐的用
户。
权利要求书3页 说明书9页 附图2页
CN 114840763 A
2022.08.02
CN 114840763 A
1.基于用户偏好的对话式推荐方法, 其特 征是, 包括:
获取待对话推荐的用户编号、 用户对话上 下文和对话主题线;
将获取的数据输入到训练以及测试后的对话式推荐模型中, 输出对话式推荐结果;
其中, 对话式推荐模型的工作原理是: 首先, 对获取的数据进行嵌入表示; 然后, 对嵌入
表示结果, 进 行用户的长期偏好跟踪和用户的短期偏好跟踪; 然后, 基于用户的长期和短期
偏好跟踪结果, 输出推荐结果; 最后, 将推荐结果转换成自然语言回复给待对话推荐的用
户。
2.如权利要求1所述的基于用户偏好的对话式推荐方法, 其特征是, 所述对话式推荐模
型, 在训练阶段, 包括: 并列的第一编码器、 第二编码器和第三编码器;
所述第一编码器的输出端分别与第 一解码器的输入端和第 二解码器的输入端连接; 第
二编码器的输出端与分别与第三解码 器的输入端和 第四解码 器的输入端连接; 第三编 码器
的输出端分别与第三 解码器的输入端和第四解码器的输入端连接;
第二解码器的输出端与第四编码器的输入端连接; 第四解码器的输入端与第五编码器
的输入端连接; 第四编码器的输出端、 第五编码器的输出端、 第二编码器的输出端、 第三编
码器的输出端和R ‑GCN网络的输出端均 与第五解码器的输入端连接;
第五解码器的输出端与第六编码器的输入端连接; 第六编码器的输出端与第六解码器
的输入端连接; 所述第六解码器的输入端还分别与第一编码器的输出端、 第二编码器的输
出端和第三编码器的输出端连接; 第六编码器的输出端与第四解码器的输入端连接 。
3.如权利要求2所述的基于用户偏好的对话式推荐方法, 其特征是, 所述第一编码器,
用于输入用户编号 ID, 并对用户编号 ID进行嵌入表示, 得到用户编号 ID的表示;
所述第二编码器, 用于输入对话上下文, 并对对话上下文进行嵌入表示, 得到对话上下
文的表示;
所述第三编码器, 用于输入对话的主题线, 并对对话的主题线进行嵌入表示, 得到对话
主题线的表示。
4.如权利要求2所述的基于用户偏好的对话式推荐方法, 其特征是, 所述第一解码器,
作为先验长期偏好追踪器; 用于输入用户编号ID的表 示, 并输出用户的先验长期偏好; 所述
第一解码器采用变分贝叶斯 算法计算用户长期偏好的概 率分布;
所述第二解码器, 作为后验长期偏好追踪器; 用于输入用户编号ID的表示、 对话上下文
的表示和对话主题线的表示, 并输出用户的后验长期偏好; 所述第二解码器采用变分贝叶
斯算法计算用户长期偏好的概 率分布;
所述第三解码器, 作为先验短期偏好追踪器; 用于输入对话上下文的表示、 对话主题线
的表示和前一轮的用户短期偏好表示, 并输出用户的先验短期偏好; 所述第三解码器采用
变分贝叶斯 算法计算用户短期偏好的概 率分布;
所述第四解码器, 作为后验短期偏好追踪器; 用于输入动作的表示作为输入, 并输出用
户后验短期偏好; 所述第四解码器采用变分贝叶斯 算法计算用户短期偏好的概 率分布。
5.如权利要求2所述的基于用户偏好的对话式推荐方法, 其特征是, 所述第 四编码器,
用于将用户的后验长期偏好的采样后的结果作为输入值, 输出用户后验长期偏好表示;
所述第五编码器, 用于将后语的后验短期偏好的采样后的结果作为输入值, 输出用户
后验短期偏好表示;权 利 要 求 书 1/3 页
2
CN 114840763 A
2所述R‑GCN网络, 用于将从知识图谱中提取的子图作为输入值; 所述知识图谱包括实
体‑关系‑实体三元组; 根据主题线, 在知识图谱上找到与主题线中的主题相邻两跳的节点
作为子图, 使用R ‑GCN网络对子图中的每一个节点进 行编码表 示, 将子图中所有的编码表 示
结果进行汇总, 得到 子图表示;
所述第五解码器, 用于将用户后验长期偏好表示、 用户后验短期偏好表示、 对话上下文
的表示、 对话主题线的表示和子图表示的拼接结果作为输入值, 输出推荐结果。
6.如权利要求1所述的基于用户偏好的对话式推荐方法, 其特征是, 所述训练以及测试
后的对话式推荐模型; 具体过程包括:
构建训练集; 所述训练集 为已知推荐结果的用户编号、 对话上 下文和对话主题线;
将训练集输入到对话式推荐模型中, 对模型进行训练, 当模型的总损 失函数值不再降
低时或迭代次数达 到设定次数时, 停止训练; 得到训练后的对话式推荐模型;
对对话式推荐模型进行微调, 对微调后的模型进行测试, 得到测试后的对话式推荐模
型;
对对话式推荐模型进行微调; 具体包括:
将第二解码器与第四编码器的连接线删除, 并将第 一解码器的输出端与第四解码器的
输入端连接;
将第四解码器与第五编码器的连接线删除, 并将第四解码器的输出端与第五编码器的
输入端连接 。
7.如权利要求6所述的基于用户偏好的对话式推荐方法, 其特征是, 所述总损失函数为
第一损失函数、 第二损失函数和第三损失函数的求和结果;
其中, 第一损失函数为第 一解码器的先验用户长期偏好的概率分布与第 二解码器的后
验用户长期偏好的概率分布的KL距离; 所述第一解码 器的先验用户长期偏好的概率分布与
第二解码器的后验用户长期偏好的概 率分布均通过变分贝叶斯 算法计算得到;
其中, 第二损失函数为第 三解码器的先验用户短期偏好的概率分布与第四解码器的后
验用户短期偏好的概率分布的KL距离; 所述第三解码 器的先验用户短期偏好的概率分布与
第四解码器的后验用户短期偏好的概 率分布均通过变分贝叶斯 算法计算得到;
其中, 第三损失函数为第五解码器的预测动作 与真实动作的差值。
8.基于用户偏好的对话式推荐系统, 其特 征是, 包括:
获取模块, 其被 配置为: 获取待对话推荐的用户编号、 用户对话上 下文和对话主题线;
推荐模块, 其被配置为: 将 获取的数据输入到训练以及测试后的对话式推荐模型中, 输
出对话式推荐结果;
其中, 对话式推荐模型的工作原理是: 首先, 对获取的数据进行嵌入表示; 然后, 对嵌入
表示结果, 进 行用户的长期偏好跟踪和用户的短期偏好跟踪; 然后, 基于用户的长期和短期
偏好跟踪结果, 输出推荐结果; 最后, 将推荐结果转换成自然语言回复给待对话推荐的用
户。
9.一种电子设备, 其特 征是, 包括:
存储器, 用于非暂时性存 储计算机可读指令; 以及
处理器, 用于运行 所述计算机可读指令,
其中, 所述计算机可读指令被所述处理器运行时, 执行上述权利要求1 ‑7任一项所述的权 利 要 求 书 2/3 页
3
CN 114840763 A
3
专利 基于用户偏好的对话式推荐方法及系统
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:58:37上传分享