(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210617520.1
(22)申请日 2022.06.01
(71)申请人 中国银行股份有限公司
地址 100818 北京市西城区复兴门内大街1
号
(72)发明人 王均蕤
(74)专利代理 机构 北京三友知识产权代理有限
公司 11127
专利代理师 李辉 王维宁
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/9535(2019.01)
G06Q 10/10(2012.01)
(54)发明名称
基于大数据的自动推荐整改问题责任人的
方法和装置
(57)摘要
本发明提供了一种基于大数据的自动推荐
整改问题责任人的方法和装置, 涉及大数据领
域, 该方法包括: 采集审计人员用户数据, 用户数
据包括审计人员基础信息和偏好信息; 根据审计
人员基础信息和偏好信息建立用户画 像, 用户画
像包括基础用户画像和偏好用户画 像; 获取历史
整改项目数据, 通过提取历史整改项目数据中的
有效特征信息来构建知 识图谱; 依据用户画像和
知识图谱应用二元逻辑回归模型计算预测出最
终整改问题责任 人; 通过前端自动推荐所述最终
问题整改责任 人。 本发明可以节约审计人员手工
梳理分析整改项目及问题、 维护整改责任人的时
间, 还可以提高所选择的整改责任人的准确性,
便于整改组长或跟进人对整改落实、 整改验证等
环节进行监 督和跟进。
权利要求书4页 说明书8页 附图4页
CN 114969373 A
2022.08.30
CN 114969373 A
1.一种基于大 数据的自动推荐 整改问题责任人的方法, 其特 征在于, 所述方法包括:
采集审计人员用户数据, 所述用户数据包括审计人员基础信息和偏好信息;
根据所述审计人员基础信 息和偏好信 息建立用户画像, 所述用户画像包括基础用户画
像和偏好用户画像;
获取历史整改项目数据, 通过提取所述历史整改项目数据中的有 效特征信 息来构建知
识图谱;
依据所述用户画像和所述知识图谱应用二元逻辑回归模型计算预测出最终整改问题
责任人;
通过前端自动推荐所述 最终整改问题责任人。
2.如权利要求1所述的基于大数据的自动推荐整改问题责任人的方法, 其特征在于, 根
据审计人员偏好信息建立偏好用户画像包括: 根据审计人员偏好信息计算用户偏好数据,
根据所述偏好数据建立偏好用户画像, 所述用户偏好数据=次数 ×热度×TFIDF值, 其中,
所述次数 是所述审计人员选择整改问题责任人A的次数;
所述热度=1 ×exp(-时间衰减系数 ×天数), 所述时间衰减系数是根据业务规则指定
的, 所述天数 是所述审计人员上一次选择整改问题责任人A至今所 经历的天数;
所述TFIDF值=TF ×IDF, TF为所述审计人员所有标签中整改问题责任人A标签出现的
频率, IDF为统计范围内所有审计人员数/(带 该整改问题责任人A标签的审计人员数+1)。
3.如权利要求1所述的基于大数据的自动推荐整改问题责任人的方法, 其特征在于, 所
述提取所述历史整改项目数据中的有效特 征信息包括:
对于所述历史整改项目数据中的结构化数据, 通过直接获取的方式进行提取;
对于所述历史整改项目数据中的文本数据, 通过先对所述文本数据做数据清洗, 然后
用分词工具对清洗后的内容进行分词处 理的方式进行提取。
4.如权利要求3所述的基于大数据的自动推荐整改问题责任人的方法, 其特征在于, 通
过有效特 征信息来构建知识图谱 包括:
对于结构化数据, 使用D2R技 术将关系数据库中的内容 转换为RDF三元组;
对于文本数据, 通过基于统计学的机器学习方法完成实体抽取, 通过基于模板的方法
完成关系抽取, 形成 “实体‑关系‑实体”三元组;
利用所述RDF三元组及所述 “实体‑关系‑实体”三元组构建知识图谱。
5.如权利要求1所述的基于大数据的自动推荐整改问题责任人的方法, 其特征在于, 所
述依据所述用户画像和所述知识图谱应用二元逻辑回归模型计算预测出最终整 改问题责
任人包括:
根据所述用户画像确定第一类整改问题责任人;
根据所述知识图谱确定第二类整改问题责任人;
根据所述第一类整改问题责任人及所述第二类整改问题责任人应用二元逻辑回归模
型计算预测出最终整改问题责任人。
6.如权利要求5所述的基于大数据的自动推荐整改问题责任人的方法, 其特征在于, 所
述根据所述用户画像确定第一类整改问题责任人包括:
将所有审计人员的基础用户画像标签、 偏好用户画像标签组成向量a=(A1,A2,...,
An);权 利 要 求 书 1/4 页
2
CN 114969373 A
2将当前审计人员的基础用户画像标签、 偏好用户画像标签组成向量b=( B1,B2,...,
Bn);
使用余弦相似度来进行度量cos(x)=(a ×b)/(||a||×||b||);
将余弦相似度 大于等于预设阈值的审计人员所选择的整改责任人, 作为第 一类整改问
题责任人。
7.如权利要求5所述的基于大数据的自动推荐整改问题责任人的方法, 其特征在于, 所
述根据所述知识图谱确定第二类整改问题责任人包括:
运用FM模型将新整改项目数据中的有效特征信息与构建的知识图谱进行匹配, 计算新
整改项目与整改责任人的匹配度, 将匹配度大于等于设定匹配阈值的整改责任人向作为第
二类整改问题责任人。
8.如权利要求5所述的基于大数据的自动推荐整改问题责任人的方法, 其特征在于, 所
述根据所述第一类整 改问题责任人及所述第二类整 改问题责任人应用二元逻辑回归模型
计算预测出最终整改问题责任人包括:
将所述第一类整改问题责任人及所述第二类整改问题责任人的初始权重都设置为
0.5, 应用二元逻辑回归模型计算出最 终整改问题责任人的预测结果, 并将所述预测结果进
行由大到小排序以通过 前端自动推荐所述 最终问题整改责任人。
9.如权利要求8所述的基于大数据的自动推荐整改问题责任人的方法, 其特征在于, 还
包括: 获取用户在前端对自动推荐的所述最终问题整 改责任人的选择结果信息, 根据所述
选择结果信息对所述第一类整 改问题责任人及所述第二类整 改问题责任人的权重值进行
调整, 使用梯度下降算法, 不断对二元逻辑回归 模型进行训练和优化。
10.一种基于大 数据的自动推荐 整改问题责任人的装置, 其特 征在于, 所述装置包括:
用户数据采集单元, 用于采集审计人员用户数据, 所述用户数据包括审计人员 基础信
息和偏好信息;
用户画像建立单元, 用于根据所述审计人员 基础信息和偏好信息建立用户画像, 所述
用户画像包括基础用户画像和偏好用户画像;
项目数据采集单 元, 用于获取历史整改项目数据;
知识图谱构建单元, 用于通过提取所述历史整改项目数据中的有 效特征信 息来构建知
识图谱;
整改推荐单元, 用于依据所述用户画像和所述知识图谱应用二元逻辑 回归模型计算预
测出最终整改问题责任人, 并通过 前端自动推荐所述 最终整改问题责任人。
11.如权利要求10所述的基于大数据的自动推荐整改问题责任人的装置, 所述用户画
像建立单元根据审计人员偏好信息 建立偏好用户画像具体包括: 根据审 计人员偏好信息计
算用户偏好数据, 根据所述偏好数据建立偏好用户画像, 所述用户偏好数据=次数 ×热度
×TFIDF值, 其中,
所述次数 是所述审计人员选择整改问题责任人A的次数;
所述热度=1 ×exp(-时间衰减系数 ×天数), 所述时间衰减系数是根据业务规则指定
的, 所述天数 是所述审计人员上一次选择整改问题责任人A至今所 经历的天数;
所述TFIDF值=TF ×IDF, TF为所述审计人员所有标签中整改问题责任人A标签出现的
频率, IDF为统计范围内所有审计人员数/(带 该整改问题责任人A标签的审计人员数+1)。权 利 要 求 书 2/4 页
3
CN 114969373 A
3
专利 基于大数据的自动推荐整改问题责任人的方法和装置
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:58:16上传分享