说明:收录各省市地方标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211509870.2 (22)申请日 2022.11.29 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 王维强 张长浩 申书恒 傅欣艺 (74)专利代理 机构 北京博思佳知识产权代理有 限公司 1 1415 专利代理师 李威 (51)Int.Cl. G06F 16/174(2019.01) G06N 3/04(2006.01) (54)发明名称 一种模型压缩的方法、 装置、 存储介质及电 子设备 (57)摘要 本说明书公开了一种模型压缩的方法、 装 置、 存储介质及电子设备, 可以获取待压缩模型, 并确定该待压缩模型的模型结构参数, 以及根据 模型结构参数, 确定针对待压缩模 型的若干种压 缩方案,而后, 根据各种压缩 方案, 确定每种压缩 方案对应的待评估模型, 再针对每种压缩方案, 根据预设的样本数据, 确定该压缩 方案对应的待 评估模型处理该样本数据得到输出结果所消耗 的数据处理时长, 作为该压缩 方案对应的数据处 理时长, 从而根据每种压缩 方案对应的数据处理 时长, 确定目标压缩方案, 并根据目标压缩 方案, 对待压缩模 型进行压缩, 从而提高通过神经网络 模型执行业务的效率, 保护用户的隐私数据。 权利要求书2页 说明书11页 附图4页 CN 115543945 A 2022.12.30 CN 115543945 A 1.一种模型压缩的方法, 包括: 获取待压缩 模型; 确定所述待压缩模型的模型结构参数, 并根据所述模型结构参数, 确定针对所述待压 缩模型的若干种压缩方案; 根据各种压缩方案, 确定每种压缩方案对应的待评估 模型; 针对每种压缩方案, 根据预设的样本数据, 确定该压缩方案对应的待评估模型处理所 述样本数据得到 输出结果所消耗的数据处 理时长, 作为该压缩方案对应的数据处 理时长; 根据每种压缩方案对应的数据处理时长, 确定目标压缩方案, 并根据所述目标压缩方 案, 对所述待压缩 模型进行压缩。 2.如权利要求1所述的方法, 所述模型结构参数包括所述待压缩模型中的卷积核的尺 寸; 根据所述模型 结构参数, 确定针对所述待压缩 模型的若干种压缩方案, 包括: 根据所述待压缩模型中卷积核的尺寸, 确定对所述待压缩模型的卷积核进行压缩后所 述卷积核的尺寸; 根据所述压缩尺寸, 将所述待压缩模型的卷积核进行调整, 得到至少一种调整后的卷 积核; 根据所述至少一种调整后的卷积核, 确定针对所述待压缩 模型的若干种压缩方案 。 3.如权利要求1所述的方法, 所述模型 结构参数包括所述待压缩 模型的网络层数; 根据所述模型 结构参数, 确定针对所述待压缩 模型的若干种压缩方案, 包括: 根据所述待压缩模型的网络层数, 确定将所述待压缩模型中的不同网络层进行组合的 组合方式; 根据所述组合方式, 确定针对所述待压缩 模型的若干种压缩方案 。 4.如权利要求1所述的方法, 所述模型结构参数包括所述待压缩模型每一网络层的卷 积核的数量; 根据所述模型 结构参数, 确定针对所述待压缩 模型的若干种压缩方案, 包括: 针对所述待压缩模型中的每个网络层, 根据该网络层实 际包含的卷积核的数量, 确定 该网络层所采用的卷积核的候选数量, 所述候选数量不超过该网络层中实际包含的卷积核 的数量; 根据每个网络层所采用的卷积核的候选数量, 确定针对所述待压缩模型的若干种压缩 方案。 5.如权利要求1所述的方法, 针对每种压缩方案, 根据预设的样本数据, 确定该压缩方 案对应的待评估模型 处理所述样本数据得到输出结果所消耗的数据处理 时长, 作为该压缩 方案对应的数据处 理时长, 包括: 从所述若干种压缩方案 中选取出部分压缩方案, 并将所述样本数据输入到所述部分压 缩方案对应的待评估 模型中, 以得到所述部分压缩方案对应的数据处 理时长; 根据所述部分压缩方案对应的数据处理时长以及所述部分压缩方案中包含的模型结 构参数, 构建训练样本; 将所述训练样本包含的模型结构参数输入到时长预测模型中, 得到预测时长, 并以所 述预测时长与所述部分压缩方案对应的数据处理 时长之间的偏差最小化为优化目标, 对所权 利 要 求 书 1/2 页 2 CN 115543945 A 2述时长预测模型进行训练; 通过训练后的时长预测模型, 预测得到剩余压缩方案对应的数据处 理时长。 6.如权利要求1所述的方法, 根据每种压缩方案对应的数据处理时长, 确定目标压缩方 案, 包括: 对所述每种压缩方案对应的待评估 模型的参数量进行分档, 得到分档结果; 针对所述分档结果中每个参数量档位, 根据 该参数量档位中对应数据处理时长不超过 该参数量档位对应的设定时长的压缩方案, 确定该参数量档位对应的目标压缩方案 。 7.如权利要求6所述的方法, 根据该参数量档位中对应数据处理时长不超过该参数量 档位对应的设定时长的压缩方案, 确定该参数量档位对应的目标压缩方案, 包括: 将该参数量档位中对应数据处理时长不超过该参数量档位对应的设定时长的压缩方 案, 作为各候选 压缩方案; 将所述各候选压缩方案 中包含的模型结构参数进行聚类, 得到所述各候选压缩方案对 应的聚类中心; 根据所述聚类中心对应的模型 结构参数, 确定该参数量档位对应的目标压缩方案 。 8.一种模型压缩的装置, 包括: 获取模块, 用于获取待压缩 模型; 方案确定模块, 用于确定所述待压缩模型的模型结构参数, 并根据 所述模型结构参数, 确定针对所述待压缩 模型的若干种压缩方案; 模型确定模块, 用于根据各种压缩方案, 确定每种压缩方案对应的待评估 模型; 时长确定模块, 用于针对每种压缩方案, 根据 预设的样本数据, 确定该压缩方案对应的 待评估模型处理所述样 本数据得到输出结果所消耗的数据处理时长, 作为该压缩方案对应 的数据处 理时长; 压缩模块, 用于根据每种压缩方案对应的数据处理时长, 确定目标压缩方案, 并根据 所 述目标压缩方案, 对所述待压缩 模型进行压缩。 9.一种计算机可读存储介质, 所述存储介质存储有计算机程序, 所述计算机程序被处 理器执行时实现上述权利要求1~7任一项所述的方法。 10.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 所述处 理器执行所述程序时实现上述权利要求1~7 任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115543945 A 3
专利 一种模型压缩的方法、装置、存储介质及电子设备
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-24 00:57:58
上传分享
举报
下载
原文档
(713.1 KB)
分享
友情链接
DB13-T 1460-2011 电热地暖系统安全与节能规范 河北省.pdf
思度安全-DSMM-010 数据处理环境安全管理规范V1.0.pdf
NY-T 3648-2020 草地植被健康监测评价方法.pdf
DB22-T 2445-2016 节能技术改造及合同能源管理项目节能量审核与计算方法第1部分 照明系统 吉林省.pdf
GM-T 0010-2012 SM2密码算法加密签名消息语法规范.pdf
GB-T 43435-2023 信息安全技术 移动互联网应用程序 App 软件开发工具包 SDK 安全要求.pdf
CSA AI安全白皮书.pdf
GM-T 0091-2020 基于口令的密钥派生规范.pdf
GB-T 36431-2018 消费品分类与代码.pdf
信通院 中国宽带发展白皮书-2019年.pdf
T-SDL 3.4—2021 10 kV智能电缆系统技术规范 第4部分 10 kV交联聚乙烯绝缘智能电力电缆附件.pdf
WS-T 305-2009 卫生信息数据集元数据规范.pdf
T-ZZB 0971—2019 0.01% 24-表芸苔素内酯水剂.pdf
GM-T 0057-2018 基于IBC技术的身份鉴别规范.pdf
GB-T 9651-2008 单相异步电动机试验方法.pdf
GB 29437-2012 工业冰醋酸单位产品能源消耗限额.pdf
GM-T 0112-2021 PDF格式文档的密码应用技术要求.pdf
DB15-T 2740—2022 高繁母羊妊娠毒血症防控技术规范 内蒙古自治区.pdf
GB-T 17798-2007 地理空间数据交换格式.pdf
数字安全产业大数据白皮书(2022年).pdf
1
/
18
评价文档
赞助2元 点击下载(713.1 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。