说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211509870.2 (22)申请日 2022.11.29 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 王维强 张长浩 申书恒 傅欣艺  (74)专利代理 机构 北京博思佳知识产权代理有 限公司 1 1415 专利代理师 李威 (51)Int.Cl. G06F 16/174(2019.01) G06N 3/04(2006.01) (54)发明名称 一种模型压缩的方法、 装置、 存储介质及电 子设备 (57)摘要 本说明书公开了一种模型压缩的方法、 装 置、 存储介质及电子设备, 可以获取待压缩模型, 并确定该待压缩模型的模型结构参数, 以及根据 模型结构参数, 确定针对待压缩模 型的若干种压 缩方案,而后, 根据各种压缩 方案, 确定每种压缩 方案对应的待评估模型, 再针对每种压缩方案, 根据预设的样本数据, 确定该压缩 方案对应的待 评估模型处理该样本数据得到输出结果所消耗 的数据处理时长, 作为该压缩 方案对应的数据处 理时长, 从而根据每种压缩 方案对应的数据处理 时长, 确定目标压缩方案, 并根据目标压缩 方案, 对待压缩模 型进行压缩, 从而提高通过神经网络 模型执行业务的效率, 保护用户的隐私数据。 权利要求书2页 说明书11页 附图4页 CN 115543945 A 2022.12.30 CN 115543945 A 1.一种模型压缩的方法, 包括: 获取待压缩 模型; 确定所述待压缩模型的模型结构参数, 并根据所述模型结构参数, 确定针对所述待压 缩模型的若干种压缩方案; 根据各种压缩方案, 确定每种压缩方案对应的待评估 模型; 针对每种压缩方案, 根据预设的样本数据, 确定该压缩方案对应的待评估模型处理所 述样本数据得到 输出结果所消耗的数据处 理时长, 作为该压缩方案对应的数据处 理时长; 根据每种压缩方案对应的数据处理时长, 确定目标压缩方案, 并根据所述目标压缩方 案, 对所述待压缩 模型进行压缩。 2.如权利要求1所述的方法, 所述模型结构参数包括所述待压缩模型中的卷积核的尺 寸; 根据所述模型 结构参数, 确定针对所述待压缩 模型的若干种压缩方案, 包括: 根据所述待压缩模型中卷积核的尺寸, 确定对所述待压缩模型的卷积核进行压缩后所 述卷积核的尺寸; 根据所述压缩尺寸, 将所述待压缩模型的卷积核进行调整, 得到至少一种调整后的卷 积核; 根据所述至少一种调整后的卷积核, 确定针对所述待压缩 模型的若干种压缩方案 。 3.如权利要求1所述的方法, 所述模型 结构参数包括所述待压缩 模型的网络层数; 根据所述模型 结构参数, 确定针对所述待压缩 模型的若干种压缩方案, 包括: 根据所述待压缩模型的网络层数, 确定将所述待压缩模型中的不同网络层进行组合的 组合方式; 根据所述组合方式, 确定针对所述待压缩 模型的若干种压缩方案 。 4.如权利要求1所述的方法, 所述模型结构参数包括所述待压缩模型每一网络层的卷 积核的数量; 根据所述模型 结构参数, 确定针对所述待压缩 模型的若干种压缩方案, 包括: 针对所述待压缩模型中的每个网络层, 根据该网络层实 际包含的卷积核的数量, 确定 该网络层所采用的卷积核的候选数量, 所述候选数量不超过该网络层中实际包含的卷积核 的数量; 根据每个网络层所采用的卷积核的候选数量, 确定针对所述待压缩模型的若干种压缩 方案。 5.如权利要求1所述的方法, 针对每种压缩方案, 根据预设的样本数据, 确定该压缩方 案对应的待评估模型 处理所述样本数据得到输出结果所消耗的数据处理 时长, 作为该压缩 方案对应的数据处 理时长, 包括: 从所述若干种压缩方案 中选取出部分压缩方案, 并将所述样本数据输入到所述部分压 缩方案对应的待评估 模型中, 以得到所述部分压缩方案对应的数据处 理时长; 根据所述部分压缩方案对应的数据处理时长以及所述部分压缩方案中包含的模型结 构参数, 构建训练样本; 将所述训练样本包含的模型结构参数输入到时长预测模型中, 得到预测时长, 并以所 述预测时长与所述部分压缩方案对应的数据处理 时长之间的偏差最小化为优化目标, 对所权 利 要 求 书 1/2 页 2 CN 115543945 A 2述时长预测模型进行训练; 通过训练后的时长预测模型, 预测得到剩余压缩方案对应的数据处 理时长。 6.如权利要求1所述的方法, 根据每种压缩方案对应的数据处理时长, 确定目标压缩方 案, 包括: 对所述每种压缩方案对应的待评估 模型的参数量进行分档, 得到分档结果; 针对所述分档结果中每个参数量档位, 根据 该参数量档位中对应数据处理时长不超过 该参数量档位对应的设定时长的压缩方案, 确定该参数量档位对应的目标压缩方案 。 7.如权利要求6所述的方法, 根据该参数量档位中对应数据处理时长不超过该参数量 档位对应的设定时长的压缩方案, 确定该参数量档位对应的目标压缩方案, 包括: 将该参数量档位中对应数据处理时长不超过该参数量档位对应的设定时长的压缩方 案, 作为各候选 压缩方案; 将所述各候选压缩方案 中包含的模型结构参数进行聚类, 得到所述各候选压缩方案对 应的聚类中心; 根据所述聚类中心对应的模型 结构参数, 确定该参数量档位对应的目标压缩方案 。 8.一种模型压缩的装置, 包括: 获取模块, 用于获取待压缩 模型; 方案确定模块, 用于确定所述待压缩模型的模型结构参数, 并根据 所述模型结构参数, 确定针对所述待压缩 模型的若干种压缩方案; 模型确定模块, 用于根据各种压缩方案, 确定每种压缩方案对应的待评估 模型; 时长确定模块, 用于针对每种压缩方案, 根据 预设的样本数据, 确定该压缩方案对应的 待评估模型处理所述样 本数据得到输出结果所消耗的数据处理时长, 作为该压缩方案对应 的数据处 理时长; 压缩模块, 用于根据每种压缩方案对应的数据处理时长, 确定目标压缩方案, 并根据 所 述目标压缩方案, 对所述待压缩 模型进行压缩。 9.一种计算机可读存储介质, 所述存储介质存储有计算机程序, 所述计算机程序被处 理器执行时实现上述权利要求1~7任一项所述的方法。 10.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 所述处 理器执行所述程序时实现上述权利要求1~7 任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115543945 A 3

PDF文档 专利 一种模型压缩的方法、装置、存储介质及电子设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种模型压缩的方法、装置、存储介质及电子设备 第 1 页 专利 一种模型压缩的方法、装置、存储介质及电子设备 第 2 页 专利 一种模型压缩的方法、装置、存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:57:58上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。