(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210949717.5
(22)申请日 2022.08.09
(71)申请人 山东旗帜信息有限公司
地址 250000 山东省济南市高新区天辰大
街2177号联合财富广场2号楼8层、 18
层
(72)发明人 马强 李栋 刘斌 张祥国
殷忠源 黄振阳 李化军
(74)专利代理 机构 济南鼎信专利商标代理事务
所(普通合伙) 37245
专利代理师 赵长林
(51)Int.Cl.
H04L 67/06(2022.01)
H04L 9/32(2006.01)
(54)发明名称
一种基于部分文件一致性确认的文件秒传
方法及系统
(57)摘要
一种基于部分文件一致性确认的文件秒传
方法及系统, 包括如下步骤: 将待传输文件进行
分片处理得到分片数据; 对分片数据进行传输;
将传输得到的分片数据与已经处于服务器当中
的服务器文件进行一致性校验; 将通过校验的服
务器文件作为待传输文件即完成秒传。 本申请对
于大型文件的传输通过部分文件一致性确认的
方式大大提高了同一文件的识别效率, 在文件传
输量、 识别准确性方面做出了较好的统筹协调,
在保证识别准确率的同时, 也提高了整体的传输
和识别效率。
权利要求书1页 说明书4页 附图1页
CN 115314488 A
2022.11.08
CN 115314488 A
1.一种基于 部分文件一 致性确认的文件秒传方法, 其特 征在于: 包括如下步骤:
将待传输文件进行分片处 理得到分片数据;
对分片数据进行传输;
将传输得到的分片数据与已经处于服 务器当中的服 务器文件进行一 致性校验;
将通过校验的服 务器文件作为待传输文件即完成秒传。
2.根据权利要求1所述的一种基于部分文件一致性确认的文件秒传方法, 其特征在于:
所述分片数据按照待传输文件的顺序进行传输; 一致性校验所需的数据的大小不小于 分片
数据的大小。
3.根据权利要求2所述的一种基于部分文件一致性确认的文件秒传方法, 其特征在于:
通过一致性校验所需的数据的大小计算得到所需份数数据的数量阈值, 在达到数量阈值之
后, 进行一 致性校验。
4.根据权利要求3所述的一种基于部分文件一致性确认的文件秒传方法, 其特征在于:
所述一致性校验所需的数据大小与分片数据的大小一 致, 所述分片数据的大小为3 M‑10M。
5.根据权利要求4所述的一种基于部分文件一致性确认的文件秒传方法, 其特征在于:
还包括一预校验数据, 所述预校验数据先进行预获取和预校验, 所述预校验数据的大小为
100K‑300K。
6.根据权利要求5所述的一种基于部分文件一致性确认的文件秒传方法, 其特征在于:
还进行待传输文件中与预 校验数据大小一 致的数据的校验值的计算和保存。
7.根据权利要求6所述的一种基于部分文件一致性确认的文件秒传方法, 其特征在于:
所述一致性校验和预 校验都采用MD5校验值和SHA512校验值共同进行 校验。
8.根据权利要求7所述的一种基于部分文件一致性确认的文件秒传方法, 其特征在于:
所述一致性校验按照如下 方式进行:
记录服务器文件的MD5校验值和SHA512校验值作为原 始校验值;
计算待传输文件传输过来的分片数据的对应校验值,
对大小符合 一致性校验所需的数据计算MD5校验值和SHA512校验值作为待校验值;
将待校验值与原始校验值进行比对, 若存在匹配, 则将匹配对应的原始文件作为待传
输文件进行 标记, 若不存在匹配, 则将待传输文件进行继续上传。
9.根据权利要求1所述的一种基于部分文件一致性确认的文件秒传方法, 其特征在于:
所述待传输文件按照如下方式进 行分片处理: 首先根据待传输文件的大小和分片数据的大
小进行分片验证, 然后对于待传输文件按照分片数据的大小进行切片, 余下 的文件作为最
后一个切片。
10.一种基于 部分文件一 致性确认的文件秒传装置, 其特 征在于: 包括如下模块:
分片模块, 用于将待传输文件进行分片处 理得到分片数据;
接收校验模块, 用于对分片数据进行传输并将传输得到的分片数据与已经处于服务器
当中的服 务器文件进行 预校验和一 致性校验;
秒传确认模块, 用于将通过 校验的服 务器文件作为待传输文件即完成秒传。权 利 要 求 书 1/1 页
2
CN 115314488 A
2一种基于部 分文件一致性确认的文件秒传方 法及系统
技术领域
[0001]本申请涉及一种基于 部分文件一 致性确认的文件秒传方法及系统。
背景技术
[0002]文件秒传是利用文件信息生成Md5等特征值作为文件的判断依据实现秒传功能。
实际上对于文件是否一致进行的判定。 现有的判定方法对于小型文件可以进 行比较准确的
判定, 但是在 文件较大时, 由于需要 上传到所有文件之后才能够进 行有效的一致性判定, 这
实际上并没有通过文件秒传来降低文件传输的压力。
发明内容
[0003]为了解决上述问题, 本申请一方面公开了一种基于部分文件一致性确认的文件秒
传方法, 包括如下步骤: 将待传输文件进行分片处理得到分片数据; 对分片数据进行传输;
将传输得到的分片数据与已经 处于服务器当中的服务器文件进行一致性校验; 将通过校验
的服务器文件作为待传输文件即完成秒传。 本申请对于大型文件的传输通过部 分文件一致
性确认的方式大大提高了同一文件的识别效率, 在文件传输量、 识别准确 性方面做出了较
好的统筹协调, 在保证识别准确率的同时, 也提高了整体的传输和识别效率。 本申请与一般
的同一磁盘或者同一位置内的数据一致性识别不同, 目的是为了降低数据的传输量, 但是
需要保证在该种情况下数据的准确 性, 也就是在开始的时候, 并没有进行整体的对比两个
数据是否一致的基础, 而使用分片数据的方式, 既能降低文件传输失败的可能性, 又能在有
相同数据时, 实现数据秒传, 大幅度的提高数据传输效率, 并降低数据传输所占据的带宽 。
[0004]优选的, 所述分片数据按照待传输文件的顺序进行传输; 一致性校验所需的数据
的大小不小于分片数据的大小。
[0005]优选的, 通过一致性校验所需的数据的大小计算得到所需份数数据的数量阈值,
在达到数量阈值之后, 进行一 致性校验。
[0006]优选的, 所述一致性校验所需的数据大小与分片数据的大小一致, 所述分片数据
的大小为3M ‑10M。 本申请的分片数据的大小可由系统配置生成, 通过对比, 发现3M ‑10M为一
个较好的选择; 虽然 数值越大, 准确率越 大, 但会影响校验效率, 在MD5和SHA512两种校验方
式同时使用情况 下, 数值一直加大准确率实际上并没有明显上升, 反而是 出现一定波动。
[0007]优选的, 还包括一预校验数据, 所述预校验数据先进行预获取和预校验, 所述预校
验数据的大小为10 0K‑300K。
[0008]优选的, 还进行待传输文件中与预校验数据大小一致的数据的校验值的计算和保
存。
[0009]优选的, 所述一致性校验和预校验都采用MD5校验值和SHA512校验值共同进行校
验。
[0010]优选的, 所述 一致性校验按照如下 方式进行:
[0011]记录服务器文件的MD5校验值和SHA512校验值作为原 始校验值;说 明 书 1/4 页
3
CN 115314488 A
3
专利 一种基于部分文件一致性确认的文件秒传方法及系统
文档预览
中文文档
7 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:16:20上传分享