说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210672586.0 (22)申请日 2022.06.14 (71)申请人 网易(杭州)网络有限公司 地址 310052 浙江省杭州市滨江区网商路 599号网易大厦 (72)发明人 张宇昂 於圣楠 肖文浩 吴剑飞  李玉  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 高燕 (51)Int.Cl. G06F 9/50(2006.01) G06F 16/188(2019.01) (54)发明名称 压缩文件的处理方法、 装置、 计算机设备及 存储介质 (57)摘要 本申请涉及数据处理技术领域, 尤其涉及一 种压缩文件的处理方法、 装置、 计算机设备及存 储介质, 用于从压缩文件中解压出来的数据的处 理效率。 主要技术方案包括: 将压缩文件划分成 多个虚拟文件, 每个虚拟文件均对应有起始位置 和结束位置; 虚拟文件对应有起始位置和结束位 置; 压缩文件由数据量超 过预置数值的数据文件 压缩而成; 针对每个虚拟文件对应的线程, 读取 压缩文件的起始位置至目标位置的目标压缩数 据, 目标位置在对应虚拟文件的结束位置的预置 范围内; 对目标压缩数据进行解压得到解压数 据, 根据多个虚拟文件在压缩文件中的位置关 系, 获取解压数据中与虚拟文件对应的目标解压 数据, 并对目标解压数据进行处 理。 权利要求书3页 说明书12页 附图3页 CN 115033381 A 2022.09.09 CN 115033381 A 1.一种压缩文件的处 理方法, 其特 征在于, 所述方法包括: 将压缩文件划分成多个虚拟文件, 所述虚拟文件对应有起始位置和结束位置; 所述压 缩文件由数据量超过 预置数值的数据文件压缩而成; 针对每个虚拟文件对应的线程, 读取所述压缩文件的起始位置至目标位置的目标压缩 数据, 所述目标位置在对应虚拟文件的结束位置的预置范围内; 对所述目标压缩数据进行解压得到解压数据, 根据 所述多个虚拟文件在所述压缩文件 中的位置关系, 获取所述解压数据中与所述虚拟文件对应的目标解压数据, 并对所述 目标 解压数据进行处 理。 2.根据权利要求1所述的方法, 其特征在于, 所述针对每个虚拟文件对应的线程, 读取 所述压缩文件的起始位置 至目标位置的目标压缩数据, 包括: 针对每个虚拟文件对应的线程, 从所述压缩文件的起始位置顺序读取压缩数据, 直至 文件指针指向所述虚拟文件对应的结束位置处; 所述文件指 针用于指示对 所述虚拟文件的 当前读取位置; 读取以所述虚拟文件的结束位置为起始至该虚拟文件的结束位置之后目标位置的压 缩数据; 将读取的所述压缩文件的起始位置 至目标位置的压缩数据确定为目标压缩数据。 3.根据权利要求2所述的方法, 其特征在于, 所述针对每个虚拟文件对应的线程, 从所 述压缩文件的起始 位置顺序读取压缩数据, 直至文件指 针指向所述虚拟文件对应的结束位 置处, 包括: 从所述压缩文件 对应的文件指针处读取第一预置 长度的压缩数据到缓存中; 确定所述虚拟文件对应的结束位置与所述文件指针对应位置的差值是否小于第一距 离长度; 若确定所述差值小于第 一距离长度, 则从所述压缩文件对应的文件指针处读取第 二预 置长度的压缩数据到缓存中, 直至读取至虚拟文件的结束位置; 所述第二预置长度小于所 述第一预置 长度。 4.根据权利要求3所述的方法, 其特征在于, 所述从所述压缩文件对应的文件指针处读 取第二预置 长度的压缩数据到缓存中之前, 所述方法还 包括: 确定所述虚拟文件对应的结束位置与所述文件指针对应位置的差值是否小于第二距 离长度; 所述第二距离 长度小于所述第一距离 长度; 若确定所述差值小于第 二距离长度, 从所述压缩文件对应的文件指针处读取第 二预置 长度的压缩数据到缓存中, 直至读取至虚拟文件的结束位置; 若确定所述差值大于或等于第 二距离长度, 则从所述压缩文件对应的文件指针处读取 第三预置长度的压缩数据到缓存中, 并跳转到确定所述虚拟文件对应的结束位置与所述文 件指针对应位置的差值是否小于第二距离长度的步骤继续执行; 所述第三预置长度大于或 等于第二预置 长度、 且小于所述第一预置 长度。 5.根据权利要求2所述的方法, 其特征在于, 所述读取以所述虚拟文件的结束位置为起 始至该虚拟文件的结束位置之后目标位置的压缩数据, 包括: 读取以所述虚拟文件的结束位置为起始至虚拟文件的结束位置之后长度为N个字节的 区域压缩数据;权 利 要 求 书 1/3 页 2 CN 115033381 A 2将所述压缩文件的起始位置至虚拟文件的结束位置的压缩数据和区域压缩数据共同 作为中间压缩数据; 若中间压缩数据不可成功解压, 则N=N+1, 并跳转到读取以所述虚拟文件的结束位置 为起始至虚拟文件的结束位置之后长度为 N个字节的区域压缩数据继续执 行; 若中间压缩数据可成功解压, 将在所述虚拟文件的结束位置之后的N个字节对应的位 置确定为所述目标位置 。 6.根据权利要求3所述的方法, 其特征在于, 所述第 一预置长度为所述第 一距离长度的 M倍, 所述M小于1。 7.根据权利要求1 ‑6任一项所述的方法, 其特征在于, 所述根据 所述多个虚拟文件在所 述压缩文件中的位置关系, 获取所述解压数据中与所述虚拟文件对应的目标解压数据, 包 括: 获取所述虚拟文件 对应的前一个虚拟文件的目标位置; 根据所述虚拟文件对应的目标位置和所述前一个虚拟文件的目标位置, 获取所述解压 数据中与所述虚拟文件 对应的目标解压数据。 8.根据权利要求1 ‑6任一项所述的方法, 其特征在于, 所述根据 所述多个虚拟文件在所 述压缩文件中的位置关系, 获取所述解压数据中与所述虚拟文件对应的目标解压数据, 包 括: 获取所述解压数据中最后 一个预置分隔符所在的第 一位置, 以及在所述虚拟文件对应 的前一个虚拟文件的解压数据之前最后一个预置分隔符所在的第二 位置; 将所述解压数据中所述第 二位置至所述第 一位置之间的数据, 确定为所述虚拟文件对 应的目标解压数据。 9.根据权利要求1 ‑6任一项所述的方法, 其特征在于, 所述根据 所述多个虚拟文件在所 述压缩文件中的位置关系, 获取所述解压数据中与所述虚拟文件对应的目标解压数据, 包 括: 获取所述解压数据中第 一个预置分隔符所在的第 三位置, 以及在所述虚拟文件的目标 位置之后的第一个预置分隔符所在的第四位置; 将所述解压数据中所述第 三位置至所述第四位置之间的数据, 确定为所述虚拟文件对 应的目标解压数据。 10.根据权利要求8 或9所述的方法, 其特征在于, 所述预置分隔符至少包括以下中的一 种: 标点符号、 预置 字符串、 预置段落符号。 11.一种压缩文件的处 理装置, 其特 征在于, 所述装置包括: 划分模块, 用于将压缩文件划分成多个虚拟文件, 所述虚拟文件均对应有起始位置和 结束位置; 所述压缩文件由数据量超过 预置数值的数据文件压缩而成; 读取模块, 用于针对每个虚拟文件对应的线程, 读取所述压缩文件的起始位置至目标 位置的目标压缩数据, 所述目标位置在对应虚拟文件的结束位置的预置范围内; 解压模块, 用于对所述目标压缩数据进行解压得到解压数据; 获取模块, 用于根据多个虚拟文件在所述压缩文件中的位置关系, 获取所述解压数据 中与所述虚拟文件 对应的目标解压数据; 处理模块, 用于对所述目标解压数据进行处 理。权 利 要 求 书 2/3 页 3 CN 115033381 A 3

.PDF文档 专利 压缩文件的处理方法、装置、计算机设备及存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 压缩文件的处理方法、装置、计算机设备及存储介质 第 1 页 专利 压缩文件的处理方法、装置、计算机设备及存储介质 第 2 页 专利 压缩文件的处理方法、装置、计算机设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:30:47上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。