问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

Deflate内部实现（LZ77无损压缩算法）超详细图解算法版

创作时间:

作者:

@小白创作中心

Deflate内部实现（LZ77无损压缩算法）超详细图解算法版

引用

CSDN

1.

https://blog.csdn.net/qq_29493173/article/details/139805208

无损压缩算法

Deflate算法是一种广泛使用的无损数据压缩算法，主要用于文件压缩和网络传输。它由两个阶段组成：重复消除（LZ77算法）和位减少（Huffman编码）。

第一阶段：重复消除 — LZ77无损压缩算法

LZ77算法是一种基于字典的无损压缩算法，通过查找重复的未压缩序列并用引用指针替换它们来实现压缩。引用指针由两个元素定义：

offset（距离）：原始未压缩数据中出现的第一个现有字节的相对位置。
Length（长度）：重复的字节长度。

LZ77算法使用“滑动窗口”技术，窗口分为两个部分：

查找缓冲区（Search buffer）：已编码部分，也称字典。
先行缓冲区（Look ahead buffer）：即将进行编码序列的一部分。

滑动窗口的尺寸是影响压缩性能的关键因素。如果窗口太小，可能会发现较少的重复数据序列，导致压缩文件较大；如果窗口太大，则可能需要更长时间来查找重复数据序列，导致压缩速度变慢。

LZ77算法的主要步骤如下：

将编码位置设置为输入流的开头。
在查找缓冲区的窗口中找到最长的匹配项。
如果找到匹配，则输出指针P。将编码位置（和窗口）向前移动L个字节。
如果未找到匹配项，则输出空指针和先行缓冲区中的第一个字节。将编码位置（和窗口）向前移动一个字节。
如果先行缓冲区不为空，则返回步骤2。

举例说明

以字符串"AABCBBABC"为例，说明LZ77算法的压缩过程：

初始字符串从右往左滑动，直至占满所有buffer区。
开始遍历buffer的第一个字符'A'，因Dictionary空，未匹配到'A'，输出(0,0)A。
遍历buffer第一个字符"A"，在Dictionary找到"A"，未超过buffer黄色长度，往后遍历到编码"AB"，Dictionary没有匹配到“AB”字符串，于是只编码"A"，输出(1, 1)。
匹配buffer区第一个字符’B’，Dictionary内未匹配，输出(0,0)B。
匹配buffer区第一个字符’C’，Dictionary内未匹配，输出(0,0)C。
匹配buffer区第一个字符’B’，offset（'B’与Dictionary中匹配的’B’的距离）=2，length=1，输出（2，1）。
匹配buffer区第一个字符’B’，在DICTIONARY匹配到，offset=1，length=1，输出（1，1）。
匹配BUFFER第一个字符 ‘A’，在DICTIONARY匹配到，offset=5，length=3，输出(5, 3)。

最终压缩结果为：(0,0)A (1,1) (0,0)B (0,0)C (2,1) (1,1) (5,3)

图解压缩过程

第二阶段：位减少 — Huffman编码

Huffman编码是一种熵编码方法，用于减少数据的位数。其基本思想是为出现频率较高的字符分配较短的编码，为出现频率较低的字符分配较长的编码，从而实现数据压缩。

通过构建Huffman树，可以将原始数据的位数从120bit（15*8）减少到28bit。

范式Huffman树：在普通Huffman树的基础上，只需保存编码位长，利用位长反推编码。

总结

Deflate算法通过LZ77算法实现重复消除，通过Huffman编码实现位减少，从而实现高效的数据压缩。这种两阶段的压缩策略在许多应用场景中都取得了很好的效果。

热门推荐

学习易经的六种方法

学习易经的六种方法

搜肠刮肚：成语的由来、用法与相关词语

搜肠刮肚：成语的由来、用法与相关词语

颗粒板与密度板哪个好？详细分析

颗粒板与密度板哪个好？详细分析

“没有脸”的形象也会侵害肖像权吗？揭秘广东首例“AI换脸”软件侵权案

“没有脸”的形象也会侵害肖像权吗？揭秘广东首例“AI换脸”软件侵权案

Excel VBA选择区域的多种方法与实战示例

Excel VBA选择区域的多种方法与实战示例

诚意的价值：在人际交往中建立信任的途径

诚意的价值：在人际交往中建立信任的途径

加拿大留学移民优势与申请流程全面解析

加拿大留学移民优势与申请流程全面解析

加拿大医疗免费是真的吗，2024最新医疗体系详解！（下）

加拿大医疗免费是真的吗，2024最新医疗体系详解！（下）

梨皮可以吃吗

梨皮可以吃吗

梨子的皮能吃吗

梨子的皮能吃吗

办理养殖场所需手续及流程解析

办理养殖场所需手续及流程解析

上海探索中医药文化进校园：开发特色课程，打造沉浸式体验

上海探索中医药文化进校园：开发特色课程，打造沉浸式体验

夏季空调省电指南：合理温度设置与维护技巧

夏季空调省电指南：合理温度设置与维护技巧

春季到了，遇到这5种“芽菜”抓紧吃，营养极高，味道好，错过就要等一年

春季到了，遇到这5种“芽菜”抓紧吃，营养极高，味道好，错过就要等一年

《西游记》里的12句金句，句句都是人生智慧

《西游记》里的12句金句，句句都是人生智慧

项目管理灵感分析：从思考到实践的全面指南

项目管理灵感分析：从思考到实践的全面指南

二十五种让精力充沛的方法

二十五种让精力充沛的方法

约克夏美容的技巧与心得

约克夏美容的技巧与心得

沙琪玛的热量及营养成分

沙琪玛的热量及营养成分

麦粒肿一般多少天自愈？医生的专业解答来了

麦粒肿一般多少天自愈？医生的专业解答来了

翻车，董宇辉独立的代价

翻车，董宇辉独立的代价

秃鹫：高原上的大型猛禽

秃鹫：高原上的大型猛禽

红茶和绿茶的功效与作用比较

红茶和绿茶的功效与作用比较

未来十年房价走势分化，一线城市有望止跌回稳

未来十年房价走势分化，一线城市有望止跌回稳

华东师范大学好不好？附华东师范大学最好的专业排名

华东师范大学好不好？附华东师范大学最好的专业排名

高中议论文写作怎样积累素材？

高中议论文写作怎样积累素材？

为什么突然患胆碱能性荨麻疹

为什么突然患胆碱能性荨麻疹

黄埔港：从千年古港到现代贸易枢纽

黄埔港：从千年古港到现代贸易枢纽

我国劳动人口规模和结构有何变化？与“延迟退休”有何联系？专家解读

我国劳动人口规模和结构有何变化？与“延迟退休”有何联系？专家解读

在黄埔，「村」就是「潮」！

在黄埔，「村」就是「潮」！

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号