Deflate内部实现(LZ77无损压缩算法)超详细图解算法版
创作时间:
作者:
@小白创作中心
Deflate内部实现(LZ77无损压缩算法)超详细图解算法版
引用
CSDN
1.
https://blog.csdn.net/qq_29493173/article/details/139805208
无损压缩算法
Deflate算法是一种广泛使用的无损数据压缩算法,主要用于文件压缩和网络传输。它由两个阶段组成:重复消除(LZ77算法)和位减少(Huffman编码)。
第一阶段:重复消除 — LZ77无损压缩算法
LZ77算法是一种基于字典的无损压缩算法,通过查找重复的未压缩序列并用引用指针替换它们来实现压缩。引用指针由两个元素定义:
- offset(距离):原始未压缩数据中出现的第一个现有字节的相对位置。
- Length(长度):重复的字节长度。
LZ77算法使用“滑动窗口”技术,窗口分为两个部分:
- 查找缓冲区(Search buffer):已编码部分,也称字典。
- 先行缓冲区(Look ahead buffer):即将进行编码序列的一部分。
滑动窗口的尺寸是影响压缩性能的关键因素。如果窗口太小,可能会发现较少的重复数据序列,导致压缩文件较大;如果窗口太大,则可能需要更长时间来查找重复数据序列,导致压缩速度变慢。
LZ77算法的主要步骤如下:
- 将编码位置设置为输入流的开头。
- 在查找缓冲区的窗口中找到最长的匹配项。
- 如果找到匹配,则输出指针P。将编码位置(和窗口)向前移动L个字节。
- 如果未找到匹配项,则输出空指针和先行缓冲区中的第一个字节。将编码位置(和窗口)向前移动一个字节。
- 如果先行缓冲区不为空,则返回步骤2。
举例说明
以字符串"AABCBBABC"为例,说明LZ77算法的压缩过程:
- 初始字符串从右往左滑动,直至占满所有buffer区。
- 开始遍历buffer的第一个字符'A',因Dictionary空,未匹配到'A',输出(0,0)A。
- 遍历buffer第一个字符"A",在Dictionary找到"A",未超过buffer黄色长度,往后遍历到编码"AB",Dictionary没有匹配到“AB”字符串,于是只编码"A",输出(1, 1)。
- 匹配buffer区第一个字符’B’,Dictionary内未匹配,输出(0,0)B。
- 匹配buffer区第一个字符’C’,Dictionary内未匹配,输出(0,0)C。
- 匹配buffer区第一个字符’B’,offset('B’与Dictionary中匹配的’B’的距离)=2,length=1,输出(2,1)。
- 匹配buffer区第一个字符’B’,在DICTIONARY匹配到,offset=1,length=1,输出(1,1)。
- 匹配BUFFER第一个字符 ‘A’,在DICTIONARY匹配到,offset=5,length=3,输出(5, 3)。
最终压缩结果为:(0,0)A (1,1) (0,0)B (0,0)C (2,1) (1,1) (5,3)
图解压缩过程
第二阶段:位减少 — Huffman编码
Huffman编码是一种熵编码方法,用于减少数据的位数。其基本思想是为出现频率较高的字符分配较短的编码,为出现频率较低的字符分配较长的编码,从而实现数据压缩。
通过构建Huffman树,可以将原始数据的位数从120bit(15*8)减少到28bit。
范式Huffman树:在普通Huffman树的基础上,只需保存编码位长,利用位长反推编码。
总结
Deflate算法通过LZ77算法实现重复消除,通过Huffman编码实现位减少,从而实现高效的数据压缩。这种两阶段的压缩策略在许多应用场景中都取得了很好的效果。
热门推荐
“她经济”新篇:时尚,更普世了
适合吉他初学者的十首练习曲目推荐
1-3岁儿童假想游戏的发展与教育意义
Excel中计算相对标准偏差(RSD)的完整指南
皇室战争:5套无传奇卡组助你轻松冲杯12阶
长途摩旅装备全攻略:从头盔到急救包,一文详解必备物品
上海四天三晚详细攻略,去上海旅游住哪方便?
方向盘异响的自我诊断:转向助力油与球头衬套的检查方法
家用机器人时代即将来临:功能、挑战与未来展望
打野铠最强六神装是什么?如何选择打野铠的装备?
中广核申请辐射测量系统专利,提升核电站测量效率与安全性
为什么说高山云雾出好茶?
小学生现代诗合集:童心童趣的诗意表达
调查种群密度的四种方法
如何通过性格测试找到适合自己的职业
白醋泡脚的正确方法:从准备到完成的完整指南
2024年各省公务员岗位招聘查询及当地招聘信息获取指南
Web组件化开发及其在提升项目可维护性中的作用
合同审查要点与注意事项:确保合同合法有效的关键步骤
“儿童大器官移植中心”在上海成立,造福更多终末期器官衰竭患儿
从这6部社会学的纪录片,看尽社会的黑暗!
枫与铃第一季:细腻情感与奇幻冒险的完美交织
Science里程碑:新型癌症免疫疗法来了!肿瘤细胞“大变身”,变成抗癌免疫细胞
如何在金融领域评估投资的风险承受能力?这种风险承受能力有哪些评估指标?
澳门车主忘取车一年,收到四万多元停车费账单
秋天的重庆,是个巨大的“彩林”
蚂蚁的奇妙世界:从种类分布到社会结构的全面解析
克里斯托弗·诺兰的《奥德赛》:比他的奥斯卡获奖电影更有野心吗?
流式细胞术(FCM)的原理
领导管理归零项目有哪些