Kafka 高并发设计之数据压缩与批量消息处理
创作时间:
作者:
@小白创作中心
Kafka 高并发设计之数据压缩与批量消息处理
引用
CSDN
1.
https://blog.csdn.net/qq_14855971/article/details/140367731
Kafka是一个高吞吐量、可扩展的分布式消息系统,深入掌握Kafka的数据压缩和批量数据处理机制,对于优化系统性能和资源使用至关重要。本文将详细介绍Kafka支持的压缩算法及其特点,并阐述数据压缩在Kafka中的具体应用。
压缩,是一种用时间换空间的trade-off思想,用CPU的时间去换磁盘或者网络I/O传输量,用较小的CPU开销来换取更具性价比的磁盘占用和更少的网络I/O传输。
Kafka数据压缩机制
数据压缩在Kafka中有助于减少磁盘空间的使用和网络带宽的消耗,从而提升整体性能。通过减少消息的大小,压缩可以显著降低生产者和消费者之间的数据传输时间。
Kafka支持的压缩算法
在Kafka 2.1.0版本之前,Kafka支持3种压缩算法:GZIP、Snappy和LZ4。从2.1.0开始,Kafka正式支持Zstandard算法(简写为zstd)。
一个压缩算法的优劣,有两个重要的指标:压缩比,文件压缩前的大小与压缩后的大小之比,比如源文件占用1000M内存,经过压缩后变成了200M,压缩比=1000/200=5,压缩比越高越高;另一个指标是压缩/解压缩吞吐量,比如每秒能压缩或者解压缩多少M数据,吞吐量越高越好。
如下图是Facebook Zstandard官网提供的一份压缩算法benchmark比较结果:
从图中可以看到,ZSTD压缩比最高,但是吞吐量中规中矩。LZ4在吞吐量方面属于王者。
- GZIP:压缩比高,但压缩和解压缩速度相对较慢。适用于对传输带宽要求较高的场景。
- Snappy:由Google开发,压缩和解压缩速度快,但压缩比相对较低。适用于对性能要求较高的场景。
- LZ4:在压缩和解压缩速度以及压缩比之间取得良好平衡。适用于对性能和压缩比有综合需求的场景。
- ZSTD:由Facebook开发,提供高压缩比和较快的压缩解压速度。适用于对高效压缩和快速处理都有需求的场景。
在Kafka的性能测试结果中,不同压缩算法的两个指标有以下排序特点:
- 吞吐量方面:LZ4 > Snappy > zstd和GZIP;
- 压缩比方面:zstd > LZ4 > GZIP > Snappy。
何时压缩
在生产者端压缩是很自然的想法,大部分情况下Broker收到Producer端的消息后是原封不动的保存,并不会进行压缩。
Kafka数据压缩流程
Kafka的数据压缩主要在生产者端进行。具体步骤如下:
- 生产者配置压缩方式:在KafkaProducer配置中设置
compression.type
参数,可以选择gzip
、snappy
、lz4
或zstd
。 - 消息压缩:生产者将消息批量收集到一个batch中,然后对整个batch进行压缩。这种批量压缩方式可以获得更高的压缩率。
- 压缩消息存储:压缩后的batch以压缩格式存储在Kafka的主题(Topic)分区中。
- 消费者解压缩:消费者从Kafka主题中获取消息时,首先对接收到的batch进行解压缩,然后处理其中的每一条消息。
热门推荐
人一定要快乐吗?接纳情绪自由,勇敢表达真实感受
老君山情侣游必打卡:金顶道观群&十里画屏
老君山情侣冬游打卡攻略:冰雪仙境中的浪漫之旅
孙中山开国纪念币:见证历史的百年珍品
己亥猪年生肖纪念币:双金属结构与多层次喷砂工艺打造防伪精品
人形机器人进军太空:从科幻到现实的跨越
如何给服刑人员写信、汇款?如何查询减刑假释情况?监狱民警为您解答
内关穴按摩,助你一夜好眠
【原创科普】高血压患者食养指导——原创科普
微信如何做项目管理系统
年轻人花式拜年,春联也能玩出新花样?
春节拜年新花样:年轻人如何应对红包和催婚?
线上拜年成新宠:科技让年味更浓
重庆亲子游必打卡:动物园邂逅国宝,科技馆探索未来
重庆动物园&自然博物馆:亲子游的文化盛宴
杭州十大著名景点游玩攻略:从西湖到九溪烟树的深度体验
苏州旅行一定要逛完八处经典的水乡
苏州平江路保姆级游玩攻略 苏州平江路有什么好玩的
《水浒传》里的欧鹏:梁山第48位英雄
用竹字取名的含义与文化内涵
揭秘《水浒传》英雄欧鹏的“摩云金翅”绰号
揭秘《水浒传》“摩云金翅”:欧鹏绰号背后的传奇故事
劳改与有期徒刑:探究我国监狱制度的变革与发展
电气线路老化、出现安全隐患谁来管?这篇文章算是说明白了!
最新!血压突然高的离谱怎么办,该选择哪些降压药物?医生讲清楚
高血压的急救方法与日常管理指南
徐宁传家宝背后的秘密:从雁翎甲到钩镰枪
徐宁遗物揭秘《水浒传》英雄真面目
冬季宠物寄养攻略:如何选靠谱宠物店?
春节档预售票房破4亿元!业界预判:近几年“最强”