Kafka架构和原理机制(图文全面详解)
创作时间:
作者:
@小白创作中心
Kafka架构和原理机制(图文全面详解)
引用
1
来源
1.
https://cloud.tencent.com/developer/article/2146785
Apache Kafka是一种分布式发布-订阅消息系统,最初由LinkedIn开发,现已成为Apache顶级开源项目。本文将全面解析Kafka的基本架构、工作原理、Zookeeper的作用、核心特性以及典型应用场景。
一、Kafka简介
Apache Kafka是一个分布式发布-订阅消息传递系统。它最初由LinkedIn公司开发,于2010年贡献给了Apache基金会并成为顶级开源项目。Kafka的主要应用场景包括日志收集系统和消息系统。
二、Kafka基本架构
Kafka的架构主要包括以下组件:
- 话题(Topic):特定类型的消息流。消息是字节的有效负载(Payload),话题是消息的分类名;
- 生产者(Producer):能够发布消息到话题的任何对象;
- 服务代理(Broker):已发布的消息保存在一组服务器中,它们被称为代理(Broker)或Kafka集群;
- 消费者(Consumer):可以订阅一个或多个话题,并从Broker拉数据,从而消费这些已发布的消息;
上图中可以看出,生产者将数据发送到Broker代理,Broker代理有多个话题topic,消费者从Broker获取数据。
三、Kafka基本原理
生产者将数据生产出来,交给Broker进行存储,消费者需要消费数据时,就从Broker中去拿出数据来,然后完成一系列对数据的处理操作。
多个Broker协同合作,Producer和Consumer部署在各个业务逻辑中被频繁的调用,三者通过Zookeeper管理协调请求和转发,这样一个高性能的分布式消息发布订阅系统就完成了。图上有个细节需要注意,Producer到Broker的过程是push,也就是有数据就推送到Broker,而Consumer到Broker的过程是pull,是通过Consumer主动去拉数据的。
四、Zookeeper在Kafka的作用
- 无论是Kafka集群,还是Producer和Consumer,都依赖于Zookeeper来保证系统可用性集群保存一些meta信息。
- Kafka使用Zookeeper作为其分布式协调框架,可以很好地将消息生产、消息存储、消息消费的过程结合在一起。
- Kafka借助Zookeeper,让生产者、消费者和Broker在内的所有组件,在无状态的情况下,建立起生产者和消费者的订阅关系,并实现生产者与消费者的负载均衡。
五、Kafka的特性
- 高吞吐量、低延迟:Kafka每秒可以处理几十万条消息,它的延迟最低只有几毫秒,每个topic可以分多个partition,consumer group对partition进行consume操作。
- 可扩展性:Kafka集群支持热扩展。
- 持久性、可靠性:消息被持久化到本地磁盘,并且支持数据备份防止数据丢失。
- 容错性:允许集群中节点失败(若副本数量为n,则允许n-1个节点失败)
- 高并发:支持数千个客户端同时读写。
六、Kafka的应用场景
- 日志收集:一个公司可以用Kafka收集各种服务的log,通过Kafka以统一接口服务的方式开放给各种consumer,例如:hadoop、Hbase、Solr等。
- 消息系统:解耦和生产者和消费者、缓存消息等。
- 用户活动跟踪:Kafka经常被用来记录web用户、或者app用户的各种活动,例如:浏览网页、搜索、点击等活动。这些活动信息,被各个服务器发布到Kafka的topic中,订阅者再通过订阅这些topic来做实时的监控分析,或者装载到hadoop、数据仓库中做离线分析和挖掘。
- 运营指标:Kafka也经常用来记录运营监控数据。包括收集各种分布式应用的数据,生产各种操作的集中反馈等,例如:报警和报告。
- 流式处理:例如:spark streaming、storm。
热门推荐
专题 | 古人都给我们留下了什么狗?
唸地藏經好嗎?
探索英国百年历史的变迁
想了解英国历史?这几本书和视频资料你一定要收藏!
科普小课堂:快充充电器
大多数相亲对象都很冷淡的原因
无人机都无法满足076,四川舰超级两攻,或可搭载歼-15和空警-600
肺栓塞:了解症状、紧急处理与预防措施
肺栓塞的七个常见症状
《反套路经济学》:教你用经济学思维重新认识世界
夫妻离婚时工资收入如何分配?一文详解财产分割原则
感冒流清涕转黄涕,银翘和板蓝根能一起吃吗
金铲铲之战S13星界麦迪阵容搭配攻略
夏季吃绿豆西瓜要适量,建议多吃这3类菜,去湿寒
退休之后不想在家闲着,这4个工作适合老人,轻松赚养老钱
2024年全球十大关键事件,影响世界格局
跑步养胃还是伤胃?警惕胃部不适信号,善待你的胃,别让它太累
如何预防居住环境中的噪音?有哪些降噪的方法?
连花清瘟胶囊饭前还是饭后吃
2024新高考历史题型分数占比,新高考七省份历史试卷题量题型及分值占比一览
痛风防治新选择!《自然》子刊:这类药降尿酸,还降糖、降压、减重
糖尿病患者常规应该进行哪些检查?
如何合法获取虚拟货币的市场信息
李文华重婚案:婚姻家庭法下的法律适用与思考
天麻可疏通头部经络吗(天麻治疗脑供血不足吗)
六大登山路线 问鼎“鹏城第一峰”
抑郁症恢复期间怎么锻炼
春招热度持续攀高!河北多所高校举办大型春季双选会
探究董事长、总裁与CEO之间的关系:职责、权力和协作
【量子退相干现象详解】:量子位稳定性的守护之道