Redis哨兵模式:哨兵节点的功能详解
创作时间:
作者:
@小白创作中心
Redis哨兵模式:哨兵节点的功能详解
引用
CSDN
1.
https://blog.csdn.net/longlongqin/article/details/140051549
哨兵节点的主要功能
哨兵节点的主要功能有:
- 集群监控:监控 主、从节点的健康状况;
- 自动切换主节点:当 Master 运行故障,哨兵启动自动故障恢复流程:从 slave 中选择一台作为新 master。
- 通知:让 slave 执行
replicaof,与新的 master 同步;并且通知客户端与新 master 建立连接。
集群监控
哨兵(Sentinel)会给 主、从节点 发送 PING 命令:
- 对于 主节点:如果当前哨兵 发送给主节点的
PING命令,但主节点并未回复,就会被当前哨兵视为 主观下线。如果哨兵集群中的多数哨兵(一般是超过一半)都认为主节点是 主观下线,则 主节点 会被视为 客观下线。 - 对于 从节点:如果当前哨兵 发送给主节点的
PING命令,但主节点并未回复,就会被当前哨兵视为 主观下线。
自动切换主节点(故障转移)
在集群监控中,如果 主节点 被视为 客观下线。就会触发 自动切换主节点。选举新的主节点 的条件是(按照如下顺序进行筛选):
- 健康状况:那些经常被标记为 主观下线的从节点,会被视为不健康,会被过滤掉;
- slave 优先级:每一个节点都会在配置文件中有一个优先级设置(
slave-prority),优先级高的从节点 胜出; - 比较 slave 与旧 master 复制进度的差距
offset:offset值越大,表示从节点和主节点的数据越接近。(如 slave2 的 offset 为90, slave1 偏移量 为100。那么哨兵就会认为slave2的网络不佳,优先选择slave1为新的主节点)、 runID:runID是每个redis节点启动时随机生成的(按照其字典序比较大小),ID 号最小的从库得分最高,会被选为新主节点。
通知
选举完新主节点之后,还需要:
- 哨兵 将 新主节点的信息,发送给其他 从节点,让 slave 执行 replacaof 命令,和新「master 节点」建立连接,并进行数据复制;
- 哨兵 还需要将 新主节点信息 通知到所有的客户端,让客户端将读、写请求转移到 新的 master 节点。
补充
如何建立 哨兵 与 master节点、slave节点的通信?
- 配置哨兵节点的配置文件:首先,需要配置哨兵的配置文件(通常为
sentinel.conf),指定主节点的IP地址、端口以及主节点的名称。 - 向master节点发送
INFO指令:Sentinel启动后根据配置向Master发送INFO指令,获取并保存所有哨兵(Sentinel)状态,主节点(Master)和从节点(Slave)信息。此时,就建立了 哨兵 与 master节点、slave节点的通信信息了。
如何建立 哨兵 与 哨兵 之间的通信?
哨兵之间可以相互通信,主要归功于 Redis 的 pub/sub (发布/订阅)机制。具体步骤:
- 哨兵 与 master 节点 建立通信;
- 然后,就可以利用 Master 提供的发布/订阅机制,通过订阅Master的
__sentinel__:hello频道,当自身节点启动或更新其状态时,重新发布自己的当前状态和信息(Name、IP、Port消息),同时订阅其他哨兵发布的Name、IP、Port消息。
- 互相发现之后建立起了连接,后续的消息通信就可以直接进行交互
主从动态切换(故障转移)的具体流程
参考:详解Redis哨兵模式下,主节点掉线而重新选取主节点的流程 -阿里云开发者社区 (aliyun.com)
主要分为两部分:
- 哨兵集群中,选出一个节点作为leader;
- 由哨兵leader负责挑选出新的master节点;
哨兵集群选择leader
步骤:
- 哨兵集群中的每一个哨兵都会发起一个“拉票请求”。
- 收到这个拉票请求的 哨兵节点会 回复一个“投票响应”,有两种结果:投、不投;
- 一轮投票完成之后,得票数超过半数的哨兵节点将成为leader;
- 如果出现平票的情况,则重新再投一次票。【这也是建议哨兵节点数量设置为 奇数的原因:不容易产生平票的情况。】
注意:这里的投票逻辑是:Raft 算法的核心是 “先下手为强”,谁率先发出了拉票请求,谁就有更大的概率成为 leader。
哨兵leader挑选出新master节点
前 步是检测 当前主节点是否客观下线的。
- 检测当前主节点是否 主观下线:哨兵会定期向主节点和从节点发送PING命令进行心跳检测,以确保这些节点正常运行。如果哨兵在指定的时间内没有收到主节点或从节点的回复,它就会认为该节点主观下线(SDOWN)。
具体:发送的内容:publish sentinel :hello,如果超时不响应则标记 主观下线(sdown)。超时时间配置down-after-milliseconds - 检测当前主节点是否 客观下线:当一个哨兵认为主节点主观下线后,它会询问其他哨兵节点,以确定这是否是一个共识。如果足够多的哨兵(一般为超过半数)认为主节点不可达,那么主节点将被标记为客观下线(ODOWN),并开始故障转移流程。
询问其他哨兵节点时,发送的指令sentinel is-master-down-by-address-port - 哨兵集群选择leader:当确定需要故障转移时,会先选举出一个 哨兵leader,来负责后续的新master节点选举的工作。
- 哨兵leader开始选举 新master节点:筛选条件依次如下
- 健康状况:那些经常被标记为 主观下线的从节点,会被视为不健康,会被过滤掉;
- slave 优先级:每一个节点都会在配置文件中有一个优先级设置(
slave-prority),优先级高的从节点 胜出; - 比较 slave 与旧 master 复制进度的差距
offset:offset值越大,表示从节点和主节点的数据越接近。(如 slave2 的 offset 为90, slave1 偏移量 为100。那么哨兵就会认为slave2的网络不佳,优先选择slave1为新的主节点)、 runID:runID是每个redis节点启动时随机生成的(按照其字典序比较大小),ID 号最小的从库得分最高,会被选为新主节点。
- 信息通知:当选举出新master节点后,哨兵leader会将 ①新主节点 发送给 从节点;②将新主节点信息发送给客户端。
参考
- Redis 高可用篇:你管这叫 Sentinel 哨兵集群原理 - Redis - SegmentFault 思否
- 高可用之战:Redis Sentinal(哨兵模式) - Hello-Brand - 博客园 (cnblogs.com)
- redis哨兵模式的原理及部署 - misakivv - 博客园 (cnblogs.com)
热门推荐
25个行业214所大学,走哪条路更优?
Windows 11 中的分辨率你设置对了吗?
发动机冷却液不足的标志是什么?
如何改装哈雷摩托车?这种改装对车辆性能有何影响?
美国51区揭秘:研究不明飞行物基地
音响设备选购与接线:打造卓越音质指南
常用技术指标之一文读懂KDJ指标
《光环》系列大揭秘:众多数字背后的故事
上海市儿童医院推出3—18岁儿童青少年整合式体重管理套餐
三星堆遗址:一个消失的文明之谜
低空新赛道 | 低空经济发展面临的机遇与挑战
工厂车间噪声治理的系统化解决方案
解读“缸中之脑”,我们生活的世界真的客观存在吗?
百家姓之56—方姓,起源·迁徙·家训·名人故事
“合力”:角色的设定和行为
如何养长马齿苋(掌握这几个技巧)
2024年度广东省建筑工程专业技术人员继续教育专业课培训通知
宝宝冬季护理指南
安卡拉耶夫点数战胜佩雷拉夺得UFC轻重量级冠军
爬虫中常见的post和get有什么区别
汽车成博弈焦点 美乱挥“关税大棒”惹众怒
短剧营销推广的受众定位如何更精准
一篇文章详解大数据技术和应用场景
教育部刚刚同意!21所大学改名!
消费者的权利和义务包含哪些
“诗与剑”的俄罗斯民族
40岁女性记忆力减退怎么办
二战五大经典冲锋枪盘点
五行反克深度解析:被克的五行过多,从而损害了克者的力量
企业网络安全防护指南:十大关键措施详解