Redis哨兵模式:哨兵节点的功能详解
创作时间:
作者:
@小白创作中心
Redis哨兵模式:哨兵节点的功能详解
引用
CSDN
1.
https://blog.csdn.net/longlongqin/article/details/140051549
哨兵节点的主要功能
哨兵节点的主要功能有:
- 集群监控:监控 主、从节点的健康状况;
- 自动切换主节点:当 Master 运行故障,哨兵启动自动故障恢复流程:从 slave 中选择一台作为新 master。
- 通知:让 slave 执行
replicaof,与新的 master 同步;并且通知客户端与新 master 建立连接。
集群监控
哨兵(Sentinel)会给 主、从节点 发送 PING 命令:
- 对于 主节点:如果当前哨兵 发送给主节点的
PING命令,但主节点并未回复,就会被当前哨兵视为 主观下线。如果哨兵集群中的多数哨兵(一般是超过一半)都认为主节点是 主观下线,则 主节点 会被视为 客观下线。 - 对于 从节点:如果当前哨兵 发送给主节点的
PING命令,但主节点并未回复,就会被当前哨兵视为 主观下线。
自动切换主节点(故障转移)
在集群监控中,如果 主节点 被视为 客观下线。就会触发 自动切换主节点。选举新的主节点 的条件是(按照如下顺序进行筛选):
- 健康状况:那些经常被标记为 主观下线的从节点,会被视为不健康,会被过滤掉;
- slave 优先级:每一个节点都会在配置文件中有一个优先级设置(
slave-prority),优先级高的从节点 胜出; - 比较 slave 与旧 master 复制进度的差距
offset:offset值越大,表示从节点和主节点的数据越接近。(如 slave2 的 offset 为90, slave1 偏移量 为100。那么哨兵就会认为slave2的网络不佳,优先选择slave1为新的主节点)、 runID:runID是每个redis节点启动时随机生成的(按照其字典序比较大小),ID 号最小的从库得分最高,会被选为新主节点。
通知
选举完新主节点之后,还需要:
- 哨兵 将 新主节点的信息,发送给其他 从节点,让 slave 执行 replacaof 命令,和新「master 节点」建立连接,并进行数据复制;
- 哨兵 还需要将 新主节点信息 通知到所有的客户端,让客户端将读、写请求转移到 新的 master 节点。
补充
如何建立 哨兵 与 master节点、slave节点的通信?
- 配置哨兵节点的配置文件:首先,需要配置哨兵的配置文件(通常为
sentinel.conf),指定主节点的IP地址、端口以及主节点的名称。 - 向master节点发送
INFO指令:Sentinel启动后根据配置向Master发送INFO指令,获取并保存所有哨兵(Sentinel)状态,主节点(Master)和从节点(Slave)信息。此时,就建立了 哨兵 与 master节点、slave节点的通信信息了。
如何建立 哨兵 与 哨兵 之间的通信?
哨兵之间可以相互通信,主要归功于 Redis 的 pub/sub (发布/订阅)机制。具体步骤:
- 哨兵 与 master 节点 建立通信;
- 然后,就可以利用 Master 提供的发布/订阅机制,通过订阅Master的
__sentinel__:hello频道,当自身节点启动或更新其状态时,重新发布自己的当前状态和信息(Name、IP、Port消息),同时订阅其他哨兵发布的Name、IP、Port消息。
- 互相发现之后建立起了连接,后续的消息通信就可以直接进行交互
主从动态切换(故障转移)的具体流程
参考:详解Redis哨兵模式下,主节点掉线而重新选取主节点的流程 -阿里云开发者社区 (aliyun.com)
主要分为两部分:
- 哨兵集群中,选出一个节点作为leader;
- 由哨兵leader负责挑选出新的master节点;
哨兵集群选择leader
步骤:
- 哨兵集群中的每一个哨兵都会发起一个“拉票请求”。
- 收到这个拉票请求的 哨兵节点会 回复一个“投票响应”,有两种结果:投、不投;
- 一轮投票完成之后,得票数超过半数的哨兵节点将成为leader;
- 如果出现平票的情况,则重新再投一次票。【这也是建议哨兵节点数量设置为 奇数的原因:不容易产生平票的情况。】
注意:这里的投票逻辑是:Raft 算法的核心是 “先下手为强”,谁率先发出了拉票请求,谁就有更大的概率成为 leader。
哨兵leader挑选出新master节点
前 步是检测 当前主节点是否客观下线的。
- 检测当前主节点是否 主观下线:哨兵会定期向主节点和从节点发送PING命令进行心跳检测,以确保这些节点正常运行。如果哨兵在指定的时间内没有收到主节点或从节点的回复,它就会认为该节点主观下线(SDOWN)。
具体:发送的内容:publish sentinel :hello,如果超时不响应则标记 主观下线(sdown)。超时时间配置down-after-milliseconds - 检测当前主节点是否 客观下线:当一个哨兵认为主节点主观下线后,它会询问其他哨兵节点,以确定这是否是一个共识。如果足够多的哨兵(一般为超过半数)认为主节点不可达,那么主节点将被标记为客观下线(ODOWN),并开始故障转移流程。
询问其他哨兵节点时,发送的指令sentinel is-master-down-by-address-port - 哨兵集群选择leader:当确定需要故障转移时,会先选举出一个 哨兵leader,来负责后续的新master节点选举的工作。
- 哨兵leader开始选举 新master节点:筛选条件依次如下
- 健康状况:那些经常被标记为 主观下线的从节点,会被视为不健康,会被过滤掉;
- slave 优先级:每一个节点都会在配置文件中有一个优先级设置(
slave-prority),优先级高的从节点 胜出; - 比较 slave 与旧 master 复制进度的差距
offset:offset值越大,表示从节点和主节点的数据越接近。(如 slave2 的 offset 为90, slave1 偏移量 为100。那么哨兵就会认为slave2的网络不佳,优先选择slave1为新的主节点)、 runID:runID是每个redis节点启动时随机生成的(按照其字典序比较大小),ID 号最小的从库得分最高,会被选为新主节点。
- 信息通知:当选举出新master节点后,哨兵leader会将 ①新主节点 发送给 从节点;②将新主节点信息发送给客户端。
参考
- Redis 高可用篇:你管这叫 Sentinel 哨兵集群原理 - Redis - SegmentFault 思否
- 高可用之战:Redis Sentinal(哨兵模式) - Hello-Brand - 博客园 (cnblogs.com)
- redis哨兵模式的原理及部署 - misakivv - 博客园 (cnblogs.com)
热门推荐
腐乳到底是营养佳品,还是致癌杀手?困扰多年,终于有了明确答案
华为股权结构及决策权解析
电动机跳闸后的专业检查与故障判断方法
双级油旋片真空泵的正确使用和注意事项
叙利亚战争:一场多方利益交织的地缘政治博弈
1952年有闰五月?关于闰月的来源你知道吗?
脸上爆皮,怎么调理?
神经系统解剖学:脑脊液的循环路径与功能
睫毛掉了还会重新长出来吗
睫毛剪了还能再长回来吗
DS3053公证办理全攻略:办理流程和办理材料
借款合同诉讼有效期是多久
借款合同的诉讼时效是3年还是20年?一文讲清!
高血脂患者能食用黑芝麻粉吗?专家给出专业解答
受伤就贴创口贴?这几种情况千万不要,不仅没用还可能……
内部收益率计算示例:通过具体案例演示内部收益率的计算过程
主营业务收入借贷方向是什么
主营业务收入借贷方向是什么
从热红酒到围炉煮茶,年轻人的冬日仪式感带来哪些商机
选择燃气热水器的关键因素与使用注意事项
如何查看当前端口状态
安福县妇联开展“家校社法联动 护航未成年人成长”全县法治进校园活动
铁线蕨(铁线蕨种植方法对比及其适应环境的讨论)
越来越多人不买“床”了,学网友这9种新做法,便宜实用,太绝了
从入口到排出:食物在人体内的消化之旅需要多久?
鹰嘴豆:营养价值与食用指南
渝湘高铁黔吉段进入可研新阶段!
老旧小区改造 “改”出居民幸福生活
福建小县城,垄断了日本90%的墓碑生意,年产近20亿
福建小县城,垄断了日本90%的墓碑生意