Hadoop高可用性(HA)配置详解:HDFS和YARN的实现机制与故障转移
创作时间:
作者:
@小白创作中心
Hadoop高可用性(HA)配置详解:HDFS和YARN的实现机制与故障转移
引用
CSDN
1.
https://m.blog.csdn.net/qq_41074187/article/details/143843322
HA概述
H(high)A(avilable): 高可用,意味着必须有容错机制,不能因为集群故障导致不可用!
- 实现高可用最关键的策略是消除单点故障(SPOF)。HA严格来说应该分成各个组件的HA机制:HDFS的HA和YARN的HA
- 实现hadoop的HA,必须保证在NN和RM故障时,采取容错机制,可以让集群继续使用
HDFS-HA
工作机制
HDFS HA功能通过配置Active/Standby两个NameNode实现在集群中对NameNode的热备来解决问题,通过双NameNode消除单点故障。
使用active状态来标记主节点,使用standby状态标记备用节点
工作要点
元数据管理方式需要改变
内存中各自保存一份元数据; Edits日志只有Active状态的NameNode节点可以做写操作 两个NameNode都可以读取Edits,共享的Edits放在一个共享存储中管理
需要一个状态管理功能模块
实现了一个zkfc进程(zookeeper failover control)常驻在每一个namenode所在的节点,每一个zkfc负责监控自己所在NameNode节点, 利用ZK进行状态标识,当需要进行状态切换时,由zkfc来负责切换,切换时需要防止脑裂(brain split)现象的发生
脑裂:(brain-split) 运行过程中出现两个 namenode 同时服务于整个集群,这种情况称之为脑裂
必须保证两个NameNode之间能够ssh无密码登录
隔离(Fence),即同一时刻仅仅有一个NameNode对外提供服务
元数据同步
- 集群启动后,standby NameNode和active NameNode同时与JournalNodes(JNS)进程保持通信
- 每次active NameNode写 EditLog 的时候,除了向本地磁盘写入 EditLog 之外,也会并行地向JournalNode集群之中的每一个JournalNode发送写请求,只要大多数 (majority) 的JournalNode节点返回成功就认为向JournalNode集群写入 EditLog 成功
- standby NameNode周期性的从JNS中获取 EditLog 并应用到本地namespace
- 在failover发生时,standby节点会在转变为active之前从JNS中读取并处理所有editlog,以此保持与active NameNode的状态完全同步
- 另一方面,为了failover后standy节点快速提供服务,所有的DateNode节点同时向主备两个NameNode报告block信息
journode是基于paxos协议实现的
参数配置
参考实例:
高可用集群hdfs-site.xml配置
手动故障转移
在原active的namenode节点上执行下面命令,强制转换nn2为active节点
hdfs haadmin -transitionToActive --forceactive nn2
自动故障转移工作机制
- ZooKeeper会话管理 :每个运行的NameNode主机也运行了一个ZKFC进程,ZKFC进程会在NameNode上实例一个Zookeeper客户端,保持一个在ZooKeeper中打开的会话
- 现役NameNode选择 :会话打开后ZKFC会将节点信息写入Zookeeper,谁先在Zookeeper中写入成功,且ZKFC发现没有其它的节点当前持有znode锁,它将为自己获取该锁,如果成功,则它已经赢得了选择,并负责运行故障转移进程以使它的本地NameNode为Active
- 如果本地NameNode处于active状态,ZKFC也保持一个特殊的znode锁,该锁使用了ZooKeeper对短暂节点的支持,如果会话终止,锁节点将自动删除
- 健康监测 :ZKFC使用一个健康检查命令定期地ping与之在相同主机的NameNode,只要该NameNode及时地回复健康状态,ZKFC认为该节点是健康的。如果该节点崩溃,健康监测器标识该节点为非健康的
- 故障检测 :集群中的每个NameNode在ZooKeeper中维护了一个持久会话,如果机器崩溃,ZKFC会释放对Zookeeper节点的所有权,ZooKeeper中的会话将终止,因为节点是临时节点,会话终止临时节点也就消失了
- 隔离 :目前现役NameNode崩溃,另一个节点可能从ZooKeeper获得特殊的排外锁以表明它应该成为现役NameNode,在成为现役之前,需要先把假死的NameNode进程杀掉,避免出现脑裂问题
- NameNode的standby节点会重新在Zookeeper上写入新的节点,并将自己提升为active
相关命令
hdfs haadmin -getAllServiceState
hdfs haadmin -transitionToActive --forcemanual <Namenode Id>
hdfs haadmin -transitionToStandby --forcemanual <Namenode Id>
YARN-HA
参数配置
参考实例:
高可用集群yarn-site.xml配置
自动故障转移机制
ResourceManager中基于zookeeper的ActiveStandbyElector组件来选举哪个RM作为activeRM。
active RM关闭或故障时自动选举standby状态的RM作为新的active RM接管工作
与HDFS的HA不同的是,YARN的HA方案不需要单独的ZKFC程序, 基于zk的ActiveStandbyElector作为RM内部组件进行故障检测和active选举
相关命令
yarn rmadmin -getAllServiceState
yarn rmadmin -transitionToActive --forcemanual <rm id>
yarn rmadmin -transitionToStandby --forcemanual <rm id>
附录
Zookeeper详解
热门推荐
防护用品是什么?作用与适用范围全解析
李东生:全球产业链重构,需要坚持开放共赢的理念
“一站式”支持 精准对接 河北2025年春风行动火热进行中
土木工程专业课程有哪些 学习难度大吗
吃螺蛳粉的有什么营养
厦门失业金领取条件及标准 最新厦门失业保险金在哪里可以申领?
南昌地铁2号线东延最新进展:南昌东站出入口已呈现!
Mac“其他”占用了很多空间怎么办?教你获得更多空间!
“Demo至上”:GDC上关于Steam游戏营销的新思路
国足世预赛困境与希望:解析0比1不敌沙特队后的出线之路
金融知识入门,普通家庭的理财智慧
皮罗综合征是什么病,能治愈吗
熬夜对眼睛容易引发的症状
深入了解 ARDUINO UNO PCB
身边的调料史——辣酱油
西安高新区集中开工23个项目 总投资271.6亿元
抗体稀释液:免疫实验的"隐形守护者"与精准选择指南
影视解说同步:文字与画面的最佳匹配策略
汽车充电中负荷分布的定价策略
合同解除的最新法律规定与实务操作指南
激光技术的原理与应用:从基础到前沿
太上老君是神嗎?深入探討他在道教中的地位與影響
靶机技术革新对军事应用的深远影响
沪港通股票投资指南:抓住机遇的最佳策略
创新引领 信创护航:MapGIS不动产登记系统国产化改造升级
深入纳米世界:孔容孔径与比表面积的科学探索
5000亿赡养:中国家庭养老新挑战与对策
全日制与非全日制教育的比较研究
长恨歌写什么?长恨歌:唐明皇与杨贵妃的爱情悲剧及其浩劫!
税收筹划的合法边界在哪里?