基于Zookeper的hadoop高可用HA精选

基于Zookeper的HDFS和YARN高可用HA精选【精简】：

提示：请先学完HDFS基础 HDFS知识点

一、概述：

1、Zookeeper

Zookeeper是一个分布式应用程序的协调服务。它是一个为分布式应用提供一致性服务的软件，提供的性能包括：配置维护、名字服务、分布式同步、组服务等。从设计模式的角度来理解，Zookeeper就是一个基于观察者模式设计的分布式服务管理框架。它负责存储和管理大家都关心的数据，然后接受观察者的注册，一旦这些数据的状态发生变化，Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者来做出相应的反应。

Zookeeper = 文件系统 + 通知机制
在这里插入图片描述

2 、HA概述

1）所谓HA（High Available），即高可用（7*24小时不中断服务）。
2）实现高可用最关键的策略是消除单点故障。HA严格来说应该分成各个组件的HA机制：HDFS的HA和YARN的HA。
3）Hadoop2.0之前，在HDFS集群中NameNode存在单点故障（SPOF）。
4）NameNode主要在以下两个方面影响HDFS集群
NameNode机器发生意外，如宕机，集群将无法使用，直到管理员重启
NameNode机器需要升级，包括软件、硬件升级，此时集群也将无法使用
HDFS HA功能通过配置Active/Standby两个NameNodes实现在集群中对NameNode的热备来解决上述问题。如果出现故障，如机器崩溃或机器需要升级维护，这时可通过此种方式将NameNode很快的切换到另外一台机器。

二、工作原理：

1. 元数据管理方式需要改变

内存中各自保存一份元数据；
Edits日志只有Active状态的NameNode节点可以做写操作；
两个NameNode都可以读取Edits；
共享的Edits放在一个共享存储中管理（qjournal和NFS两个主流实现）；

2. 需要一个状态管理功能模块

实现了一个zkfailover，常驻在每一个namenode所在的节点，每一个zkfailover负责监控自己所在NameNode节点，利用zk进行状态标识，当需要进行状态切换时，由zkfailover来负责切换，切换时需要防止brain split(脑裂)现象的发生,也就是数据不一致的现象。

3. 必须保证两个NameNode之间能够ssh无密码登录

4. 隔离（Fence），即同一时刻仅仅有一个NameNode对外提供服务

三、配置Zookeeper集群：

1. 集群规划

在hadoop1、hadoop2和hadoop3三个节点上部署Zookeeper。开启了高可用, 不需要SecondaryNameNode, 该角色并不具备故障转移的功能, 可以理解为一个备份点

hadoop102	hadoop103	hadoop104
NameNode	NameNode
JournalNode	JournalNode	JournalNode
DataNode	DataNode	DataNode
ZK	ZK	ZK
	ResourceManager
NodeManager	NodeManager	NodeManager

2. 解压安装

（1）解压Zookeeper安装包到/exper/server/目录下

 tar -zxvf zookeeper-3.4.10.tar.gz -C /exper/server/
1

（2）在/exper/server/zookeeper-3.4.10/这个目录下创建zkData

mkdir -p zkData
1

（3）重命名/exper/server/zookeeper-3.4.10/conf这个目录下的zoo_sample.cfg为zoo.cfg

mv zoo_sample.cfg zoo.cfg
1

3. 配置zoo.cfg文件

（1）具体配置

dataDir=/exper/server/zookeeper-3.4.10/zkData
1

增加如下配置
#######################cluster##########################

server.1=hadoop1:2888:3888
server.2=hadoop2:2888:3888
server.3=hadoop3:2888:3888
1
2
3

（2）配置参数解读
Server.A=B:C:D。
A是一个数字，表示这个是第几号服务器；
B是这个服务器的IP地址；
C是这个服务器与集群中的Leader服务器交换信息的端口；
D是万一集群中的Leader服务器挂了，需要一个端口来重新进行选举，选出一个新的Leader，而这个端口就是用来执行选举时服务器相互通信的端口。
集群模式下配置一个文件myid，这个文件在dataDir目录下，这个文件里面有一个数据就是A的值，Zookeeper启动时读取此文件，拿到里面的数据与zoo.cfg里面的配置信息比较从而判断到底是哪个server。

4. 集群操作

（1）在/exper/server/zookeeper-3.4.10/zkData目录下创建一个myid的文件

touch myid
1

添加myid文件，注意一定要在linux里面创建，在notepad++里面很可能乱码
（2）编辑myid文件

vi myid
1

在文件中添加与server对应的编号：如1
（3）拷贝配置好的zookeeper到其他机器上

scp -r zookeeper-3.4.10/ root@hadoop2:/exper/server/
scp -r zookeeper-3.4.10/ root@hadoop3:/exper/server/
1
2

并分别修改myid文件中内容为2、3
（4）分别启动zookeeper

[root@hadoop1 zookeeper-3.4.10]# bin/zkServer.sh start
[root@hadoop2 zookeeper-3.4.10]# bin/zkServer.sh start
[root@hadoop3 zookeeper-3.4.10]# bin/zkServer.sh start
1
2
3

（5）查看状态

[root@hadoop1 zookeeper-3.4.10]# bin/zkServer.sh status
JMX enabled by default
Using config: /exper/server/zookeeper-3.4.10/bin/../conf/zoo.cfg
Mode: follower
[root@hadoop2 zookeeper-3.4.10]# bin/zkServer.sh status
JMX enabled by default
Using config: /exper/server/zookeeper-3.4.10/bin/../conf/zoo.cfg
Mode: leader
[root@hadoop3 zookeeper-3.4.10]# bin/zkServer.sh status
JMX enabled by default
Using config: /exper/server/zookeeper-3.4.10/bin/../conf/zoo.cfg
Mode: follower
1
2
3
4
5
6
7
8
9
10
11
12

四、配置HDFS-HA集群

1、修改配置文件

（1）在exper目录下创建一个ha文件夹

mkdir ha
1

（2）备份hadoop 将hadoop目录拷贝到ha里

cp -r /exper/server/hadoop-3.1.3/ /exper/ha/
1

（3）修改配置core-site.xml

   <!-- 把两个NameNode）的地址组装成一个集群mycluster -->
    <property>
            <name>fs.defaultFS</name>
            <value>hdfs://mycluster</value>
    </property>
            <!-- 指定 hadoop 数据的存储目录 -->
     <property>
              <name>hadoop.tmp.dir</name>
              <value>/exper/ha/hadoop-3.1.3/data/tmp</value>
      </property>

      <!--自动故障转移的总人数  -->
    <property>
			<name>ha.zookeeper.quorum</name>
			<value>hadoop1:2181,hadoop2:2181,hadoop3:2181</value>
	</property>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

（4）修改配置hdfs-site.xml

 		 <property>
                <name>dfs.namenode.rpc-address.mycluster.nn1</name>
                <value>hadoop1:9000</value>
        </property>
<!-- nn2的RPC通信地址 -->
        <property>
                <name>dfs.namenode.rpc-address.mycluster.nn2</name>
                <value>hadoop2:9000</value>
        </property>
<!-- nn1的http通信地址 -->
        <property>
                <name>dfs.namenode.http-address.mycluster.nn1</name>
                <value>hadoop1:9870</value>
        </property>

        <!-- nn2的http通信地址 -->
        <property>
                <name>dfs.namenode.http-address.mycluster.nn2</name>
                <value>hadoop2:9870</value>
        </property>
        <!-- 指定NameNode元数据在JournalNode上的存放位置 -->
        <property>
                <name>dfs.namenode.shared.edits.dir</name>
                <value>qjournal://hadoop1:8485;hadoop2:8485;hadoop3:8485/mycluster</value>
        </property>
        <!-- 配置隔离机制，即同一时刻只能有一台服务器对外响应 -->
         <property>
                <name>dfs.ha.fencing.methods</name>
                <value>sshfence</value>
        </property>
        <!-- 使用隔离机制时需要ssh无秘钥登录-->
        <property>
                <name>dfs.ha.fencing.ssh.private-key-files</name>
                <value>/root/.ssh/id_rsa</value>
        </property>
      <!-- 声明journalnode服务器存储目录-->
        <property>
                <name>dfs.journalnode.edits.dir</name>
                <value>/exper/ha/hadoop-3.1.3/data/jn</value>
        </property>
        <!-- 关闭权限检查-->
        <property>
                <name>dfs.permissions.enable</name>
                <value>false</value>
        </property>
        <!-- 访问代理类：client，mycluster，active配置失败自动切换实现方式-->
        <property>
                <name>dfs.client.failover.proxy.provider.mycluster</name>
                <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
        </property>
        <!-- 自动故障转移-->
        <property>
			<name>dfs.ha.automatic-failover.enabled</name>
			<value>true</value>
		</property>

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56

（7）拷贝配置好的hadoop环境到其他节点

scp -r /exper/ha/ root@hadoop2:/exper/ha/
1

2、启动集群

（1）在所有的JournalNode节点上，输入以下命令启动journalnode服务三台

sbin/hadoop-daemon.sh start journalnode
1

（2）在[nn1]上，对其进行格式化，并单独启动

必须启动Journalnode

bin/hdfs namenode -format
sbin/hadoop-daemon.sh start namenode
1
2

（3）在[nn2]上，同步nn1的元数据信息

bin/hdfs namenode -bootstrapStandby
1

(4) 添加启动用户在sbin/start-dfs.sh和stop.dfs.sh文件里

HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
HDFS_JOURNALNODE_USER=root
HDFS_ZKFC_USER=root
1
2
3
4
5
6

（5）关闭所有HDFS服务，

注意因为之前有一份hadoop 所以记得要在ha目录下的hadoop下启动，不能全局启动，关闭也是一样的，除非改/etc/profile下的全局变量。


/exper/ha/hadoop-3.1.3/sbin/stop-dfs.sh
1
2

（6）启动Zookeeper集群，在三台都启动

bin/zkServer.sh start
1

（7）初始化HA在Zookeeper中状态

bin/hdfs zkfc -formatZK
1

（8）启动HDFS服务，

注意因为之前有一份hadoop 所以记得要在ha目录下的hadoop下启动，不能全局启动，关闭也是一样的。

/exper/ha/hadoop-3.1.3/sbin/start-dfs.sh
1

（9）在各个NameNode节点上启动DFSZK Failover Controller，先在哪台机器启动，哪个机器的NameNode就是Active NameNode

start-dfs.sh里加了HDFS_ZKFC_USER=root可跳过

 sbin/hadoop-daemon.sh start zkfc
1

成功图如下其中一个位active状态

在这里插入图片描述

集群搭建完毕。

3、制作一键启动脚本

创建文件

vim bigdata.sh
1

输入

#!/bin/sh
flag=$1
start_exc="start"
stop_exc="stop"
if  [ $flag = $start_exc ]
then
        echo "正在启动中"
        # 循环启动zk
        for ((i=1;i<=3;i=$i+1));do
                echo “进入hadoop$i”
                ssh hadoop$i "/exper/server/zookeeper-3.4.10/bin/zkServer.sh start"

        done
        #执行
        eval "/exper/ha/hadoop-3.1.3/sbin/start-dfs.sh"
        # 手动取消nn2为active状态
        echo yes | eval "/exper/ha/hadoop-3.1.3/bin/hdfs haadmin -transitionToStandby --forcemanual nn2"
elif [ $flag = $stop_exc ]
then
        echo "正在停止中"
        for ((i=1;i<=3;i=$i+1));do
                echo “进入hadoop$i”
                ssh hadoop$i "/exper/server/zookeeper-3.4.10/bin/zkServer.sh stop"
         done

        eval "/exper/ha/hadoop-3.1.3/sbin/stop-dfs.sh"
else
        echo "请带参数start或者stop"
fi
echo "######################################运行end############################################"
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

给文件权限

chmod 777 bigdata.sh
1

执行启动

./bigdata.sh start 
1

执行关闭

./bigdata.sh stop
1

五、Yarn 高可用

基础前提YARN知识

1、配置YARN-HA集群规划

规划集群，hadoop1的Namenode 作为active所以不在hadoop1上搭建ResourceManager， hadoop2由于服务比较多，作为Namenode和ResourceManager备份，处于不激活standby状态，hadoop3的ResourceManager作为active，这样实现了内存优化分配。

hadoop1	hadoop2	hadoop3
NameNode（active）	NameNode（standby）
JournalNode	JournalNode	JournalNode
DataNode	DataNode	DataNode
ZK	ZK	ZK
	ResourceManager（standby）	ResourceManager（active）
NodeManager	NodeManager	NodeManager

2 具体配置

（1） yarn-site.xml配置

 

<!-- Site specific YARN configuration properties -->
<!-- 指定 MR 走 shuffle -->
         
                yarn.nodemanager.aux-services</name>
                mapreduce_shuffle</value>
         </property>
<!--启用resourcemanager ha-->
        
                yarn.resourcemanager.ha.enabled</name>
                true</value>
        </property>
<!--声明两台resourcemanager的地址-->
         
                yarn.resourcemanager.cluster-id</name>
                 cluster-yarn1</value>
        </property>

        
                 yarn.resourcemanager.ha.rm-ids</name>
                 rm2,rm3</value>
        </property>

        
                 yarn.resourcemanager.hostname.rm2</name>
                 hadoop2</value>
        </property>

        
                 yarn.resourcemanager.hostname.rm3</name>
                 hadoop3</value>
        </property>
         <!--指定zookeeper集群的地址-->
        
                yarn.resourcemanager.zk-address</name>
                 hadoop1:2181,hadoop2:2181,hadoop3:2181</value>
        </property>
         <!--启用自动恢复-->
        
                yarn.resourcemanager.recovery.enabled</name>
                true</value>
        </property>
            <!--指定resourcemanager的状态信息存储在zookeeper集群-->
         
                 yarn.resourcemanager.store.class</name>
                org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
        </property>
 <!-- 环境变量的继承 -->
         
                 yarn.nodemanager.env-whitelist</name>

                JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CO
                NF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAP
                RED_HOME</value>
         </property>

</configuration>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58

（2）同步更新其他节点的配置信息

 rsync -rvl /exper/ha/hadoop-3.1.3/sbin/ root@hadoop2:/exper/ha/hadoop-3.1.3/sbin/
 rsync -rvl /exper/ha/hadoop-3.1.3/sbin/ root@hadoop3:/exper/ha/hadoop-3.1.3/sbin/
1
2

3. 启动YARN

（1）在hadoop2中执行：

/exper/ha/hadoop-3.1.3/sbin/start-yarn.sh
1

（2）在hadoop3中执行：

/exper/ha/hadoop-3.1.3/sbin/yarn-daemon.sh start resourcemanager
1

（3）查看服务状态，如图3-24所示

/exper/ha/hadoop-3.1.3/bin/yarn rmadmin -getServiceState rm2
/exper/ha/hadoop-3.1.3/bin/yarn rmadmin -getServiceState rm3
1
2

现在2中执行start-yarn.sh
命令，所以2的rm为active，之后3启动的rm为standby，但对外透明，只提供使用，不显示谁为active，即使访问3的yarn页面，也会跳转到2。
kill掉2后，2不能访问，yarn页面不会自动跳转，需要手动访问3，此时3已经成为active，但对外透明，实现yarn高可用

最终启动和停止shell代码

#!/bin/sh
flag=$1
start_exc="start"
stop_exc="stop"
if  [ $flag = $start_exc ]
then
        echo "正在启动中"
        # 循环启动zk
        for ((i=1;i<=3;i=$i+1));do
                echo “进入hadoop$i”
                ssh hadoop$i "/exper/server/zookeeper-3.4.10/bin/zkServer.sh start"

        done
        #执行
        eval "/exper/ha/hadoop-3.1.3/sbin/start-dfs.sh"
        # 手动取消nn2为active状态
        echo yes | eval "/exper/ha/hadoop-3.1.3/bin/hdfs haadmin -transitionToStandby --forcemanual nn2"
        ssh hadoop2 " /exper/ha/hadoop-3.1.3/sbin/start-yarn.sh"
        ssh hadoop2 "echo yes | eval '/exper/ha/hadoop-3.1.3/bin/yarn rmadmin -transitionToStandby rm2 --forcemanual'"
elif [ $flag = $stop_exc ]
then
        echo "正在停止中"
        for ((i=1;i<=3;i=$i+1));do
                echo “进入hadoop$i”
                ssh hadoop$i "/exper/server/zookeeper-3.4.10/bin/zkServer.sh stop"
         done

        eval "/exper/ha/hadoop-3.1.3/sbin/stop-dfs.sh"
        ssh hadoop2 " /exper/ha/hadoop-3.1.3/sbin/stop-yarn.sh"
else
        echo "请带参数start或者stop"
fi
echo "######################################运行end############################################"
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33

相关阅读:
【学习笔记】《深入浅出Pandas》第17章：Pandas实战案例
 react 中获取多个input输入框中的值的俩种写法
 Asp .Net Core 系列：集成 Refit 和 RestEase 声明式 HTTP 客户端库
 LeViT：Facebook提出推理优化的混合ViT主干网络 | ICCV 2021
【操作系统】线程的使用
 Kafka - 04 Java客户端实现消息发送和订阅
 软件测试 - Linux的常用命令
 querySelectorAll()和querySelector()
深度学习框架代码（草稿）
Java native 关键字
原文地址：https://blog.csdn.net/qq_21888965/article/details/126797638