网站首页 > 博客文章 正文
前面六篇文章把hadoop的hdfs搭建起来了,并且可以通过hadoop内置的jar中的sdk访问hadoop的hdfs,能够通过自带的命令做一些文件的操作。这个之后我们需要把一些mapreduce和spark之内的数据运算的客户端引入到hadoop系统中来。在引入之前,我们先介绍Yarn这个东西,他通过Resource Manager 对请求hdfs的客户端进行资源的分配,对一个数据计算的请求都会生成一个对应的App Mstr,由他去管理每个datanode节点上的计算,对于每个datanode节点生成一个计算Container容器。App Mstr不断的和Resource Manager 进行沟通,获取客户端的计算计划(split,jar,partition)然后指挥Container完成最终的计算。今天我们来看看如何动手搭建Jarn。
准备
我们之前的文章里面已经搭建了hdfs集群,我们需要再这个之上再加入RS(Resource Manager) 和NM(Node Manager)的服务器配置。由于RS是client和hdfs之间的一层代理,而且是一个单点我们需要做HA(高可用),所以这里需要把node03和node04作为NM的服务器(互为主从)。对于NM来说他是负责在datanode节点上进行计算的,所以他需要和datanode配置在一起,所以需要配置在节点node02,node03,node04上面。
node01(192.168.146.101):namenode01 ,ZKFC,JNN(journalnode)
node02(192.168.146.102):namenode02,datanode,zookeeper,ZKFC,JNN,NM(Node Manager)
node03(192.168.146.103): datanode, zookeeper, JNN,RS(Resource Manager),NM
node04(192.168.146.104): datanode,zookeeper,RS,NM
修改配置文件
到hadoop的配置目录中找到mapred-site.xml 文件进行修改。在node01中修改。
cd /usr/hadoop-3.1.2/etc/hadoop
vi mapred-site.xml
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
修改yarn-site.xml文件,这里指定mapreduce的方式,是否打开高可用,集群的clusterID。以及定义的resource manager(两个)和zookeeper的地址。
vi yarn-site.xml
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>
<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>cluster1</value>
</property>
<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>node03</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>node04</value>
</property>
<property>
<name>yarn.resourcemanager.zk-address</name>
<value>node02:2181,node03:2181,node04:2181</value>
</property>
</configuration>
把配置文件分发到其他三个节点
scp mapred-site.xml yarn-site.xml node02:`pwd`
scp mapred-site.xml yarn-site.xml node03:`pwd`
scp mapred-site.xml yarn-site.xml node04:`pwd`
保证hadoop-env.sh 下面的角色配置是正确的
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root
source hadoop-env.sh
启动Yarn
如果几个节点询问yarn目录的执行权限可用对几个节点配置如下。
chmod 744 /usr/hadoop-3.1.2/bin/yarn
启动yarn在node01上面运行
start-yarn.sh
启动成功以后通过jps看看每个节点的进程运行情况。
在node03和node04中启动resource manager
yarn-daemon.sh start resourcemanager
访问 http://node03:8088 可用看到node3的resource manager 已经激活了
同样对于node04 作为node03 的standby
到此安装结束,有喜欢的点一下关注。谢谢各位的支持。
猜你喜欢
- 2024-10-14 国庆期间别偷懒,大数据平台只差YARN了
- 2024-10-14 为什么我们从Yarn切换到pnpm(yarn设置淘宝镜像)
- 2024-10-14 flink的yarn模式部署(flink的三种部署方案)
- 2024-10-14 yarn的安装和使用(yarn安装教程)
- 2024-10-14 yarn 的安装和使用(yarn安装教程)
- 2024-10-14 操作学习-Spark on Yarn(spark on yarn执行流程)
- 2024-10-14 全面解析:Hadoop基础——YARN(hadoop yarn工作原理)
- 2024-10-14 Node简史及好书推荐(nodejs相关书籍)
- 2024-10-14 大数据之-Hadoop3.x_Yarn_常用命令---大数据之hadoop3.x_0147
- 2024-10-14 大数据系列文章之Yarn组件及其执行流程
你 发表评论:
欢迎- 367℃用AI Agent治理微服务的复杂性问题|QCon
- 358℃初次使用IntelliJ IDEA新建Maven项目
- 357℃手把手教程「JavaWeb」优雅的SpringMvc+Mybatis整合之路
- 351℃Maven技术方案最全手册(mavena)
- 348℃安利Touch Bar 专属应用,让闲置的Touch Bar活跃起来!
- 346℃InfoQ 2024 年趋势报告:架构篇(infoq+2024+年趋势报告:架构篇分析)
- 345℃IntelliJ IDEA 2018版本和2022版本创建 Maven 项目对比
- 342℃从头搭建 IntelliJ IDEA 环境(intellij idea建包)
- 最近发表
- 标签列表
-
- powershellfor (55)
- messagesource (56)
- aspose.pdf破解版 (56)
- promise.race (63)
- 2019cad序列号和密钥激活码 (62)
- window.performance (66)
- qt删除文件夹 (72)
- mysqlcaching_sha2_password (64)
- ubuntu升级gcc (58)
- nacos启动失败 (64)
- ssh-add (70)
- jwt漏洞 (58)
- macos14下载 (58)
- yarnnode (62)
- abstractqueuedsynchronizer (64)
- source~/.bashrc没有那个文件或目录 (65)
- springboot整合activiti工作流 (70)
- jmeter插件下载 (61)
- 抓包分析 (60)
- idea创建mavenweb项目 (65)
- vue回到顶部 (57)
- qcombobox样式表 (68)
- vue数组concat (56)
- tomcatundertow (58)
- pastemac (61)
本文暂时没有评论,来添加一个吧(●'◡'●)