网站首页 > 博客文章 正文
1.YARN生产背景
? MapReduce1.x存在的问题:
? 1.单点故障&节点压力大不易扩展&不支持mapreduce以外的计算框架(spark,storm)
? 在MapReduce1.x下的架构:MapReduce:Master/Slave架构,1个JobTracker带多个 TaskTracker
? JobTracker:负责资源管理和作业调度
? TaskTracker:定期向JT汇报本节点的健康状况、资源使用情况、作业执行情况
? 接收来自JT的命令:启动任务/杀死任务
? 单点故障:整个集群中只有一个JobTracker如果JT挂掉了全部TT都完蛋了
? 2.资源利用率&运维成本
? 由于在MapReduce1.x的架构加只能跑MapReduce,所以想要用其他的计算框架就必须在搭建支持其他计算框架的集群,
?
? 所以由上面的图产生了共享集群的意愿,同时催生了YARN:不同的计算框架可以共享同一个HDFS集群上的数据,
?
2.YARN概述
3.YARN架构(重点,需复述)
?
? 1.REsourceManager:RM
? 整个集群同一时间提供服务的RM只有一个,负责集群资源的统一管理和调度
? 处理客户端的请求:提交一个作业、杀死一个作业
? 监控我们的NM,一旦某个NM挂了,那么该NM上运行的任务需要告诉我们的AM来如何处理
? 2.NodeManager:NM
? 整个集群中有多个,负责自己本身节点资源管理和使用
? 定时向RM汇报本节点的资源使用情况
? 接受并处理来自RM的各种命令:启动Container
? 处理来自AM的命令
? 单个节点的资源管理是由它自己管理,通过心跳机制告诉RM
? 3.ApplicationMaster:AM
? 每个应用程序对应一个:MR、Spark,负责应用程序的管理
? 为应用程序向RM申请资源(core、memory),分配给内部task
? 需要与NM进行通信:启动/停止task的运行,task试运行在container里面,AM也是运行在Container里面
? 4.Container
? 封装了CPU、Memory等资源的一个容器
? 是一个任务运行环境的抽象
? 5.Client
? 提交作业
? 查询作业的运行进度
? 杀死作业
4.YARN执行流程
?
5.YARN环境搭建
? 1.使用版本:hadoop-2.6.0-cdh5.7.0
? 2.修改配置文件
- cd /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop
- vim yarn-site.xml
- <!--告诉框架yarn的nodemanager用的哪一个service-->
- <configuration>
- <property>
- <name>yarn.nodemanager.aux-services</name>
- <value>mapreduce_shuffle</value>
- </property>
- </configuration>
? 修改mapred-site.xml
- cd /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop
- #如果没有mapred-site.xml需要拷贝一份 mapred-site.xml.template
- cp mapred-site.xml.template mapred-site.xml
- vim mapred-site.xml
?
- <!--告诉框架最终mapReduce最终是跑在YARN上面-->
- <configuration>
- <property>
- <name>mapreduce.framework.name</name>
- <value>yarn</value>
- </property>
- </configuration>
? 3.启动ResourceManager和NodeManager进程
- cd /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/sbin
- ./start-yarn.sh
? 4.验证
? jps
? 应当出现:ResourceManager和NodeManager
? 浏览器:http://hadoop000:8088
? 5.停止YARN相关的进程
- cd /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/sbin
- ./stop-yarn.sh
6.提交作业到YARN上执行
?
- #1 进入到该目录下:
- cd /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/share/hadoop/mapreduce
- #2 通过命令提交mapReduce作业到YARN上运行:
- hadoop jar hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar pi 2 3
?
猜你喜欢
- 2024-10-14 国庆期间别偷懒,大数据平台只差YARN了
- 2024-10-14 为什么我们从Yarn切换到pnpm(yarn设置淘宝镜像)
- 2024-10-14 flink的yarn模式部署(flink的三种部署方案)
- 2024-10-14 yarn的安装和使用(yarn安装教程)
- 2024-10-14 yarn 的安装和使用(yarn安装教程)
- 2024-10-14 操作学习-Spark on Yarn(spark on yarn执行流程)
- 2024-10-14 全面解析:Hadoop基础——YARN(hadoop yarn工作原理)
- 2024-10-14 Node简史及好书推荐(nodejs相关书籍)
- 2024-10-14 大数据之-Hadoop3.x_Yarn_常用命令---大数据之hadoop3.x_0147
- 2024-10-14 大数据系列文章之Yarn组件及其执行流程
你 发表评论:
欢迎- 367℃用AI Agent治理微服务的复杂性问题|QCon
- 358℃初次使用IntelliJ IDEA新建Maven项目
- 358℃手把手教程「JavaWeb」优雅的SpringMvc+Mybatis整合之路
- 351℃Maven技术方案最全手册(mavena)
- 348℃安利Touch Bar 专属应用,让闲置的Touch Bar活跃起来!
- 346℃InfoQ 2024 年趋势报告:架构篇(infoq+2024+年趋势报告:架构篇分析)
- 345℃IntelliJ IDEA 2018版本和2022版本创建 Maven 项目对比
- 342℃从头搭建 IntelliJ IDEA 环境(intellij idea建包)
- 最近发表
- 标签列表
-
- powershellfor (55)
- messagesource (56)
- aspose.pdf破解版 (56)
- promise.race (63)
- 2019cad序列号和密钥激活码 (62)
- window.performance (66)
- qt删除文件夹 (72)
- mysqlcaching_sha2_password (64)
- ubuntu升级gcc (58)
- nacos启动失败 (64)
- ssh-add (70)
- jwt漏洞 (58)
- macos14下载 (58)
- yarnnode (62)
- abstractqueuedsynchronizer (64)
- source~/.bashrc没有那个文件或目录 (65)
- springboot整合activiti工作流 (70)
- jmeter插件下载 (61)
- 抓包分析 (60)
- idea创建mavenweb项目 (65)
- vue回到顶部 (57)
- qcombobox样式表 (68)
- vue数组concat (56)
- tomcatundertow (58)
- pastemac (61)
本文暂时没有评论,来添加一个吧(●'◡'●)