网站首页 > 博客文章 正文
1.Flink集群角色
Flink提交作业和执行任务时,需要几个关键组件
- 客户端(Client):代码由客户端获取并做转换,之后提交给JobManager
- JobManager就是Flink集群里的“管事人”,对作业进行中央调度管理;而它获取到要执行的作业后,会进一步处理转换,然后分发任务给众多的TaskManager。
- TaskManager就是真正“干活的人”,数据处理操作都是它们来做的。
2.Flink集群搭建
2.1集群规划
节点服务器 | hadoop102 | hadoop103 | hadoop104 |
角色 | JobManager TaskManager | TaskManager | TaskManager |
2.2集群搭建并启动
- 下载并解压安装包
- 下载安装包flink-1.17.0-bin-scala_2.12.tgz,将该jar包上传到hadoop102节点服务器的/opt/software路径上。
- 在/opt/software路径上解压flink-1.17.0-bin-scala_2.12.tgz到/opt/module路径上。
tar -zxvf flink-1.17.0-bin-scala_2.12.tgz -C /opt/module
- 修改集群配置
- 进入conf路径,修改flink-conf.yaml文件,指定hadoop102节点服务器为JobManager
vim flink-conf.yaml
#修改内容如下
#JobManager节点地址
jobmanager.rpc.address: hadoop102
jobmanager.bind-hose: 0.0.0.0
rest.address: hadoop102
rest.bind-address: 0.0.0.0
#TaskManager节点地址。需要配置当前机器名
taskmanager.bind-host: 0.0.0.0
taskmanager.host: hadoop102
- 修改workers文件,指定hadoop102、hadoop103和hadoop104为TaskManager
vim workers
#修改内容如下
hadoop102
hadoop103
hadoop104
- 修改masters文件
vim masters
#修改内容如下
hadoop102:8081
- 将/opt/module中flink-1.17.0分发到hadoop103、hadoop104上面去
#进入/opt/module目录中
xsync flink-1.17.0/
- 修改hadoop103、hadoop104上配置文件flink-conf.yaml
#进入/opt/module目录中
vim flink-conf.yaml
#修改内容如下(hadoop104修改类似)
taskmanager.host: hadoop103
- 在 flink-conf.yaml文件中还可以对集群中的 JobManager 和 TaskManager 组件进行优化配置,主要配置项如下:
- jobmanager.memory.process.size:对JobManager进程可使用到的全部内存进行配置包括 JVM 元空间和其他开销,默认为1600M,可以根据集群规模进行适当调整。
- taskmanager.memory.process.size:对 TaskManager 进程可使用到的全部内存进行配置包括 JVM 元空间和其他开销,默认为1728M,可以根据集群规模进行适当调整。
- taskmanager.numberOfTaskSlots:对每个 TaskManager 能够分配的 Slot 数量进行配置默认为 1,可根据 TaskManager 所在的机器能够提供给 Flink的 CPU数量决定。所谓Slot就是 TaskManager 中具体运行一个任务所分配的计算资源。
- parallelism.default:Flink任务执行的并行度,默认为 1。优先级低于代码中进行的并行度配置和任务提交时使用参数指定的并行度数量。
- 启动flink集群
#进入/opt/module/flink-1.17.0目录中,启动flink集群
bin/start-cluster.sh
- 进入flink集群页面
打开网页,输入hadoop102:8081,进入flink集群页面
猜你喜欢
- 2025-03-30 大数据Hadoop之——Apache Hudi 数据湖实战操作
- 2025-03-30 基于 Flink CDC YAML 的 MySQL 到 Kafka 流式数据集成
- 2025-03-30 Flink SQL 命令行报错(flink sql window)
- 2025-03-30 手把手带你部署ZooKeeper(zookeeper部署方式)
- 2025-03-30 flink1.20集群环境搭建(flinkonyarn集群部署)
- 2025-03-30 群晖DS218+部署kafka(群晖ds218j)
- 2025-03-30 大数据Hadoop之——Kafka Streams原理介绍与简单应用示例
- 2025-03-30 Scala安装及环境配置(scala安装及环境配置linux)
- 2025-03-30 Kafka 4.0.0 登场:移除 ZooKeeper、重塑实时数据流处理新格局
- 2025-03-30 Kafka 4.0.0 版本发布:告别 ZooKeeper,拥抱 KRaft!
你 发表评论:
欢迎- 最近发表
-
- 给3D Slicer添加Python第三方插件库
- Python自动化——pytest常用插件详解
- Pycharm下安装MicroPython Tools插件(ESP32开发板)
- IntelliJ IDEA 2025.1.3 发布(idea 2020)
- IDEA+Continue插件+DeepSeek:开发者效率飙升的「三体组合」!
- Cursor:提升Python开发效率的必备IDE及插件安装指南
- 日本旅行时想借厕所、买香烟怎么办?便利商店里能解决大问题!
- 11天!日本史上最长黄金周来了!旅游万金句总结!
- 北川景子&DAIGO缘定1.11 召开记者会宣布结婚
- PIKO‘PPAP’ 洗脑歌登上美国告示牌
- 标签列表
-
- ifneq (61)
- messagesource (56)
- aspose.pdf破解版 (56)
- promise.race (63)
- 2019cad序列号和密钥激活码 (62)
- window.performance (66)
- qt删除文件夹 (72)
- mysqlcaching_sha2_password (64)
- ubuntu升级gcc (58)
- nacos启动失败 (64)
- ssh-add (70)
- jwt漏洞 (58)
- macos14下载 (58)
- yarnnode (62)
- abstractqueuedsynchronizer (64)
- source~/.bashrc没有那个文件或目录 (65)
- springboot整合activiti工作流 (70)
- jmeter插件下载 (61)
- 抓包分析 (60)
- idea创建mavenweb项目 (65)
- vue回到顶部 (57)
- qcombobox样式表 (68)
- vue数组concat (56)
- tomcatundertow (58)
- pastemac (61)
本文暂时没有评论,来添加一个吧(●'◡'●)