网站首页 > 博客文章 正文
HUE版本:3.12.0
HDP版本:2.6.4
前言
通过浏览器访问ip:8888登陆HUE界面,首次登陆会提示你创建用户,这里使用账号/密码:hue/hue登陆。
一、WebHDFS与HttpFS
在配置HUE访问NameNode HA之前,我们先来了解一下WebHDFS与HttpFS:
- 两者都是基于REST的HDFS API,使得一个集群外的host可以不用安装HADOOP和JAVA环境就可以对集群内的HADOOP进行访问,并且client不受语言的限制。
- WebHDFS是HDFS内置的、默认开启的一个服务,而HttpFS是HDFS一个独立的服务,若使用需要手动安装(CDH中安装HDFS时将HttpFS勾选上即可;HDP中需要用户手动安装)。
- WebHDFS是HortonWorks开发的,然后捐给了Apache;而HttpFS是Cloudera开发的,也捐给了Apache。
两者主要差别
WebHDFS是HDFS内置的组件,已经运行于NameNode和DataNode中。对HDFS文件的读写,将会重定向到文件所在的DataNode,并且会完全利用HDFS的带宽。HttpFS是独立于HDFS的一个服务。对HDFS文件的读写,将会通过它进行中转,它能限制带宽占用。
如果访问大文件,HttpFS服务本身有可能变成瓶颈。如果你想限制客户端流量,以防其过度占用集群的带宽时,那可以考虑HttpFS。
总结
WebHDFS与HttpFS各有利弊,都能满足基本需要。
虽然两者都支持HTTP REST API,但是Hue只能配置其中一种方式;对于HDFS HA的部署模式,只能使用HttpFS。因为无论NameNode所在ip如何变化,HUE通过HttpFS服务都能够访问到HDFS。
二、安装HttpFS
HDP默认是没有安装HttpFs的,所以这里需要手动安装:
yum install -y hadoop-httpfs
开启HttpFS:
service hadoop-httpfs start
关闭HttpFS:
service hadoop-httpfs stop
查看HttpFS状态:
service hadoop-httpfs status
HttpFS默认端口为14000,可使用netstat命令查看:
netstat -ntlp | grep 14000
三、修改配置文件
1. 修改HDFS配置
在ambari页面上,打开HDFS的”自定义core-site”,点击添加属性,输入
hadoop.proxyuser.httpfs.hosts=* hadoop.proxyuser.httpfs.groups=*
如图所示:
2. 检查HDFS配置
确保WebHDFS保持开启状态,如下图所示:
确保自定义core-site里面有hadoop.proxyuser.hue.groups和hadoop.proxyuser.hue.hosts属性,如下图所示:
如果没有的话,就仿照上述的做法添加到自定义core-site。
3. 修改hue.ini
如上图所示,其中fs_defaultfs的值要与HDFS上的配置值一致,如下图所示:
webhdfs_url的值是HttpFS所在主机+端口号,比如:http://liuyzh1.xdata:14000/webhdfs/v1。
四、启动HUE
执行以下命令,启动HUE:
/usr/hdp/2.6.4.0-91/hue/build/env/bin/supervisor
通过浏览器访问ip:8888登陆HUE界面,首次登陆会提示你创建用户,这里使用账号/密码:hue/hue登陆。
访问我们的文件系统,如下图所示:
成功。
五、总结
- 在Hue中配置webhdfs_url使用HttpFS服务,在集群启用高可用后必须选择使用HttpFS服务。
- 无论NameNode是否处于HA状态,HUE都可使用HttpFS服务来访问HDFS。
扩展链接
--END--
码字不易,如果您觉得文章写得不错,请关注作者~ 您的关注是我写作的最大动力
友情提示:原文排版精美,可点击分享链接查看。
猜你喜欢
- 2024-10-16 10分钟大数据Hadoop基础入门「值得收藏」
- 2024-10-16 0288-如何使用Flume采集Kafka数据写入HBase
- 2024-10-16 0032-如何在CDH启用Kerberos的情况下安装及使用Sentry(二)
- 2024-10-16 0362-如何在Spark Streaming应用中使用Kudu管理Kafka的Offset
- 2024-10-16 使用ClouderaManager的优点、产生背景和应用场景
- 2024-10-16 大数据之Impala入门实战,看这篇就够了
- 2024-10-16 0732-Cloudera Data Center7.0今天正式GA
- 2024-10-16 清华大佬学习经验:Hadoop教程(一) Hadoop入门教程
- 2024-10-16 你了解过Cloudera的整体架构吗?4.89G学习视频带你走进它的世界
- 2024-10-16 大数据Hadoop之——基于Hive的内存型SQL查询引擎Impala
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- powershellfor (55)
- messagesource (56)
- aspose.pdf破解版 (56)
- promise.race (63)
- 2019cad序列号和密钥激活码 (62)
- window.performance (66)
- qt删除文件夹 (72)
- mysqlcaching_sha2_password (64)
- ubuntu升级gcc (58)
- nacos启动失败 (64)
- ssh-add (70)
- jwt漏洞 (58)
- macos14下载 (58)
- yarnnode (62)
- abstractqueuedsynchronizer (64)
- source~/.bashrc没有那个文件或目录 (65)
- springboot整合activiti工作流 (70)
- jmeter插件下载 (61)
- 抓包分析 (60)
- idea创建mavenweb项目 (65)
- vue回到顶部 (57)
- qcombobox样式表 (68)
- vue数组concat (56)
- tomcatundertow (58)
- pastemac (61)
本文暂时没有评论,来添加一个吧(●'◡'●)