搭建大数据平台Hadoop

本文尝试超简略介绍Hadoop的安装流程,简述一下安装遇到的问题和要点。

比较注重关键点,属于后妈级,因为我比较懒,安装的时候并没有截图,所以只能语言描述了。

1.JDK版本:首先JDK是必须的,然后JDK的版本用JDK8(本来因为今年都已2022年了,虽然java的长期开发版的维护支持有8年但是,8虽然是最经典的版本但是支持也快结束了,所以我就先装的17,但是JDK从11之后就移除了javax.activation**,导致使用Hadoop无法上传文件,所以8应该是最适配Hadoop的java环境)

比如这个报错。(这是我在Hadoop图形化看到的)

1
Failed to retrieve data from /webhdfs/v1/?op=LISTSTATUS: Server Error.

2.第二点就是免密登录,这个在Linux环境要做,就是生成一下公钥密钥,然后放在运行Hadoop用户的(可以创建一个叫Hadoop的用户)家目录下的.ssh目录下。希望你懂我的意思。然后ssh自己能直接登录。

windows10的环境不需要做这个,Mac的环境好像有图形化设置,具体百度都行了,百度的教程比我详细。狗头

3.然后就是设置Hadoop的配置文件了,网上的都有,懒的直接复制粘贴,关于部署方式,我觉得伪分布和单机模式的区别,就是在这里体现的,安装Hadoop就不用细说了,像这些的都是直接下载的二进制执行文件的压缩包,然后我看学校发的教科书好像说是Hadoop不能直接在windows上运行,需要替换bin目录文件,在Github搜对应版本的hadoop-untils,但是我感觉好像不需要,我使用的新版里面有cmd脚本,也没有注意旧版本有没有。(可以自行试一试哈)。

4.然后就是格式化了,格式化命令最后现实的不一定时成功格式化,我试了两台设备都是显示的,什么什么shutdown,但是其实是成功了的,因为从下面往上找能找到一句成功的语句。

5.然后就是启动了,manjaro没有 hostname命令,简直了,然后启动脚本会赋值secondnamenode主机名,直接报错,获得空的名字,然后启动起来发现,关闭脚本也报错,还无法关闭secondnamenode。所以换成了Ubuntu,然后启动可以报一个奇怪的错误。

6.关于奇怪错误的解决方案,我贴几个报错吧,不然着实是有亿点点抽象。

1
util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable。

有大概两个 搜索到的解决方案,一个是修改Hadoop的环境配置文件,说到这里虽然环境变量里配置的JAVA_HOME的变量,但是Linux的环境依然要在Hadoop的环境配置文件中写一下。

接着上一个报错,网上很多是说因为找不到library的环境变量设置一下解决,但是设置了没有反应,还有一种就是需要重新编译glibc,很复杂,不想弄(太乱了,再加上我arm的架构,有点复杂,搞不起来)。

综上这个报错每次启动的时候会显示,然后执行命令的时候也会。。。没有解决。

7.windows运行很简单,但是没有啥实际意义。。。


搭建大数据平台Hadoop
https://steammilk.com/2022/10/15/2022-all/hadoop/
作者
蒸奶泡
发布于
2022年10月15日
更新于
2025年1月8日
许可协议