搭建 Hadoop 群集

2025-04-26 08:36:15

共7大步骤

更改所有节点的机器名

1、为方便操作,更改机器名,使群集内的机器名分别为Master、Slave1、Slave2、Slave3、Slave4、Slave5、Slave6……

2、具体修改方法:在Ubuntu的终端中执行下列命令,更换原有文件内容即可(图),修改后重启操作系统方可生效。sudo gedit /etc/hostname

搭建 Hadoop 群集

修改hosts文件

1、节点规磷挎菪闲划与hosts文件修改。在这里,我使用了1台Master和7台Slave,并记录了8台虚拟机对应的IP。将虚拟机名称和对应的IP写入所有节点机器(包括Master和Slave)的hosts文件,使用如下命令sudo gedit /etc/hosts

2、添加如图所示的内容并保存。

搭建 Hadoop 群集

3、补充说明:如果hosts文件中有“127.0.1.1 Ubuntu”行,则应该删除,因为前面已经修改了机器名,机器名已不再是“Ubuntu”,若不删除,在执行带有sudo的命令后,会得到内容为“unable to resolve host xxx”的警告提示。

MapReduce配置

1、分别配置$HADOOP_HOME/conf目录下的core-site.xml、hdfs-site.xml和mapred-site.xml文件

2、修改core-site.xml

搭建 Hadoop 群集

3、修改hdfs-site.xml

搭建 Hadoop 群集

4、修改mapred-site.xml

搭建 Hadoop 群集

Hadoop群集主从设置

1、主动设置即设置主节点和从节点,分别配置$HADOOP_HOME/conf目录下的masters和slaves文件

同步配置

1、Hadoop集群的所有机器的配置应该保持一致,因此在配置完master后,应将配置文件同步到集群的其它服务器

2、失败的方法:通过hadoop-env.sh同步

搭建 Hadoop 群集

3、注意这是失败的方法

搭建 Hadoop 群集

4、成功的方法:使用scp命令

5、在机器Master的终端中,依次执行下列7行命令同步MapReduce设置

搭建 Hadoop 群集

同步时间

1、在大部分网络教程中没有看到这一步,但我还是将群集中所有的节点的系统时间逐一与网络同步,从而方便查看不同节点上Hadoop的日志并对比。

Hadoop群集启动与关闭

1、HDFS的状态

搭建 Hadoop 群集

2、MapReduce的状态

搭建 Hadoop 群集
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
相关推荐
  • 阅读量:37
  • 阅读量:40
  • 阅读量:53
  • 阅读量:74
  • 阅读量:62
  • 猜你喜欢