Centos8系统搭建hadoop2.7.3伪分布式环境


存一下原博地址:https://blog.51cto.com/u_12749768/2739971

记录搭建hadoop2.7伪分布环境时遇到的问题和答案:

1,单机模式和伪分布模式、全分布模式的区别:

单机模式:是Hadoop安装后的默认模式。这种模式在一台单机上运行,没有用HDFS,也不加载任何hadoop的守护进程,该模式主要用于开发调试MapReduce程序的应用逻辑。

伪分布模式:也是在一台单机上运行,但用不同的Java进程模仿分布式运行中的各类结点。伪分布模式在“单节点集群”上运行hadoop,其中所有的守护进程都运行在同一台机器上。该模式在单机模式的基础上增加了代码的调试功能,允许你检查内存使用情况、HDFS输入输出,以及其他的守护进程交互。

全分布模式:hadoop守护进程运行在一个机器上。

2,搭建hadoop伪分布环境需要修改hadoop2.7/etc/hadoop下三个配置文件,分别是

vim hadoop-env.sh  (配置jdk路径)

export JAVA_HOME="/usr/java/jdk1.8.0_144"

vim hdfs-site.xml  (修改数据副本数)


    
        dfs.replication
        1
    

vim core-site.xml  

(fs.defaultFS:描述集群中NameNode结点的URI(包括协议、主机名称、端口号)、

hadoop.tmp.dir:是Hadoop文件系统依赖的基础配置,很多路径都依赖它。它默认在/tmp/{$suer}下面,但是在/tmp路径的存储是不安全的,因为Linux一次重启,文件就可能被删除,所以这里要重新配置)


    
        fs.defaultFS
        hdfs://localhost:9000
    
    
        hadoop.tmp.dir
        /usr/hadoop/hadoop/hadoop-tmp