![大数据技术与应用](https://wfqqreader-1252317822.image.myqcloud.com/cover/689/33643689/b_33643689.jpg)
3.5 实训1 Hadoop搭建
1.实训目的
掌握Hadoop平台的安装和配置。
2.实训内容
搭建Hadoop平台的第一步,就是根据实际情况选择最合适的Hadoop版本。目前,由于Hadoop飞速发展,功能更新和错误修复在不断地迭代着,所以版本特别多,显得有些杂乱。结合功能和稳定性两方面,这里选择CDH5。该版本是目前生产环境中装机量较大的版本之一,涵盖了所有Hadoop版本的主要功能和模块,稳定且有很多有用的新特性。下载地址为https://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.6.0.tar.gz。
Hadoop的运行环境有以下两种。
● Windows。虽然Hadoop社区目前已经支持Windows,但由于Windows操作系统本身不适合作为服务器操作系统,因此本书不介绍Windows下Hadoop的安装方式。
● Linux。Hadoop的最佳运行环境无疑是开源操作系统Linux。Linux的发行版本众多,常见的有CentOS、Ubuntu、RedHat等。本书选择的就是CentOS。
(1)安装虚拟机
1)进入VMware安装向导,如图3-12所示,单击“下一步”按钮。
2)选择自定义安装,进入“自定义安装”界面,如图3-13所示,单击“下一步”按钮。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/65_01.jpg?sign=1739410978-93d4TKDy7JUB6oxu2gRHpjVcOw8mIBmU-0-a8f79a62e862fa0da5784f9c65217b43)
图3-12 VMware安装向导
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/65_02.jpg?sign=1739410978-e4tmESbr9AYIM5bt7Mci58gV5ZJPHICH-0-48087e83d7d0b1338a03e801f4dd969d)
图3-13 “自定义安装”界面
3)进入“用户体验设置”界面,设置用户体验,单击“下一步”按钮,如图3-14所示。
4)进入“快捷方式”界面,选择创建快捷方式的位置,单击“下一步”按钮,如图3-15所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/65_03.jpg?sign=1739410978-eDr7SXSgugUOiyWCknzBxwuDU6BCvoHE-0-a7fbca029805d2965bab430b42d60b88)
图3-14 “用户体验设置”界面
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/65_04.jpg?sign=1739410978-NeP5QQ8j1fNjVxY9nhRcpWJ51WoQDFHB-0-d6173c037fc9a3d462fa13dd4d95ed15)
图3-15 “快捷方式”界面
5)准备工作完成,单击“安装”按钮,开始安装,如图3-16所示。
6)在安装过程中不需要用户执行任何操作,如图3-17所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/66_01.jpg?sign=1739410978-HVk2rQf35kQ66emyRg6IhL50DhbS7nNZ-0-c8c29f8f26851667fec30973ca0e76ae)
图3-16 开始安装
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/66_02.jpg?sign=1739410978-PYnclTYAgDp3eU7FPCkB28Yqh47x4rt5-0-77132a581843933f80322371c456ea14)
图3-17 安装过程
7)单击“完成”按钮,退出安装向导,安装完成,如图3-18所示。
(2)新建虚拟机并安装CentOS
1)选择“自定义(高级)”单选按钮,进入新建虚拟机向导,单击“下一步”按钮,如图3-19所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/66_03.jpg?sign=1739410978-17Pb6I6UfDSrrkEEbfmDCtOjggkWjXZC-0-491d8538df4dd2c20172d663ba50896a)
图3-18 安装完成
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/66_04.jpg?sign=1739410978-OvUQ3OAKKn1QBWJQi2024muhVMTrPZzK-0-bc02edbcccb5950939976a2b459b0683)
图3-19 新建虚拟机向导
2)选择虚拟机硬件兼容性,单击“下一步”按钮,如图3-20所示。
3)安装客户机操作系统,单击“下一步”按钮,如图3-21所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/66_05.jpg?sign=1739410978-VqBIhOtpcD1rWlUAd1KZvDHAGKsXZWk0-0-b0c31cf24bb9cb5f0ac0bb2dc717f86b)
图3-20 选择虚拟机硬件兼容性
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/66_06.jpg?sign=1739410978-pU9GlMQuCnuvjjE0bEIXZwPJzX740WGn-0-7e0dc0690e89afa6f23763ce2a8c3f62)
图3-21 安装客户机操作系统
4)设置安装信息,单击“下一步”按钮,如图3-22所示。
5)命名虚拟机为“hadoop”,并选择安装位置,单击“下一步”按钮,如图3-23所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/67_01.jpg?sign=1739410978-iUanOpGRdEtsfdPqjqjN5yLIED84Doou-0-216e5ea6177b4d7c689f3b9ba175bb57)
图3-22 设置安装信息
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/67_02.jpg?sign=1739410978-bEIDgcMry3TGcRXG8PabfMpCl7JudzBr-0-1a2f1298a39c758ae932c12f1535cb72)
图3-23 命名虚拟机
6)配置处理器参数,单击“下一步”按钮,如图3-24所示。
7)给虚拟机分配内存,单击“下一步”按钮,如图3-25所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/67_03.jpg?sign=1739410978-JqtftekhTmFksjUJSKmQiLe2DuE9ZNBF-0-cc72c7c209c2004567729f882380307f)
图3-24 配置处理器
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/67_04.jpg?sign=1739410978-MMFJbEVZNxEvBLji7lb8sq4bT0AkEGg3-0-95e883fc81bbfbb827f50d4d6cd7879a)
图3-25 设置虚拟机内存
8)选择“使用网络地址转换(NAT)”单选按钮,为虚拟机添加网络,单击“下一步”按钮,如图3-26所示。
9)选择“LSI Logic(L)(推荐)”单选按钮,设置I/O控制器类型,单击“下一步”按钮,如图3-27所示。
10)选择“SCSI(S)(推荐)”单选按钮,设置磁盘类型,单击“下一步”按钮,如图3-28所示。
11)选择“创建新虚拟磁盘”单选按钮,单击“下一步”按钮,如图3-29所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/68_01.jpg?sign=1739410978-pCsrmVgdObP2hc94yK2SznsNfDFLKGKw-0-ab03987b1df4f1293895b71353150ec3)
图3-26 选择网络类型
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/68_02.jpg?sign=1739410978-tlxkKsXgApKz3ois85H7FFfuDJAo8jy6-0-ded3617ab8a87e7b9ea8accac729d326)
图3-27 选择I/O控制器类型
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/68_03.jpg?sign=1739410978-QREyGhoMJGZ7sADCdxdvJ9UT992rH7Hc-0-6fa2a80d09896bbf78e2e379ac4a1c8b)
图3-28 选择磁盘类型
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/68_04.jpg?sign=1739410978-eyTBfPTm3zurP1afzUpPG4DBCGT66TUi-0-d4fa7db47ca1c949f3e309c8f2239849)
图3-29 选择磁盘
12)设置“最大磁盘大小”为20GB,单击“下一步”按钮,如图3-30所示。
13)选择磁盘文件存储位置,单击“下一步”按钮,如图3-31所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/68_05.jpg?sign=1739410978-IbMyDVhn2bIR7wvhMjz1GlOBnsrVmbd3-0-c45e02b73cb9fe99b4c70101e21b130e)
图3-30 指定磁盘容量
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/68_06.jpg?sign=1739410978-nvcKNiMnQQDcU37fKCmcgWCsu4cCMKTa-0-4b839eed2dcf0afeb567ff4fcbe41a5c)
图3-31 指定磁盘文件存储位置
14)单击“完成”按钮,虚拟机创建结束,如图3-32所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/69_01.jpg?sign=1739410978-dd0B60NUACwOIa6uPD4onoWOede4nxMq-0-fb5ededfa73619e75c9eb4e197976f82)
图3-32 创建完成
15)安装完成后,可以看到前面创建的hadoop虚拟机,设置用户名为“root”,如图3-33所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/69_02.jpg?sign=1739410978-VpdSsWke1BQyYdsZVmgDFEAQL1l97jvG-0-9b6f50dec46794482c453b8c5dfc5339)
图3-33 设置用户名
(3)配置CentOS网卡
1)执行“vi/etc/sysconfig/network-scripts/ifcfg-eth0”命令编辑ifcfg-eth0网卡,如图3-34所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/70_01.jpg?sign=1739410978-L7AkOIIrOwgQ5xlE1oTKFKkOikUOSN7P-0-2d6cf0fd3cadc54cd4863ee62547303a)
图3-34 输入编辑网卡命令
2)在该网卡内修改其IP地址、子网掩码及网关,如图3-35所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/70_02.jpg?sign=1739410978-rHZb9a9YSuBgOtJwNudr76f9xc888JHv-0-5cea02e57df3e93fd3c41f64bdaf7b9c)
图3-35 设置IP地址
3)修改完成后,执行“service network restart”命令重启网卡,如图3-36所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/71_01.jpg?sign=1739410978-zHziqcFCfHoQ4OUz9xn835SADIxFrjrV-0-1702100e1a38d6b85df8355af97c12e9)
图3-36 重启网卡
4)重启后,执行“ifconfig”命令查看网卡相关信息,如图3-37所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/71_02.jpg?sign=1739410978-40EbMfIC3yoLcPK7qQYivhxWoyFaoCoS-0-5f31d057ed28b548978e3c9ee8300697)
图3-37 查看网卡信息
5)执行“vi/etc/system/network”命令编辑network文件,如图3-38所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/72_01.jpg?sign=1739410978-U2wLgWeXZRMEOC2GkXTB6Kr5n06G62um-0-e4a0ec8a6a874368ada60f2875ddeaf7)
图3-38 输入编辑文件命令
6)进入CentOS系统名称修改界面,修改系统名称(HOSTNAME)为“hadoop”,如图3-39所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/72_02.jpg?sign=1739410978-d8JG6FwYs1c3Q9ZnOCnpcCxvp7svW8TX-0-aa09fb8b909fd8d29b274d801585cf9b)
图3-39 修改系统名称
7)设置完成后,执行“reboot”命令重启虚拟机,如图3-40所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/73_01.jpg?sign=1739410978-RCd9nKJsfciiouS76WKjngzTnG8lnSPn-0-7248af3be4599abfe890e6518293517e)
图3-40 重启虚拟机
8)执行“vi/etc/host”命令编辑hosts文件,如图3-41所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/73_02.jpg?sign=1739410978-vD0WhuwLiCFssdETDDC4CmlESkQX112Y-0-ec93d1cc045cddd64e3444edffbfc846)
图3-41 输入编辑文件命令
9)进入绑定IP地址与主机名界面,输入要绑定的IP地址与主机名,如图3-42所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/74_01.jpg?sign=1739410978-Oo0N6PbH7AfY3IvjWjA4hjmsJtohJHZ0-0-c7f245a0c5f7cd7545163cec3fc69fb1)
图3-42 输入要绑定的IP地址与主机名
(4)配置ssh无密码连接
1)执行“ssh-keygen”命令生成公钥。生成公钥后执行“ssh-copy-id 192.168.137.10”命令,将其转发至本机的authorized_keys列表,如图3-43所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/74_02.jpg?sign=1739410978-aWmqMWqzTpEQ4JFdJG2jrPzGG0M1R6wi-0-008bb1f626ad00e509bffc294793bde7)
图3-43 生成公钥并转发
2)使用SecureCRT工具上传JDK安装包至hadoop主机,为下一步安装JDK做准备,如图3-44所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/75_01.jpg?sign=1739410978-WqbHLN7BemAd1TjuRxMamrxTvTS3o01y-0-c7bee1e3c47781c6fb7e4c8d696d5040)
图3-44 上传JDK安装包
(5)安装JDK与Hadoop环境
1)使用tar命令解压JDK安装包,如图3-45所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/75_02.jpg?sign=1739410978-MBI8LRsFS6jFTPajhYw4h2l0wAvSYlKD-0-03714581042856fcb8e896d7ec5e8df4)
图3-45 解压JDK安装包
2)执行“vi/etc/profile”命令编辑profile文件,配置JDK环境变量,如JAVA_HOME和PATH,如图3-46所示。
3)执行“source/etc/profile”命令使profile文件立即生效,如图3-47所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/76_01.jpg?sign=1739410978-Y1nUBDnTGKKEZrRB56dca6LjP9aw6NkU-0-0ab1476d43ebf6deb1ea9c6f709f8adf)
图3-46 配置JDK环境变量
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/76_02.jpg?sign=1739410978-gUUyvnQz6u9uihIlB3Q6THHKodap86Dw-0-13b627cfa1fa0166e36a172d92c062f5)
图3-47 使profile文件生效
4)执行“java-version”命令查看JDK安装结果,能看到已经安装成功,如图3-48所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/76_03.jpg?sign=1739410978-y5HbABmeJ8SXVr3M6FD1Vvl4rbSomauB-0-83c36e82b9ce7bd7a2e98178e4b35f07)
图3-48 查看JDK安装结果
5)上传Hadoop安装包文件至虚拟机,如图3-49所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/77_01.jpg?sign=1739410978-GCY4IIRvgnOCgkm7eH3PNShigs2mS9rR-0-49557c5025490469f678baa5c606fbd4)
图3-49 上传Hadoop安装包
6)使用tar命令解压Hadoop安装包,如图3-50所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/77_02.jpg?sign=1739410978-XqBYYV2dvCqgkHj8xnl3k9HHgGZBOrz3-0-700927d726f76f7af1124be7d0479ca8)
图3-50 解压Hadoop安装包
7)使用mv命令将解压后的Hadoop安装文件从上传目录移动至opt目录下,如图3-51所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/77_03.jpg?sign=1739410978-icqofasZK12PwRfZPknhKWnti8usLFde-0-b8936986d375bec737b773ae1bc330d2)
图3-51 移动Hadoop安装文件
8)执行“vi/etc/profile”命令编辑profile文件,为Hadoop配置环境变量,如图3-52所示。执行“source/etc/profile”命令使profile文件立即生效。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/78_01.jpg?sign=1739410978-5s7WVcloM1BHVzG7ku8BPxcp4pwVxMyO-0-6f8656113381698a693703f796f46f26)
图3-52 配置Hadoop环境变量
9)使用vi命令修改Hadoop配置文件,即hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml和slaves文件,如图3-53所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/78_02.jpg?sign=1739410978-LxJHaVg9AmcTSny95o7mzyQygMAwcX2T-0-759e4e6d523d6069ef1aca7955532919)
图3-53 修改Hadoop配置文件
① 修改hadoop-env.sh文件,在文件末尾追加环境变量语句。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/78_03.jpg?sign=1739410978-U9rWkeBecaGC9PvM09ZbgVix1ES3VYOP-0-1ac7fb8294fd9116b277eeebac86f43e)
② 修改core-site.xml文件,修改如下。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/78_04.jpg?sign=1739410978-2wiMVM433a6jUYtFVT6UrI6pPzSzSuaw-0-7c6bd2f2f92330aa31c384255be24bb0)
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/79_01.jpg?sign=1739410978-WePYAV08sZExwVM51rAKGFa3oV3zKya4-0-2dcef30db804fc376145ec290d236239)
③ 修改hdfs-site.xml文件,修改如下。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/79_02.jpg?sign=1739410978-BNa1UBJiNGIzwRJFs9bMow7svdHawOMt-0-3dadc96e615446444674a820d3dc88b5)
④ 修改mapred-site.xml文件,修改如下。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/79_03.jpg?sign=1739410978-5P18SxZVauBEHbleBkz38raArhuRhQYC-0-c894c8ad17f4297ed406182783acb08e)
⑤ 修改yarn-site.xml文件,修改如下。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/79_04.jpg?sign=1739410978-UT6eV753gFAaoznhbrzmuhkq0f2DIzPf-0-f869226090eff74b48cec0559d101a2b)
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/80_01.jpg?sign=1739410978-f66dyYfrrHm9ajZvxITRXaoY6PH7Db2g-0-a9841219015bc558a3b0cbbb6683a971)
⑥ 修改slaves文件,修改如下。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/80_02.jpg?sign=1739410978-QhSBz7fq8vBbDBCtXJzLZMYvY94chla3-0-0b09c8d0793a259a4341a4c5f1bebdac)
10)执行“hadoop namenode-format”命令格式化HDFS。最后执行“hadoop version”命令查看安装完成后的Hadoop,如图3-54所示。至此,Hadoop已经安装并配置完成。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/80_03.jpg?sign=1739410978-V2VtYi5CmsHQMJATWwZaWnOPPqd4SMZ0-0-ae6bb12e8b1e6daa878c42e7ef5ec407)
图3-54 查看Hadoop安装信息