大数据技术实验一平台搭建
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《大数据技术原理与应用》实验报告一
题目:安装Hadoop
姓名:高聪江班级:大数据1533 学号:2015005677 日期:2017.11.01 实验环境:
笔记本电脑一台
Archlinux虚拟机3台
Hadoop 2-7-10
Java 1-8-0
实验内容与完成情况:
下载相关软件已完成
安装虚拟机已完成
配置环境变量已完成
安装Hadoop 已完成
出现的问题:
01 虚拟机运行软件选择
02 虚拟机选择
03 虚拟机的分盘出现问题
04 虚拟机命令不被识别
05 Hadoop版本选择
06 Hadoop无法正常启动
07 结束安装后活节点数是0
解决方案(列出遇到的问题和解决办法,列出没有解决的问题):
01 虚拟机运行软件选择使用了VirtualBox
02 虚拟机选择使用了Archlinux
03 虚拟机的分盘出现问题再分了一次,成功解决
04 虚拟机命令不被识别系统的环境变量出现问题,修改配置文件解决
05 Hadoop版本选择选择了2-7-10这一比较广泛的版本Hadoop
06 Hadoop无法正常启动由于格式化节点的时候没有先把生成文件都删除
07 结束安装后活节点数是0 这个问题原因一直没有找到,重装解决的
报告正文
1.实验内容与步骤
本实验主要内容和步骤如下:
1.1.实验内容
Hadoop集群搭建(由于伪分布比较简单,所以实验报告描述集群搭建),WorldCount实例测试。
1.2.实验步骤
1>下载相关软件。主要是Java,VirtualBox,Hadoop安装包,虚拟机的镜像
文件。
2>安装ArchLinux虚拟机(由于此发行版本比较洁净,系统体积小,运
行比较流畅)
安装结果如图:
3>进行Hadoop集群安装
>>启用网络并安装SSH和JDK
>>配置SSH免密登录
>>配置JAVA环境变量
显示上图说明JAVA环境变量已经配置完成。>>安装Hadoop
安装结束如上图
>>配置Hadoop 环境变量
在~/.bashrc文件中添加如下内容:
保存并执行$ source ~/.bashrc使其生效。>>修改Hadoop 配置文件
进入cd /usr/local/hadoop/etc/hadoop/
修改core-site.xml为:
修改hdfs-site.xml为:
>>启动Hadoop
输入./bin/hdfs namenode -format来格式化
输入./sbin/start-dfs.sh 来启动守护进程
>>查看进程
输入JPS
>>进入网页查看状态
>4 WorldCount实例测试
<1创建用户目录。
<2将本地input 文件夹中的数据上传到HDFS的input文件夹中。<3运行命令来执行字数统计测试样例
查看最终结果
说明:第一页做封面,简要概述报告,正文部分详述实验内容,标题上的X 代表实验编号(实验几)