精品Xx大数据大学实验室采购参数明细
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Xx大数据大学实验室采购参数明细
拟购设备名称基本参数数量单位
1 统计大数据综
合实验平台(含
承载服务器)
1.集成统计大数据实验系统套件,可用于部署实验室,实验室部署采用私有云架构,不以提
供账号密码的形式访问校外公有云实验环境,所有软硬件及课程资源、项目安装部署在本地;
并支撑以下课程教学:
1.1、数据库类:支撑RAC(Real Applications Clusters)实验和DG(Data Guard)实验
1.2、操作系统类-Linux、solaris实验
*1.3、大数据类-大数据开发和大数据运维实验。
2.集成统计大数据软件集群用于教学(授权期限为三年),核心软件列表如下:
*2.1基于云的数据库(数据库市场最广泛使用的关系型商业数据库)
2.2、数据库企业管理(包含Data Guard和Real Applications Clusters技术)
*2.3、大数据数据库(NoSQL Database企业版)
2.4、大数据可视化软件(Big Data Spatial and Graph 、R语言企业版、Big Data Discovery)
2.5、云应用产品(Cloud Management Pack for Database)
2.6、Java 开发环境(JavaEE 8开发平台)
2.7、zookeeper服务
2.8、Namenode服务
2.9、secondarynamenode hadoop-httpfs服务
2.10、master regionserver thrift服务
2.11、metastore hive-server2服务
2.12、Hue服务
2.13、impala-server catalog state-store服务
2.14、kafka-server服务
2.15、oozie服务
2.16、solr-server服务
8 套
2.17、bdsg服务
2.18、sqoop2-server服务
2.19、esourcemanager nodemanager history-serve服务
*2.1-2.19演示服务的管理界面,支持一键服务的启动和停止。
3.嵌入实验包,包括74个大数据相关实验包,包括实验数据和上机实验指导手册。
3.1、Linux操作系统实验10个
3.1.1、Linux简介安装、
3.1.2、Linux基础命令1、
3.1.3、Linux基础命令2、
3.1.4、Linux用户和权限管理软件包安装、
3.1.5、Linux磁盘管理、日志管理、进程管理、服务管理、任务计划
3.1.6、Linux的dhcp服务,pxe网络装机、samba服务,vsfptd服务,apache服务、Tomcat 服务、
3.1.7、Linux中的ssh远程管理、rsync远程同步、selinux、
3.1.8、Linux基本的网络配置、
3.1.9、Linux中的shell、
3.1.10、Linux的计划任务.
3.2、大数据概论与应用技术9个
3.2.1、Hadoop 伪分布搭建、
3.2.2、hadoop命令及集群远程作业提交与执行、
3.2.3、hadoop wordcount编程、
*3.2.4、去重编程、
*3.2.5、数据排序、
3.2.6、平均成绩、
3.2.7、单表关联、
3.2.8、多表关联、
3.2.9、倒排序
3.3分布式数据库19个
3.3.1、Oracle NoSQL database测验题、
3.3.2、使用KVLite、
*3.3.3、使用API访问KVStore和表、
*3.3.4、使用javaAPI向KVStore写入数据、
3.3.5、使用键值模型API对数据进行增改查操作、
3.3.6、配置一致性策略、
3.3.7、配置持久性策略、
3.3.8、创建并执行事务、
3.3.9、大对象的创建、查询、
3.3.10、Hive的安装部署、
3.3.11、SQL基本操作、
3.3.12、HiveQL基本操作、
3.3.13、HiveQL复杂查询、
3.3.14、视图和索引、
3.3.15、 HBase环境搭建实验、
3.3.16、HBase基础API CRUD操作实验、
3.3.17、HBase过滤器实验、
3.3.18、Nutch+Hbase搭建爬虫环境、
3.3.19、HBase API提取页面关键字、关键字检索
3.4离线分析技术13个,
3.4.1、Python 变量、运算符、逻辑判断
3.4.2、Python 循环、函数、运算符、逻辑判断
3.4.3、Python 面向对象编程、IO
3.4.4、Spark 常用操作、交互式编程、RDD弹性分布式数据集操作
3.4.5、Spark SQL 练习
3.4.6、Spark
*3.4.7、回归算法应用
*3.4.8、分类算法应用
3.4.9、聚类算法应用
3.4.10、协同过滤算法应用
3.5 R语言类实验10个
3.5.1、数据的存取和编辑-获取数据
3.5.2、统计检验
3.5.3、回归模型-简单线性回归模型
3.5.4、回归模型-机器学习算法
3.5.5、回归模型-其他模型
3.5.6、分类模型
3.5.7、机器学习-关联规则
3.5.8、机器学习-聚类
*3.5.9、RHadoop搭建
*3.5.10、RHadoop编程
3.6基于云的数据库(数据库市场最广泛使用的关系型商业数据库)的实验,不少于12个,要求该试验在教育行业正版授权环境下运行。
*3.6.1、安装NoSQL数据库
3.6.2、配置迁移节点
3.6.3、配置、部署3x2KVStore
3.6.4、修改KVStore增加Earnback应用读写数据的吞吐量
3.6.5、NoSQL数据库安装的故障排除
*3.6.6、NoSQL设计Email应用的数据模型
3.6.7、NoSQL数据库常用命令