weka使用教程

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据导论实验报告

实验一

姓名abc

学号asadsdsa

报告日期

实验一

一.实验目的

1实验开源工具Weka的安装和熟悉;

2.数据理解,数据预处理的实验;

二.实验内容

1.weka介绍

2.数据理解

3.数据预处理

4.保存处理后的数据

三.实验过程

1.导入数据并修改选项

2.用weka.filters.unsupervised.attribute.ReplaceMissingValues处理缺失值

3.用weka.filters.unsupervised.attribute.Discretize离散化第一列数据

4.用weka.filters.unsupervised.instance.RemoveDuplicates删除重复数据

5.用weka.filters.unsupervised.attribute.Discretize离散化第六列数据

6.用weka.filters.unsupervised.attribute.Normalize归一化数据

7.保存数据

四.实验结果与分析

1.数据清理后的对比图,上面的是处理前的图,下图是处理后的图

分析:通过两图对比可发现图一中缺失的数据在图二中已经添加上。

2.离散化第一行后的对比图,图片为离散化之后的效果图

分析:此次处理目标为第一列,可发现处理后‘age’这一列的数据离散化了。

3.删除重复数据之后的效果图

5.离散化第六列后的效果图

分析:此次处理目标为第六列,可清楚看到发生的变化6.归一化后的效果图

此次处理的目标是10,12,13,14列,即将未离散化的数值列进行归一化处理。

相关文档
最新文档