决策树实验指导书-R

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

决策树实验指导书

实验目的:

1掌握利用R进行决策树的基本步骤

2更深入理解决策树的应用

实验内容:

说明:本实验采用iris数据集,下面中的数据集如无上下文说明,即是指iris

iris以鸢尾花的特征作为数据来源,数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性,是在数据挖掘、数据分类中非常常用的测试集、训练集。

四个属性分别为:花萼长度、花萼宽带、花瓣长度、花瓣宽度

三类分别为:setosa, versicolor, virginica(山鸢尾、变色鸢尾和维吉尼亚鸢尾)

1、加载rpart包

("rpart")

2、构建决策树,并解释rpart中三个参数的含义

= rpart(Species~., iris, method=“class”)

3、画出决策树

plot, uniform=T, branch=0, margin=, main="

Classification Tree\nIris Species by Petal and Sepal Length")iris

.

4、添加决策树的标签

text, =T, fancy=T, col="blue")

5、根据命令table(iris$Species)给出的结果,解释决策树的分类结果

6、用决策树进行预测

生成训练集=iris[2*(1:75)-1,]

生成测试集= iris[2*(1:75),]

=rpart(Species~., , method=“class”)

=predict, [,-5], type="class")

7、查看预测结果并对结果进行分析,计算出该决策树的accuracy(分类正确的样本数除以总样本数)

table[,5],

(25+24+22)/75=

相关文档
最新文档