决策树实验指导书-R
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
决策树实验指导书
实验目的:
1掌握利用R进行决策树的基本步骤
2更深入理解决策树的应用
实验内容:
说明:本实验采用iris数据集,下面中的数据集如无上下文说明,即是指iris
iris以鸢尾花的特征作为数据来源,数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性,是在数据挖掘、数据分类中非常常用的测试集、训练集。
四个属性分别为:花萼长度、花萼宽带、花瓣长度、花瓣宽度
三类分别为:setosa, versicolor, virginica(山鸢尾、变色鸢尾和维吉尼亚鸢尾)
1、加载rpart包
("rpart")
2、构建决策树,并解释rpart中三个参数的含义
= rpart(Species~., iris, method=“class”)
3、画出决策树
plot, uniform=T, branch=0, margin=, main="
Classification Tree\nIris Species by Petal and Sepal Length")iris
.
4、添加决策树的标签
text, =T, fancy=T, col="blue")
5、根据命令table(iris$Species)给出的结果,解释决策树的分类结果
6、用决策树进行预测
生成训练集=iris[2*(1:75)-1,]
生成测试集= iris[2*(1:75),]
=rpart(Species~., , method=“class”)
=predict, [,-5], type="class")
7、查看预测结果并对结果进行分析,计算出该决策树的accuracy(分类正确的样本数除以总样本数)
table[,5],
(25+24+22)/75=