R语言判别分析实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
R语言判别分析实验报
告
GE GROUP system office room 【GEIHUA16H-GEIHUA GEIHUA8Q8-
R语言判别分析实验报告
班级:应数1201
学号:
姓名:麦琼辉
时间:2014年11月28号
1 实验目的及要求
1)了解判别分析的目的和意义;
2)熟悉R语言中有关判别分析的算法基础。
2 实验设备(环境)及要求
个人计算机一台,装有R语言以及RStudio并且带有MASS包。
3 实验内容
企业财务状况的判别分析
4 实验主要步骤
1)数据管理:实验对21个破产的企业收集它们在前两年的财务数据,对25个财
务良好的企业也收集同一时期的数据。数据涉及四个变量:CF_TD(现金/总债务);NI_TA(净收入/总资产);CA_CL(流动资产/流动债务);CA_NS(流动资产/净销售额),一个分组变量:企业现状(1:非破产企业,2:破产企业)。
2)调入数据:对数据复制,然后在RStudio编辑器中执行如下命令。
case5=read.table(‘clipboard’,head=T)
head(case5)
3)Fisher判别效果(等方差,线性判别lda):采用Bayes方式,即先验概率为
样本例数,相关的RStudio程序命令如下所示。
library(MASS)
ld=lda(G~.,data=case5);ld #线性判别
ZId=predict(ld)
addmargins(table(case5$G,ZId$class))
4)Fisher判别效果(异方差,非线性判别--二次判别qda):再次采用Bayes方
式,相关的RStudio程序命令如下所示。
library(MASS)
qd=qda(G~.,data=case5);qd #二次判别
Zqd=predict(qd)
addmargins(table(case5$G,Zqd$class))
5 实验结果
表1 线性判别lda效果
原分类新分类
1 2 合计
124125
231821
合计271946
符合率91.30%
表2 二次判别qda效果
新分类
原分类
1 2 合计
124125
221921
由表1和表2可知,qda (二次判别---非线性判别)的效
果比lda (一次判别)要好。 6 实验小结
通过本次实验了解了判别分析的目的和意义,并熟悉
R 语言中有关判别分析的算法基础。
合计 26 20 46 符合率 93.50%