判别分析案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
距离判别法的不足之处: ① 判别方法与总体各自出现的的概率大小无关; ② 判别方法与错判之后所造成的损失无关。
h
4
Fisher判别法
所谓Fisher判别法,就是一种先投影的方法,把高维空间中的点向低维空间进行投影。
主要思想是通过将多维数据投影到某个合适的方向上。而投影的原则是将总体与总体之间尽可能的分开 ,然后选择合适的判别规则,进行分类判别。
h
12
SPSS实现——数据编辑
Variable View → “Group”变量Decimals:“2” → “0”; Label:添加变量名称,便于识别; “Group”变量Value:添加组别。
h
13
SPSS实现——数据分析
Analyze → Classify → Discriminant
h
h
6
逐步判别法
逐步判别法就是在前面的方法中加入变量选择功能。有时,一些变量对于判别没有什么作用,为了得到对判 别最合适的变量,可以使用逐步判别。
逐步判别的思想是先用少数变量进行判别,然后一边判别,一边引进判别能力最强的变量,同时淘汰判别能 力不强的的变量。
主要利用一些检验来判断变量的判别能力。
距离判别法 Fisher判别法 Bayes判别法 逐步判别法
h
3
距离判别法
假设有两个总体G1和G2, 如果能够定义点x到它们的距离D(x,G1)和D(x,G2), 则 ① 如果D(x,G1) < D(x,G2),则 x∈G1 ② 如果D(x,G2) < D(x,G1),则 x∈G2 ③ 如果D(x,G1) = D(x,G2),则待判。
表示市场份额增长。
表示流动资金比例。
表示资金周转速度。
h
10
数gr据oup展示
表示类别
8个用来建立 判别标准的变量
•该数据disc.sav共有90个样本,其中30个属于上升型,30个属
于稳定性,30属于下降型。这个已知类别的数据称为一个“训
练样本”。
h
11
SPSS实现——数据读入 File → Open → Data → “Disc.sav”
Use stepwise method:逐步判别法。按自变量贡献大小,逐个引入和剔出变量, 直到没有新的有显著作用的自变量可以引入,也没有无显著作用的自变量可以 从方程内删除为止。选此项后,激活Method按钮。
Select Variable:挑选观察单位。框内选入变量后(不能选入分类变量和自变量 中已选入的变量),Value按钮被激活,填入数值。自己符合该数值的的观察单 位才参与判别分析;若不选此项,则所有观察单位都参与判别分析。
多元统计分析——判别分析
统计
h
研一
苏旸
2007100196
1
判别分析——把对象归到已知类中
人们常说: ——“像诸葛亮那么神机妙算” ——“像泰山那么稳固” ——“像钻石那么坚硬”
一些判别标准都是有原型的,虽然这些判别的标准并不那么精确或严格,但大都是根据一些现有的模型 得到的。
h
2
判别分析的方法
Univariate ANOVAs:单变量方差分析。
Box’s M:组间协方差齐性检验。
Matrices:矩阵
Within-groups correlation:合并组内相关阵。
Within-groups covariance:合并组内协方差阵。
Separate-groups covariance:各组协方差阵。
和它们已知的类别,找出分类标准,并对没分类的企业进行分类。
h
9
变量描述
变量名称 group
is se sa prr ms msr cp cs
涵义描述
表示类别。group-1代表上升,group-2代表稳定,group-3代表 下降。
表示企业规模。
表示服务。
表示雇员工资比例。
表示利润增长。
表示市场份额。
Total covariance:总协方差阵。
h
18
SPSS实现——Statistics模块
选择Means 进行均数估计
选择ANOVAs进行 各组均值相等检验
选择Box’s M 进行各组协方 差阵相等检验
生成Bayes判别方程系数和Fisher 判别方程系数。
h
19
SPSS实现——Classify模块
h
15
SPSS实现——选择变量的方法
两种变量选择方法
自变量同时 进入方程
逐步 判别法
h
16
SPSS实现——变量选择
group 选入分组变量
选择自变量 同时进入方程的方

is-cs 选入自变量
h
17
SPSS实现——Statistics模块
Descriptives:描述性统计量。
Means:均数估计。
14
SPSS实现——模块介绍
Grouping Variable:选入分类变量“Group”,Define Range被激活。点击弹出 Range对话框,分别输入分类变量最小值和最大值,本例为“1”和“3”。
Independents:选入自变量。本例选入变量“is—cs”。
Enter independents together:所有自变量同时进入方程。
h
5
Bayes判别法
当每个分类的观察值不同时,最好用Bayes判别。因为每个分类的观察值不同时,每类出现的机会是不同的 ,而Fisher判别法忽视了这个问题。
具体方法是:对每一个样品先计算出判别分数D,然后根据先验概率和D的条件概率,计算出该样品被判为 每一类的后验概率,哪 类的后验概率最大,则判为哪一类。
h
7
大纲
disc.sav, disc.txt
SPSS 实现
数据 介绍
结果 分析
R语言 实现
h
8
数据介绍——disc.sav
数据来源:吴喜之——《统计学:从数据到结论》。 数据介绍:某专家编出一套打分体系来描绘企业的状况。该体系对每个企业的一些指标(变量)进行评分。
共有8个指标,如下页表格所示。 有一些企业已经被某杂志划分为上升企业、稳定企业和下降企业。我们希望根据这些企业的上述变量的打分
Prior Probabilities:设定先验概率。
All groups equal:各组等概率。
Compute from group sizes:各组样本量的百分比为先验概率。
Display:输出。
Casewise result:每个观察单位判别分析后所属类别。
Limit cases to first []:前若干观察单位判别分析后所属wenku.baidu.com别。
相关文档
最新文档