判别分析案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

λ统计量在0-1之间。 越接近0组间差异越 显著;越接近1组间
差异越不显著。
说明在3类企业间, 各变量均有显著差异
A
24
结果分析
各组协方差阵 相等的检验
T est R esults
Box's M F
Approx. df1 df2 Sig.
207. 17 5 2.498 72
21089.679 .000
SPSS实现——数据编辑
Variable View → “Group”变量Decimals:“2” → “0”; Label:添加变量名称,便于识别; “Group”变量Value:添加组别。
A
13
SPSS实现——数据分析
Analyze → Classify → Discriminant
A
14
SPSS实现——模块介绍
A
15
SPSS实现——选择变量的方法
两种变量选择方法
自变量同时 进入方程
逐步 判别法
A
16
SPSS实现——变量选择
group 选入分组变量
is-cs 选入自变量
选择自变量
同时进入方程 的方法
A
17
SPSS实现——Statistics模块
Descriptives:描述性统计量。
Means:均数估计。 Univariate ANOVAs:单变量方差分析。 Box’s M:组间协方差齐性检验。
Fisher’s:Fisher函数系数——Bayes判别函数系数。 Unstandardized:非标准化函数A 系数——Fisher判别函数系数18。
SPSS实现——Statistics模块
选择Means 进行均数估计
选择ANOVAs进行 各组均值相等检验
选择Box’s M 进行各组协方 差阵相等检验
A
10
group 表示类别
数据展示
8个用来建立 判别标准的变量
•该数据disc.sav共有90个样本,其中30个属于
上升型,30个属于稳定性,30属于下降型。这
个已知类别的数据称为一个“训练样本”。
A
11
SPSS实现——数据读入
File → Open → Data → “Disc.sav”
A
12
A
7
大纲
disc.sav, disc.txt
SPSS 实现
数据 介绍
结果 分析
R语言 实现
A
8
数据介绍——disc.sav
• 数据来源:吴喜之——《统计学:从数据到 结论》。
• 数据介绍:某专家编出一套打分体系来描绘 企业的状况。该体系对每个企业的一些指标 (变量)进行评分。共有8个指标,如下页 表格所示。
25
结果分析——Fisher判别法
S ta ndar di zed Ca noni ca l D is cr im inant Func ti on Coeffici ents
企业规模 服务 雇员工资比例 利润增长 市场份额 市场份额增长 流动资金比例 资金周转速度
Function 1
.415 .433 .365 - .334 .457 - .355 - .019 - .435
A
6
逐步判别法
• 逐步判别法就是在前面的方法中加入变量选 择功能。有时,一些变量对于判别没有什么 作用,为了得到对判别最合适的变量,可以 使用逐步判别。
• 逐步判别的思想是先用少数变量进行判别, 然后一边判别,一边引进判别能力最强的变 量,同时淘汰判别能力不强的的变量。
• 主要利用一些检验来判断变量的判别能力。
Use Covariance Matrix:使用协方差阵。
Within-groups:组内协方差阵。
Separate-groups:各组协方差阵。
A
20
SPSS实现——Classify模块
Plots:判别图。
Combined-groups:各类共同输出在一幅散点图中。
Separate-groups:每类单独输出一幅散点图。
Matrices:矩阵
Within-groups correlation:合并组内相关阵。 Within-groups covariance:合并组内协方差阵。 Separate-groups covariance:各组协方差阵。 Total covariance:总协方差阵。
Function Coefficients:函数系数。
• 距离判别法的不足之处:
①判别方法与总体各自出现的的概率大小无 关;
②判别方法与错判之后所造成的损失无关。
A
4
Fisher判别法
• 所谓Fisher判别法,就是一种先投影的方 法,把高维空间中的点向低维空间进行投 影。
• 主要思想是通过将多维数据投影到某个合 适的方向上。而投影的原则是将总体与总 体之间尽可能的分开,然后选择合适的判 别规则,进行分类判别。
Territorial map:分类区域图。
Replace missing values with mean:用均数替代缺失值。
选择以样本量百 分比为先验概率
类别显示在 同一散点图中
显示每个单位判别 分析后所属类别
显示判别符合率表
以剔出某观察单位所建立的判别函数判别该观察单位所属类别
A
21
SPSS实现——Save模块
Casewise result:每个观察单位判别分析后所属类别。
Limit cases to first []:前若干观察单位判别分析后所属类别。
Summary table:判别符合率表。
Leave-one-out classification:以剔出某观察单位所建立的判别 函数判别该观察单位所属类别。
A
22
结果分析
• 在判别分析主对话框中点击“OK”,生成 输出output文件。
An aly sis Case Processing Summary
90个变量100%读 入,没有缺失值
Unweighted Cases Valid
Excluded Missing or out-of-range group codes
At least one missing discriminating variable
Both missing or out-of-range group codes and at least one missing discriminating variable
To tal
To tal
N
Percent
Use stepwise method:逐步判别法。按自变量贡献大小, 逐个引入和剔出变量,直到没有新的有显著作用的自变量 可以引入,也没有无显著作用的自变量可以从方程内删除 为止。选此项后,激活Method按钮。
Select Variable:挑选观察单位。框内选入变量后(不能选 入分类变量和自变量中已选入的变量),Value按钮被激 活,填入数值。自己符合该数值的的观察单位才参与判别 分析;若不选此项,则所有观察单位都参与判别分析。
• 有一些企业已经被某杂志划分为上升企业、 稳定企业和下降企业。我们希望根据这些企
业的上述变量的打分和它们已知的类别,找 出分类标准,并对没分类的企业进行分类。
A
9
变量描述
变量名称 group
is se sa prr ms msr cp cs
涵义描述 表示类别。group-1代表上升,group-2代表稳 定,group-3代表下降。 表示企业规模。 表示服务。 表示雇员工资比例。 表示利润增长。 表示市场份额。 表示市场份额增长。 表示流动资金比例。 表示资金周转速度。
A
26
结果分析——Fisher判别法
Structu re Matrix
Function
雇员工资比例 企业规模 服务 资金周转速度 市场份额 流动资金比例 市Biblioteka Baidu份额增长 利润增长
1 .413* .400* .381* -.332* .329* -.217* -.311 -.326
2 .343 -.007 .068 -.314 .219 .146 .618* .499*
Grouping Variable:选入分类变量“Group”,Define Range 被激活。点击弹出Range对话框,分别输入分类变量最小 值和最大值,本例为“1”和“3”。
Independents:选入自变量。本例选入变量“is—cs”。
Enter independents together:所有自变量同时进入方程。
Pooled within-groups corr elations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within fun ction.
2 .065 .127 .426 .541 .369 .634 .285 - .193
标准化典型 判别函数系数
需要注意的是:这是标准化 后的判别函数,若要将变量 带入计算判别分,必须将变 量进行标准化处理(即减均 值除以标准差)。
➢得到2个标准化典型判别方程:
y 1 0 . 4 x 1 0 . 1 4 x 2 0 5 . 3 3 x 3 0 3 . 6 3 x 4 0 5 . 3 4 x 5 0 4 . 5 3 x 6 0 7 . 5 0 x 7 0 5 . 1 4 x 8 9 3 y 2 0 . 0 x 1 0 . 6 1 x 2 0 5 2 . 4 x 3 0 7 . 2 5 x 4 0 6 . 4 3 x 5 0 1 . 6 6 x 6 0 9 . 3 2 x 7 0 4 . 8 1 x 8 5 9
利润增长
.256 126.415
市场份额
.256 126.148
市场份额增长 .271 117.063
流动资金比例 .441 55.040
资金周转速度 .252 128.913
d f1 2 2 2 2 2 2 2 2
d f2 87 87 87 87 87 87 87 87
Sig . .000 .000 .000 .000 .000 .000 .000 .000
公司
徽标
多元统计分析——判别分析
统计 研一 苏旸 2007100196
A
1
判别分析——把对象归到已知类中
• 人们常说: ——“像诸葛亮那么神机妙算” ——“像泰山那么稳固” ——“像钻石那么坚硬”
• 一些判别标准都是有原型的,虽然这些判 别的标准并不那么精确或严格,但大都是 根据一些现有的模型得到的。
生成Bayes判别方程系数 和Fisher判别方程系数。
A
19
SPSS实现——Classify模块
Prior Probabilities:设定先验概率。
All groups equal:各组等概率。
Compute from group sizes:各组样本量的百分比为先验概率。
Display:输出。
Tests null hypothesis of equal population covariance matrices.
说明拒绝协方差矩 阵相等的假设,即 不能认为各组间协 方差矩阵相等。
A
从一些统计实践的结 果来看,很少有碰到 检验不显著的情况。 而在一些实践中,比 如线性判别分析,即 使方差-协方差结构 不相等,对于结果的 影响也不会有非常大 的影响。
90
100.0
0
.0
0
.0
0
.0
0
.0
90
100.0
A
23
结果分析
各自变量的方差分 析及λ统计量
Te s ts o f Eq uality o f G ro up M e ans
Wilks ' Lambda F
企业规模
.190 185.828
服务
.205 168.241
雇员工资比例 .179 199.700
A
5
Bayes判别法
• 当每个分类的观察值不同时,最好用Bayes 判别。因为每个分类的观察值不同时,每类 出现的机会是不同的,而Fisher判别法忽视 了这个问题。
• 具体方法是:对每一个样品先计算出判别分 数D,然后根据先验概率和D的条件概率, 计算出该样品被判为每一类的后验概率,哪 类的后验概率最大,则判为哪一类。
Save:存为新变量。
Predicted group membership:预测观察单位所属类别。 Discriminant scores:判别分。 Probabilities of group membership:观察单位属于某一类
的概率。
在数据中 保存判别后 数据所属类别
在数据中保存 数据的判别分
A
2
判别分析的方法
• 距离判别法 • Fisher判别法 • Bayes判别法 • 逐步判别法
A
3
距离判别法
• 假设有两个总体G1和G2, 如果能够定义点x 到它们的距离D(x,G1)和D(x,G2), 则
①如果D(x,G1) < D(x,G2),则 x∈G1 ②如果D(x,G2) < D(x,G1),则 x∈G2 ③如果D(x,G1) = D(x,G2),则待判。
相关文档
最新文档