判别分析的案例分PPT

合集下载

多元统计分析课件第六章-判别分析例题与操作过程可修改文字

多元统计分析课件第六章-判别分析例题与操作过程可修改文字

.
(一) 操作步骤 1. 在SPSS窗口中选择Analyze→Classify→Discriminate,调 出判别分析主界面,将左边的变量列表中的“group”变量选 入分组变量中,将—变量选入自变量中,并选择Enter independents together单选按钮,即使用所有自变量进行判 别分析。
1
5
50.06 23.03 2.83 23.74 112.52 63.3
1
6
33.24 6.24 1.18 22.9 160.01 65.4
2
7
32.22 4.22 1.06 20.7 124.7 68.7
2
8
41.15 10.08 2.32 32.84 172.06 65.85
2
9
53.04 25.74 4.06 34.87 152.03 63.5
由此表可知,两个Fisher判别函数分别为:
y1 74.99 1.861X1 1.656X 2 0.877 X3 0.798X 4 0.098X 5 1.579X 6 y2 29.482 0.867X1 1.155X 2 0.356X 3 0.089X 4 0.054X 5 0.69 X 6
判别分析例题
例1:设有两个正态总体 G1 和 G2 ,已知:
(1)
ห้องสมุดไป่ตู้
10 15
(2)
20 25
18 12 1=12 32
20 7
2
=
7
5
试用距离判别法判断:样品:
X
20 20
,应归属于哪一类
判别分析例题 解:比较X到两个总体的马氏距离的大小
所以X属于正态总体 G1
例2:

第五章 判别分析ppt课件

第五章 判别分析ppt课件

在经济学中,根据人均国民收入、人均消费水平、人均住房 面积等多种指标来判定一个国家的经济发展程度所属类型。
在考古学中,根据发掘出来的人类头盖骨的高、宽等特征来 判断其性别是男性还是女性。
在税务稽查中,要判断某纳税户是诚实户还是偷税户。
……
2008.8 休息一下
最新版整理ppt
统计学专业主干课程——多元统计分析
休息一下统计学专业主干课程多元统计分析20088精选1fisher判别函数和判别准则1fisher判别函数和判别准则休息一下统计学专业主干课程多元统计分析20088精选1fisher判别函数和判别准则1fisher判别函数和判别准则休息一下统计学专业主干课程多元统计分析20088精选1fisher判别函数和判别准则1fisher判别函数和判别准则542fisher判别函数和判别准则休息一下统计学专业主干课程多元统计分析20088精选休息一下统计学专业主干课程多元统计分析20088精选2应用实例2应用实例542fisher判别函数和判别准则休息一下统计学专业主干课程多元统计分析20088精选2应用实例2应用实例542fisher判别函数和判别准则休息一下统计学专业主干课程多元统计分析20088精选2应用实例2应用实例542fisher判别函数和判别准则休息一下统计学专业主干课程多元统计分析20088精选多元分析中有一个非常重要的思想方法就是采用降维技术把rp中的点通过适当方式投影到低维空间即用低维向量近似地替代p维向量然后在低维空间上在进行组的判别
本章的大部分内容是讨论两组判别分析。
2008.8 休息一下
最新版整理ppt
统计学专业主干课程——多元统计分析
5.1.3 判别分析的类型
2、按判别函数的形式分
按判别函数的形式(区分不同总体所用的数学模型)分, 有线性判别和非线性判别。

判别分析-实例-PPT

判别分析-实例-PPT
对光顾该商店的顾客进行n次观察。 设:n1组数据为购买者(A)
n2组数据为非购买者(B) 由已知变量X1,X2,将n1+n2=n组数据分成两大类; 购买者(A)—— X1i (A), X2i (A) (I=1,2,…,n1)
非购买者(B)—— X1 j (B), X2 j (B) (j=1,2,…,n2)
例:样本A,舒张血压为75mmHg,血浆胆固醇为150mg%, 分别代入方程后
G1=1.12364*75+0.21222*150-72.60310=43.5029
G2=0.94031*75+0.16755*150-49.34373=46.31202
由于G1小于G2,所以样本A判为正常人组(G=2)。
大家好
19
6、计算判别指标
y 1
C1
X
1
1
C2
X
1
2
C3
X
1
3
0.216928.29 0.01820 6.42 0.05604 6.00
2.251533
y 2
C1
X
2
1
C2
X
2
2
C3
X
2
3
0.21692 3.20 0.01820 3.80 0.05604 4.00
0.987464
判别指标为
大家好
35
大家好
36
大家好
37
大家好 待判样品
38
大家好
39
大家好
40
大家好
41
大家好
42
大家好
43
大家好
44
大家好
45
大家好
46

判别分析的案例分 ppt课件

判别分析的案例分 ppt课件
Step5:单击“Classify”按钮,在“Plot”选项组中选择 “Combined-groups”选项,在“Display”选项组中选择“Cas
ewise result”和“Summmary table”选项;单击“Continue”按 钮,返回主对话框。
Step6:单击“Save”按钮,在弹出的对话框中选择“Pred icted group membership”选项,单击“Continue”按钮,返回 主对话框。
Mean
Std. Deviation
Valid N (listwise)
组别 1.00
2.00
Total
舒张压 胆固醇 舒张压 胆固醇 舒张压 胆固醇
Unweighted 12.3794 4.6931 10.6267 3.7687 11.5313
4.2458
Weighted 1.64999 1.29614 1.13528 .85021 1.65996
1.18231
Unweighted 16 16 15 15 31
31
Weighted 16.000 16.000 15.000 15.000 31.000 31.000
3、典型判别函数的特征函数的特征值表 表1.4所示是典型判别函数的特征值表,其特征(Eigen
value)为组间平方和与组内平方和之比,计算得0.713,典型 相关系数(Canonical Corr)为0.645。
Step3:选择变量“舒张压”和“胆固醇”移动到 “Independ
ents”列表框中,本例选择“Enterindependents together”判别 方式作为判别分析的方法。
Step4:单击“Statistics”按钮,在“Descriptive”选项中选 择“Mean”;在“Function Coefficients”选择“Unstandardized”。 单击“Continue”按钮,返回主对话框。

《应用多元分析》第三版(第五章 判别分析)

《应用多元分析》第三版(第五章  判别分析)
❖ 本章介绍三种常用的判别分析方法:距离判别、贝 叶斯(Bayes)判别和费希尔(Fisher)判别。
§5.2 距离判别
❖ 一、两组距离判别 ❖ 二、多组距离判别
一、两组距离判别
❖ 设组π1和π2的均值分别为μ1和μ2,协差阵分别为Σ1和 Σ2(Σ1,Σ2>0) ,x是一个新样品(p维),现欲判断它 来自哪一组。
25
1.01
0.4
26
1.45
0.26
27
1.56
0.67
28
0.71
0.28
29
1.5
0.71
30
1.37
0.4
31
1.37
0.34
32
1.42 0.43
33
0.33
0.18
34
1.31
0.25
35
2.15
0.7
36
1.19
0.66
37
1.88
0.27
38
1.99
0.38
39
1.51
0.42
40
1.68
❖ 1. Σ1=Σ2=Σ时的判别 ❖ 2. Σ1≠Σ2时的判别
1. Σ1=Σ2=Σ时的判别
❖ 判别规则:
x x
1 2
, ,
若d 2 x,1 d 2 x, 2 若d 2 x,1 d 2 x, 2

令W
x
a
x
μ
,其中
μ
1 2
μ1
μ2

a Σ 1 μ1 μ2 ,则上述判别规则可简化为
x x
1, 2,
若W x 0 若W x 0
❖ 称W(x)为两组距离判别的(线性)判别函数,称a为

判别分析实际应用优秀课件

判别分析实际应用优秀课件

正判率 %
未成熟
83
高成熟
96
成熟
94
过成熟
92
各演化阶段的正判率都超过了80%,故可把上 述判别函数用于判别生油岩演化阶段。如珠江
口盆地第三系生油岩为中新世至晚渐新世,地 层 绝 对 年 龄 约 为 16~30 百 万 年 , 埋 藏 深 度 为 2200米,地层温度104℃。按上述判别函数式 计算,绝对年龄以25百万年计,判别函数值为
362 11.6 3500 2.8571429e–004 6.4536250e+000 1.5748031e–003
380 129 3100 3.2258065e–004 6.4815771e+000 1.5313936e–003
377 127.88 2350 4.2553191e–004 6.4769724e+000 1.5384615e–003
125.005 1000 1.0000000e–003 6.4134590e+000 1.6393443e–003 123 1000 1.0000000e–003 6.3985949e+000 1.6638935e–003 125 1750 5.7142857e–004 6.4085288e+000 1.6474465e–003 33.75 1680 5.9523810e–004 6.4297195e+000 1.6129032e–003 27.999 1460 6.8493151e–004 6.4216223e+000 1.6260163e–003 242 3200 3.1250000e–004 6.4150970e+000 1.6366612e–003 34.33 1600 6.2500000e–004 6.4232470e+000 1.6233766e–003 15 1980 5.0505051e–004 6.4313311e+000 1.6103060e–003 8.04 1350 7.4074074e–004 6.4361504e+000 1.6025641e–003

第8章 判别分析ppt课件

第8章 判别分析ppt课件

逐渐判别分析
STEPDISC过程
SAS 统计分析与应用 从入门到精通
逐渐判别分析
STEPDISC过程
SAS 统计分析与应用 从入门到精通
四、逐渐判别分析
2、STEPDISC过程
语句阐明: 〔1〕PROC语句用于规定运转STEPDISC过程,并指定要分析的数
据集名。选项有: METHOD=选项——规定对判别函数中的变量进展选择的方法。
SAS 统计分析与应用 从入门到精通
逐渐判别分析
STEPDISC过程
PROC STEPDISC DATA=数据集名 <选项>; CLASS 分类变量名; VAR 变量名列表; BY 分组变量;
RUN;
SAS 统计分析与应用 从入门到精通
逐渐判别分析
STEPDISC过程
SAS 统计分析与应用 从入门到精通
SAS 统计分析与应用 从入门到精通
第八章 判别分析
判别分析简介 普通判别分析 典型判别分析 逐渐判别分析
SAS 统计分析与应用 从入门到精通
一、判别分析简介
判别分析是一种运用性很强的统计方法。它通常是根据已有的数据 资料,来建立一种判别方法,然后再来判别一个新的样品归属于哪一类。
例如,医院拥有以往就诊的各种病人的资料,包括他们的心率、血 压、体温、化验目的等很多数据。如今有一个新的病人来医院就诊,对 他也丈量了相关的目的数据,要判别他患有哪一种病,这就属于一个判 别归类的问题。又如,在矿产勘探中积累了丰富的地质资料,如今某地 域新采到了一个岩石标本,要从它的根本特征判别该地域有无矿产,是 贫矿还是富矿,那么也需求进展判别分析。
〔5〕BY语句规定了分组变量,它使得BY过程对分组内进展处置。 在运用BY语句前,应对数据集按照分组变量进展排序。

判别分析(共27张PPT)

判别分析(共27张PPT)

w11 w12 w1 p w1r
w
21
w22
w2p
w2r
Qw=
w
p1
w p2 w pp
w
pr
wr1 wr 2 wrp wrr
使其中虚线左上部分便是只含 p 个变量的模型中的
类内离均差平方和矩阵Q( p ),而整个矩阵则是含p+1
w
个变量的模型中的类内离均差平方和矩阵Q ( p 1) 。
第12章 判别分析Discrimination Analysis
判别分析
:从反映个体性质各个侧面的P个变量出发,通过
定量分析,最终将其判归某一已知总体,从而将 对个体的研究置于更为广泛的总体研究背景上。
各种判别分析都是按照某种判别原则(视判别方
法不同而不同),在e
对变量进行剔除和引进的方法 差异显著地大于类内差异呢?还需进行测验。
第三节 逐步判别分析方法
Stepwise Discrimination Analysis
Wilk’s Λ统计量 何分类”、“某一个事例(或样品)属于那一类”等问题是并不知晓;
如果已知将原应属于Gi的样品误判为属于Gj所造成
第二节 贝叶斯判别分析
|Q | |Q |w 设叶X斯,判Y别是法从的均判值别向函量数为)μ,,协按方判差别阵函为数wΣ值的的总大体小G来中抽取的两个样品,定义X,Y之间的马氏距离平方为:
= ──── =── 用 F 测验可以检验增长是否显著。
|Q +Q | |Q | h 第与五多步 元、回如归果分有析待相判似数,据在,进将行其判代别入分,析并时判,别并e归不类是。
统计量为p,增加一个变
量 (x ) 后的 Bayes Discrimination Analysis

第八章 判别分析 课件

第八章 判别分析 课件
设有 k 个总体 G1,G2 , ,Gk 相应的 p 维
空间为 R1, R2 , , Rk 即为一个划分,故可记判 别规则为 R R1, R2 , , Rk
从描述平均损失的角度出发,如果原来
属于总体 Gi 且分布密度为 fi x 的样品,正
好取值落入了 R j ,我们就会错判为属于 G j 。
该判别规则的等价描述是:求新样品X到G1
的距离与到 G2 的距离之差,如果其值为正,
X属于G2 ;否则 X属于G1 。
(二)多个总体的距离判别问题
1、设有 k 个总体 G1, G2 , , Gk ,其均值和协
方差矩阵分别为 1 , 2 , , k 和 1 ,2 , ,k , 而且 1 2 k ,对于一个新样本 X , 要判断它来自哪个总体。 方法同上。
其销售价格为3.0,顾客对其口味的评分平均 为8,信任评分平均为5,试预测该饮料的销 售情况。
销售情况 产品序号 销售价格 口味评分 信任度评分
畅销
1
2.2
5
8
2
2.5
6
7
3
3.0
3
9
4
3.2
8
6
平消
5
2.8
7
6
6
3.5
8
7
7
4.8
9
8
滞销
8
1.7
3
4
9
2.2
4
2
10
2.7
4
3
习8.2 银行的贷款部门需要判别每个客户的 信用好坏(是否未履行还贷责任),以决定 是否给予贷款。可以根据贷款申请人的年龄 (X1)、受教育程度(X2)、现在所从事工 作的年数(X3)、未变更住址的年数(X4)、 收入(X5),负债收入比例(X6)、信用卡 债务(X7)、其他债务(X8)等来判断信用
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

表1.5 WWilkilsk检s' L验ambda
Test of Function(s) Wilks' Lambda Chi-square
df
Sig.
A表na1l.y2si分s C析as个e 案 Unweighted Cases P综ro合ces统sin计g量Summary
Valid Excluded Missing or out-of-range group codes
N Percent 31 100.0
0 .0
At least one missing discriminating variable
Step5:单击“Classify”按钮,在“Plot”选项组中选择 “Combined-groups”选项,在“Display”选项组中选择“Cas
ewise result”和“Summmary table”选项;单击“Continue”按 钮,返回主对话框。
Step6:单击“Save”按钮,在弹出的对话框中选择 “Pred
14 12.80 3.63
15 13.33 5.96
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
正常人组
舒张压 胆固醇
10.66 2.07
12.53 4.45
13.33 3.06
9.33
3.94
10.66 4.45
10.66 4.92
9.33
3.68
10.66
2.77
冠心病人组
编号 舒张压 胆固醇
1
9.86
5.18
2
13.33
3.73
3
14.66
3.89
4
9.33
7.10
5
12.80
5.49
6
10.66
4.09
7
10.66
4.45
8
13.33
3.63
9
13.33
5.96
10 13.33 5.70
11 12.00 6.19
12 14.66 4.01
13 13.33 4.01
均数(means)、标准差(standard deviation)和有效个案的 例数。
表1.3 分组 统G计rou量p Statistics
Mean
Std. Deviation
Valid N (listwise)
组别 1.00
2.00
Total
舒张压 胆固醇 舒张压 胆固醇 舒张压 胆固醇
Unweighted 12.3794 4.6931 10.6267 3.7687 11.5313
Step2:选择“Analysis” →“Classify” →“Discriminant”命令,
在“Discriminant Analysis”对话框中,选择“组别”变量进入 “Grouping Variable”文本框;单击“Define Range”按钮,在 “Minimum”文本框中输入1,在“Maximum”文本框中输入2, 单击“Continue”按钮,返回主对话框。
value)为组间平方和与组内平方和之比,计算得0.713,典型 相关系数(Canonical Corr)为0.645。
Function 1
表1.4E典ige型nv判别函 数的特alu征es值表
Eigenvalue .713(a)
% of Variance 100.0
Cumulative % 100.0
0 .0
Both missing or out-of-range group codes and at least one missing discriminating variable
0 .0
Total
Total
0
.0
31 100.0
2、分组统计量 表1.3所示为分组统计量列表。表中给出分组变量和合计的
10.66
3.21
10.66
5.02
10.40
3.94
9.33
4.92
10.66
2.69
10.66
2.43
11.20 3.42
9.33
3.63
操作步骤:
Step1:读取数据文件discriminant.sav。其中,变量名“舒
张压”、“胆固醇”代表两项指标值。病人资料和正常人资料
合并一同输入,定义变量名为“组别”的变量用于区分冠心病 人资料和正常人资料,即冠心病人资料的“组别”值均为1, 正常人资料的“组别”值均为2.
Canonical Correlation
.645
a First 1 canonical discriminate functions were u
4、Wilks检验结果 表1.5所示为典型判别分析的Wilks检验结果。其中Wilks值为
0.584,卡方检验统计量的观测值为15.071,概率P值为0.001, 小于0.05。
Step3:选择变量“舒张压”和“胆固醇”移动到 “Independ
ents”列表框中,本例选择“Enterindependents together”判别 方式作为判别分析的方法。
Step4:单击“Statistics”按钮,在“Descriptive”选项中选 择“Mean”;在“Function Coefficients”选择“Unstandardized”。 单击“Continue”按钮,返回主对话框。
icted group membership”选项,单击“Continue”按钮,返回 主对话框。
Step7:单击“OK”按钮,执行判别分析操作。
判别分析的结果
1、分析个案综合统计量 表1.2和表1.3所示为系统处理的数据简明表明中的数据,按变量 “组别”分组共有31个样本为判别基础数据进入分析,其中第 一组十五例,第二组十六例。
判别分析的案例分析
§4. 实例分析
例1、 为研究舒张期血压和血浆胆固醇对冠心病的作用, 某医师测定了50—59岁冠心病人15例和正常人16例的舒张压和 胆固醇指标,结果如下表所示。试做判别分析,建立判别函数 以便在临床中用于筛选在临床中用于筛选冠心病人(数据文件: discriminant.sav)
4.2458
Weighted 1.64999 1.29614 1.13528 .85021 1.65996
1.18231
Unweighted 16 16 15 15 31
31
Weighted 16.000 16.000 15.000 15.000 31.000 31.000
3、典型判别函数的特征函数的特征值表 表1.4所示是典型判别函数的特征值表,其特征(Eigen
相关文档
最新文档