判别分析案例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
选择ANOVAs进行 各组均值相等检验
选择Box’s M 进行各组协方 差阵相等检验
生成Bayes判别方程系数 和Fisher判别方程系数。
a
19
SPSS实现——Classify模块
Prior Probabilities:设定先验概率。
a
10
group 表示类别
数据展示
8个用来建立 判别标准的变量
•该数据disc.sav共有90个样本,其中30个属于
上升型,30个属于稳定性,30属于下降型。这
个已知类别的数据称为一个“训练样本”。
a
11
SPSS实现——数据读入
File → Open → Data → “Disc.sav”
a
12
Grouping Variable:选入分类变量“Group”,Define Range 被激活。点击弹出Range对话框,分别输入分类变量最小 值和最大值,本例为“1”和“3”。
Independents:选入自变量。本例选入变量“is—cs”。
Enter independents together:所有自变量同时进入方程。
a
15
SPSS实现——选择变量的方法
两种变量选择方法
自变量同时 进入方程
逐步 判别法
a
16
SPSS实现——变量选择
group 选入分组变量
is-cs 选入自变量
选择自变量 同时进入方程
的方法
a
17
SPSS实现——Statistics模块
Descriptives:描述性统计量。
Means:均数估计。
Univariate ANOVAs:单变量方差分析。
Box’s M:组间协方差齐性检验。
Matrices:矩阵
Within-groups correlation:合并组内相关阵。
Within-groups covariance:合并组内协方差阵。
Separate-groups covariance:各组协方差阵。
公司
徽标
多元统计分析——判别分析
统计 研一 苏旸 2007100196
a
1
判别分析——把对象归到已知类中
• 人们常说: ——“像诸葛亮那么神机妙算” ——“像泰山那么稳固” ——“像钻石那么坚硬”
• 一些判别标准都是有原型的,虽然这些判 别的标准并不那么精确或严格,但大都是 根据一些现有的模型得到的。
Use stepwise method:逐步判别法。按自变量贡献大小, 逐个引入和剔出变量,直到没有新的有显著作用的自变量 可以引入,也没有无显著作用的自变量可以从方程内删除 为止。选此项后,激活Method按钮。
Select Variable:挑选观察单位。框内选入变量后(不能选 入分类变量和自变量中已选入的变量),Value按钮被激 活,填入数值。自己符合该数值的的观察单位才参与判别 分析;若不选此项,则所有观察单位都参与判别分析。
③如果D(x,G1) = D(x,G2),则待判。
• 距离判别法的不足之处:
①判别方法与总体各自出现的的概率大小无 关;
②判别方法与错判之后所造成的损失无关。
a
4
Fisher判别法
• 所谓Fisher判别法,就是一种先投影的方 法,把高维空间中的点向低维空间进行投 影。
• 主要思想是通过将多维数据投影到某个合 适的方向上。而投影的原则是将总体与总 体之间尽可能的分开,然后选择合适的判 别规则,进行分类判别。
a
2
判别分析的方法
• 距离判别法 • Fisher判别法 • Bayes判别法 • 逐步判别法
a
3
距离判别法
• 假设有两个总体G1和G2, 如果能够定义点x
到它们的距离D(x,G1)和D(x,G2), 则 ①如果D(x,G1) < D(x,G2),则 x∈G1 ②如果D(x,G2) < D(x,G1),则 x∈G2
SPSS实现——数据编辑
Variable View → “Group”变量Decimals:“2” → “0”; Label:添加变量名称,便于识别; “Group”变量Value:添加组别。
a
13
SPSS实现——数据分析
Analyze → Classify → Discriminant
a
14
SPSS实现——模块介绍
a
7
大纲
disc.sav, disc.txt
SPSS 实现
数据 介绍
结果 分析
R语言 实现
a
8
数据介绍——disc.sav
• 数据来源:吴喜之——《统计学:从数据到 结论》。
• 数据介绍:某专家编出一套打分体系来描绘 企业的状况。该体系对每个企业的一些指标 (变量)进行评分。共有8个指标,如下页 表格所示。
a
5
Bayes判别法
• 当每个分类的观察值不同时,最好用Bayes 判别。因为每个分类的观察值不同时,每类 出现的机会是不同的,而Fisher判别法忽视 了这个问题。
• 具体方法是:对每一个样品先计算出判别分 数D,然后根据先验概率和D的条件概率, 计算出该样品被判为每一类的后验概率,哪 类的后验概率最大,则判为哪一类。
Total covariance:总协方差阵。
Function Coefficients:函数系数。
Fisher’s:Fisher函数系数——Bayes判别函数系数。
Unstandardized:非标准化函数系数——Fisher判别函数系数。
a
18
SPSS实现——Statistics模块
选择Means 进行均数估计
• 有一些企业已经被某杂志划分为上升企业、 稳定企业和下降企业。我们希望根据这些企 业的上述变量的打分和它们已知的类别,找 出分类标准,并对没分类的企业进行分类。
a
9
变量描述
变量名称 group
is se sa prr ms msr cp cs
涵义描述 表示类别。group-1代表上升,group-2代表稳 定,group-3代表下降。 表示企业规模。 表示服务。 表示雇员工资比例。 表示利润增长。 表示市场份额。 表示市场份额增长。 表示流动资金比例。 表示资金周转速度。
a
6
逐步判别法
• 逐步判别法就是在前面的方法中加入变量选 择功能。有时,一些变量对于判别没有什么Hale Waihona Puke Baidu作用,为了得到对判别最合适的变量,可以 使用逐步判别。
• 逐步判别的思想是先用少数变量进行判别, 然后一边判别,一边引进判别能力最强的变 量,同时淘汰判别能力不强的的变量。
• 主要利用一些检验来判断变量的判别能力。