第6章 判别分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 判别分析
一、填空题
1.进行判别分析时,通常指定一种判别准则,用来判定新样本的归属,按照判
别准则的不同,又有多种判别方法,其中常用的方法有______ _____ _ 、____________ _、 、和 。
2.判别分析按判别的组数来区分,有 和 ;按区分不同总体的所用的数学模型来分,有 和 。 3.Fisher 判别是借助于 的思想,来导出 和建立判别准则。 4.判别分析是根据已掌握的、历史上每个类别的若干样本的数据信息,总结出客观事物分类的规律性,建立 和 。
5.在进行距离判别时,通常采用的距离是 ,它的基本公式为: 。
二、判断题
1.在正态等协差阵的条件下,Bayes 线性判别函数等价于距离判别准则。 ( )
2.费歇判别和距离判别都对判别变量的分布类型没有要求。 ( ) 3.只有当两个总体的均值有显著差异时,做判别分析才有意义。( ) 4.如果()x ϕ是费歇判别准则的判别函数,则对于任何β与任意常数γ来说,()γβϕ+x 也都是它的线性函数。
( ) 5.Bayes 判别不仅考虑了各个总体出现的先验概率,而且也考虑到了错判所造成的损失。( )
6.在进行两类判别时,两总体的协差阵如果相等,那么费歇判别与距离判别是等价的。( )
7.逐步判别法中筛选变量的过程实质上就是作假设检验,通过检验找出显著变量,剔除不显著变量。( )
8.在进行距离判别时,通常采用的是马氏距离。( ) 9.设k R R ,,1 为p 维空间p R 上的k 个子集,而且要求互不相交,它们的和集为
p R ,则称k R R ,,1 为p R 的一个划分。而Bayes 判别实质上就是找这个划分。
( )
三、简答题
1. 判别分析和聚类分析有何区别与联系?
2.距离判别分析的基本思想是什么?假设有两个总体G 1和G 2, 如果能够定义样品x 到它们的距离D(x,G 1)和D(x,G 2), 那么判别规则是怎样的?请描述这个准则的数学模型。
3.简述逐步判别法的基本思想。
4.距离判别、贝叶斯判别和费歇判别有何异同?
5.进行聚类分析往往要先对数据进行标准化变换,进行判别分析是否也需要先进行标准化变换?为什么? 四、计算题
1.已知观测向量()'=321,,x x x x 在两类上的均值向量分别为()()'
=35,100,301μ和
()()'=30,90,262μ,两类的共同协差阵为:
⎥⎥⎥⎦
⎤⎢⎢⎢⎣⎡=∑1000
20
0400
20060 试用距离判别法建立判别函数和判别规则。现有一样品()'
=31,90,35x ,问此样品
应属于哪一类?
(1)求出共同协方差矩阵的逆矩阵和两类均值向量的离差向量分别为:
⎥⎥⎥⎦⎤⎢⎢
⎢⎣⎡--=⎥⎥⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢⎢⎢⎣⎡--=⎥⎥⎥⎦
⎤⎢⎢
⎢⎣⎡--=∑-01071.0000357.000025.0000357.0001786.028030
280104001028010561
24000080000560008000040000
224000011
()()()
⎥⎥⎥⎦
⎤
⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡---=-510430359010026302
1
μμ
(2)求出判别系数向量为:
()()()
⎥⎥
⎥⎦
⎤
⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=-∑=-03927.0025.005359.0510401071.00
00357
.000025.0000357.0001786
.0211μμa (3)两类均值向量的平均数向量为:
()()()
⎥⎥⎥⎦
⎤
⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢
⎢⎣⎡+++=+=5.3295283035901002630212121μμμ (4)线性判别函数为:
()()[]1518
.503927.0025.005359.05.32952803927.0025.005359.0321321-++=⎥⎥⎥⎦
⎤
⎢⎢⎢⎣⎡---=-'=x x x x x x x a x w μ (5)相应的判别规则为:
()()()⎪⎩
⎪
⎨⎧=<∈>∈00,0,21x w x w G x x w G x 待判,若若若 (6)该样品的判别函数值为:
()0
19122.01518
.53103927.090025.03505359.0>=-⨯+⨯+⨯=x w
由此可以判断,该样品应属于第一类。
2.例:某种产品的生产厂商有很多个,有些厂商的产品在市场上比较受欢迎,而有些厂商的产品在市场上不大受欢迎,批发商店现有12家厂商的产品,其中7家是受欢迎的,5家属于不太受欢迎的。该商店对这12家厂商的产品就其式样、包装和耐久性进行了评估,评分采用10分制,评估结果如下表所示。
某种产品各品牌的各项评分
同时已知两类的共同协差阵的逆矩阵为:
试用费歇判别准则建立判别函数和判别规则。现有一新厂商推销其产品,产品特性评分为式样6分,包装4分,耐久性5分,问该厂商的产品是否受消费者欢迎? 3.某地市场上销售的收录机有多种牌号,该地某商场从市场上随机抽取了13种牌号的收录机,其中有4种畅销,有5种销售一般,有4种滞销。所调查的各种收录机的质量评分、功能评分和销售价格资料如下表所示:
某地各种收录机的销售状况
试根据该资料建立贝叶斯判别函数和判别准则。假设有一新厂商来推销其产品,其产品的质量评分为7.0,功能评分为7.0,销售价格为660元,问该厂产品的销售前景如何?
4.下图是SPSS 统计分析软件的一个对话框,请问是什么分析过程?解释"Grouping Variable"、"Independents:"、“Enter independent together ”、“Use Stepwise
⎥⎥
⎥⎦
⎤
⎢⎢⎢⎣⎡----=-04427.001614
.001089
.001614.004748
.001990.001089.001990.006197.01
S