多元统计期末复习题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多元数据分析练习题
第二章多元正态的参数估计
一.判断题
(1)若S S =),,(~),,,(21m p
T p N X X X X 是对角矩阵,则p X X X ,,,21 相互独立。
(
)
(2)多元正态分布的任何边缘分布为正态分布,反之也成立。
()
(3)对任意的随机向量T
p X X X X ),,,(21 =来说,其协方差矩阵S 是对称矩阵,并且总是半正定的。
()
(4)对标准化的随机向量来说,它的协方差矩阵与原来变量的相关系数阵相同。
(
)
(5)若),,(~),,,(21S =m p T
p N X X X X S X ,分别为样本均值和样本协差阵,则
S n
X 1
,分别为S ,m 的无偏估计。
()
二.计算题
1.假设随机向量T
X X X X ),,(321=的协方差矩阵为úúúû
ù
êêêëé---=S 92
3244
3416
,试求相关系
数矩阵R 。
úúúúúúúû
ù
êêêêêê
êë
é
----=1314131121
412
11R 2.假设随机向量
T
x x x )
,(21=的协方差矩阵为úû
ùê
ëé=S 201
1
9
,令
212211,2x x y x x y -=+=,试求T
y y y ),(21=的协方差矩阵。
ú
ûùêëé--=
S 27
3
3603.假
设
úû
ù
ê
ëé---=S 5.00
5
.05.015.0),,(~3A N X m ,其中T
)
1,2,1(-=m ,
úú
úû
ù
êêêëé--=S 41
1
121
112
,试求Ax y =的分布。
)2224,02(2÷÷ø
öççèæ--÷÷øöççèæ-N 三.证明题
1.1.设设)()2()1(,,,n X X X 是来自),(S m p N 的随机样本,X 为样本均值。
试证明:
m =)(X E ,S =
n X D 1)(。
2.2.设设)()2()1(,,,n X X X 是来自),(S m p N 的随机样本,
S n 1
1-为样本协差阵。
试证明:
S =-)1
1(
S n E 。
3.证明:若p 维正态随机向量),,,(21¢=p X X X X 的协差阵为对角矩阵,则X 的各分量是相互独立的随机变量。
第四章判别分析
一.判断题
1.从某种意义上讲,距离判别是Bayes 判别的一种特例。
( )
2.距离判别的思想是分别计算样本到各个总体的欧几里得距离,距离判别的思想是分别计算样本到各个总体的欧几里得距离,根据距离的大小判别样本属根据距离的大小判别样本属于哪个总体。
( )
3.量纲的变化对欧几里得距离的计算结果有影响,而马氏距离则克服了这种影响。
欧氏距离是马氏距离的一种特例。
( )
4.贝叶斯判别法是一种考虑了总体出现的先验概率和误判损失的判别方法。
( )
5.在贝叶斯判别法中,),,,(21k R R R R =是一个划分,)(x h i 是将样品误判给总体i G 的加权平均损失,则k i x h x h x R j k
j i i ,,2,1)},(min )({1 ===££。
( )
6.费希尔判别法是借助方差分析的思想构造线性判别函数,使得总体之间区别最大,而使每个个体内部的离差最小。
( ) 二.计算题
1.设有两个正态总体21,G G ,已知:
÷÷ø
ö
ççèæ--=S ÷÷øöççè
æ=S úûùêëé=úûùêëé=1114,42
23
,32)2(,52)1(21m m (1)建立距离判别法的判别准则;
(2)判断:样品:úû
ù
êëé=31X ,应归属于哪一类?2G x Î
(答案:
)
52281024(3
1),(),
51224434(81),(21212
221221212
2
2
1
1
+--++=
+-+-+=
x x x x x x G x D x x x x x
x
G x D )
2.设G1,G2为两个二元总体,从中分别抽取容量为3的样本如下:的样本如下:
x1 x2
x1 x2 3 7
2 4 : G1 4 7
6 9
5 7 :G2 4 8
(1)求两样本的样本均值)2()1(,x x 及协方差矩阵21,S S ;
T T
x x )8,5(,)6,3()
2()1(==÷÷ø
ö
ççè
æ=÷÷øöççè
æ=2112
,63
32
21S S (2)假定两总体协方差矩阵相等,记为S ,用21,S S 联合估计S ;
÷÷ø
öççèæ--=S ÷÷øöççè
æ=S -111221,21
11
21 (3)建立距离判别法则;)建立距离判别法则;
2211212121,0),(;,0),(),253(2),(G x x x W G x x x W x x x x W Î>Î<-+-=
(4)假设有一新样品T
T
x x x )7,2()
2,1(0==,进行距离判别。
2G x Î
3.已知两总体的概率密度分别为)(1x f 和)(2x f ,且总体的先验分布为8.0,2.021==p p ,误判损失为100)21(,50)12(==c c 。
(1)建立Bayes 判别准则;判别准则;
(2)假设有一新样品0x 满足3.6)(01=x f 和5.0)(02=x f ,判定0x 的归属问题。
的归属问题。
4. 假设两总体G1,G2的概率密度分别为1,1)(1£-=x x x f 和 5.15.0,5.01)(2<£---=x x x f 。
(1)做出)(1x f 和)(2x f 的图像。
若假定先验概率21p p =,)21()12(c c =,求Bayes 判别区间的临界点;(0.25)
(2)若8.0,2.021==p p ,)21()12(c c =,求Bayes 判别区间的临界点;(-0.33)
5.假定有3
21,,G G G 三个组,已知30
.0,65.0,05.0321===p p p ,10
.0)(01=x f 和
63.0)(0
2=x f ,4.2)(03=x f 。
(1)若不计误判损失,判定0x 属于哪个组;(3G )(后验概率分别为0.004,0.361,0.635) (2)假定误判代价矩阵为)假定误判代价矩阵为
1G
误判为
2G
3G
真实组 1G
2G
0)11(=c 20)21(=c
10)12(=c 0)22(=c
200)13(=c 100)23(=c
3G 60)31(=c 50)32(=c 0)33(=c
判定0x 属于哪个组。
(误判的平均损失为51.39,36.05,41.95 2G )
6. 已知两总体的概率密度分别为)(1x f 和)(2x f ,且总体的先验分布为4.0,6.021==p p ,误判损失为12)21(,4)12(==c c 。
(1)建立Bayes 判别准则;判别准则;
(2)假设有一新样品0x 满足36.0)(01=x f 和24.0)(02=x f ,判定0x 的归属问题。
(2G ) 7.假设先验概率,误判代价及概率密度值已列于下表。
试用贝叶斯判别法将样品分到组
321,,G G G 中的一个。
若不考虑误判代价,则判别结果又将如何?中的一个。
若不考虑误判代价,则判别结果又将如何?
1G
判别为
2G
3G
真实组真实组 1G
2G
3G 0)11(=c 400)21(=c
100)31(=c
20)12(=c 0)22(=c
50)32(=c
80)13(=c 200)23(=c
0)33(=c
先验概率
概率密度
55.01=p 46.0)(01=x f
15.02=p 5.1)(02=x f
3.03=p 70.0)(03=x f
8. 8. 金融分析员需要有两项重要指标来衡量,设总体金融分析员需要有两项重要指标来衡量,设总体G1为“金融分析员满足要求”;总体G2为“金融分析员不满足要求”(两个总体均服从正态分布,协差阵相等),今测得两个总体的若干数据,并由这些数据得到若干数据,并由这些数据得到
úûù
êë
é=S úûùêëé=úûùêë
é=4111ˆ,24ˆ,62ˆ21
m
m
(1)假设对某一金融分析员进行测量得到两个指标为T
x )4,5(=,判别这一分析员是否能满足这项工作。
(满足)满足这项工作。
(满足)
(2)当两组先验概率分别为731.0,269.021==q q ,损失相同。
问该金融分析员满足要求
吗?为什么?(不满足)吗?为什么?(不满足)
第五章聚类分析
一.判断题
1.快速(动态)聚类分析中,分类的个数是确定的,不可改变。
( )
2.K 均值聚类分析中,样品一旦划入某一类就不可改变。
( )
3.判别分析,聚类分析和主成分分析都不要求数据来自正态总体。
( )
4.系统聚类可以对不同的类数产生一系列的聚类结果。
( )
5. K 均值聚类和系统聚类一样,可以用不同的方法定义点点间的距离。
( )
6. K 均值聚类和系统聚类一样,都是以距离的远近亲疏为标准进行聚类的。
( ) 二. 计算题
1. 1. 下面是下面是5个样品两两间的距离矩阵个样品两两间的距离矩阵
úúúúúúû
ùêêê
êê
ê
ë
é=08
53601071096040
)
0(D
试用最长距离法作系统聚类,并画出谱系聚类图。
2. 假设有6个样本,每个样本只测量一个指标,数据如表。
样本点间使用绝对值距离,类间使用最长距离,利用系统聚类法对这6个样本进行分类。
个样本进行分类。
要求:(1)写出距离矩阵及类的合并过程;)写出距离矩阵及类的合并过程;
(2)画出聚类的谱系图;)画出聚类的谱系图;
(3)写出样本分成两类时的结果。
)写出样本分成两类时的结果。
样本编号样本编号 1 2 3 4 5 6 指标1 1 2 4 3 -4 -2
3. 假定我们对C B A ,,三个样品分别测量两个变量1X 和2X 得到结果如表:得到结果如表:
用快速聚类法将以上样品聚成两类。
用快速聚类法将以上样品聚成两类。
样品样品 变量变量
X1
X2
A 5 3 B -1 1 C
1 2
4. 检验某产品的重量,抽了6个样品,每个样品只测了一个指标,分别为1,2,3,6,9,11,试用最短距离法,重心法进行聚类分析。
5. 考虑下列4个样品的距离矩阵:úúúú
û
ùê
êê
ê
ëé04
3
502110
10,用最短距离,最长距离法和类平均法对这4个样品进行聚类,并画出谱系图。
个样品进行聚类,并画出谱系图。
6. 有8个样本,每个样本两个指标,数据如表。
样本点间使用欧氏距离,类间使用最短距离法,利用系统聚类法对这8个样本进行分类。
个样本进行分类。
样本编号样本编号 1 2 3 4 5 6 7 8 指标1 2 2 4 4 -4 -2 -3 -1 指标2
5
3
4
3
3
2
2
-3
7.检验某产品的重量,抽了5个样品,每个样品只测了一个指标,分别为1,2,6,11,试用快速聚类法将样品分为两类。
用快速聚类法将样品分为两类。
三.简答题
1.判别分析与聚类分析有何区别?
判别分析是对于n 个给定的样本,已知每个样本属于k 个类别中的某一类,利用这些数据,找到一种判别方法,使得这种判别方法具有某种最优性质,能把属于不同种类的样本点尽可能的区别开来,并对测得同样指标数据的新样本,能够判别这个样本归属于哪一类。
聚类分析是在样品和类之间定义一种距离,按照距离的大小对样品进行聚类,距离相近的样品先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品总能聚到合适的类中。
中。
聚类分析没有判别函数,对新的样品无法判别它应该归属哪一类,必须重新进行聚类过程,才能判别它属于哪类。
系统聚类分析能够得到样品从最小的分类(每个样品自成一类)到最大的分类的情况,而判别分析没有这种功能,但判别分析的距离判别法与聚类分析非常相似,也是根据距离的远近判别样本的归属问题。
析非常相似,也是根据距离的远近判别样本的归属问题。
2.K 均值法与系统聚类法的异同
(1) K 均值法事先必须确定分类的个数,分类的个数确定,而系统聚类分析系统聚类分
析能够得到样品从最小的分类析能够得到样品从最小的分类(每个样品自成一类)(每个样品自成一类)(每个样品自成一类)到最大的分类的情况,到最大的分类的情况,到最大的分类的情况,可以根可以根据需要将样品分为几类。
据需要将样品分为几类。
(2) K 均值法可以随意将样品分为K 类,根据样品到类中心的距离远近重新进行分类,而系统聚类中样品一旦划入某一类就不能更改。
而系统聚类中样品一旦划入某一类就不能更改。
(3) K 均值法样品与不同类间的距离采用点到类中心的平方欧氏距离,而系统聚类中点间距离有很多种定义方法。
间距离有很多种定义方法。
3. 简述系统聚类法的思想。
4. 简述快速聚类法的思想。
第六章主成分分析
一.判断题
1.主成分分析数学模型中的正交变换,在几何上就是做一个坐标旋转。
( )
2.假设p X X X ,...,,21为某实际问题所涉及的p 个变量,p Y Y Y ,...,,21是其p 个主成分,
判断下列说法是否正确:判断下列说法是否正确:
(1)由原始变量p X X X ,...,,21的协方差矩阵和相关矩阵出发,求得的主成分是一致的。
( )
(2)对变量做主成分分析之前,必须对原始数据进行标准化。
( )
(3)由标准化数据的协方差矩阵出发求得的主成分与由原始数据的相关系数矩阵出发求得的主成分一致。
( ) (4)j i Y Y Cov j i ¹=,0),(。
( )
(5)由于p Y Y Y ,...,,21包含原始变量的信息量递减,因而实际应用中选取前几个主成分代替原来的原始变量。
( )
(6)当各个变量取值范围相差不大或者是度量单位相同的指标时,一般选择直接从协方差矩阵求解。
( )
(7)
å
å
===
p
i i p i i X Var Y Var 1
1
)()(。
( )
(8)假设p
X
X X ,...,,21的协方差矩阵为S ,m l l l ,...,,21为S 的非零特征根,
m i i ,...,2,1,=g 为对应的单位化的特征向量,则第i 个主成分为m i X Y T
i i ,...,2,1,==g 。
( )
(9)i Y 是p X X X ,...,,21的线性组合。
的线性组合。
( ) (10)p i Y D i i ,...,2,1,)(==l 。
( ) (11)主成分的协方差矩阵是对角阵。
( )
(12)方差贡献率表明了主成分综合原始变量的能力。
( ) 3.主成分分析中的信息,是用变量期望的大小来表示的。
( ) 二. 计算题
1.假设总体T
X X X ),(2
1
=的协方差矩阵为úû
ù
ê
ëé=S 2225,求X 的主成分,,21Y Y 并计算第一主成分1Y 的累计贡献率。
的累计贡献率。
2.假设总体T
X X X X ),,(321=的相关矩阵为úúú
û
ù
êêêëé=111r r r r r r R ,)11(<<-r 求X 的标准
化变量的主成分,
,,321Y Y Y 并计算各主成分的贡献率和累计贡献率。
并计算各主成分的贡献率和累计贡献率。
(
r
l l r l -==-+=1,)1(1321p ,
)6
2,
6
1,
6
1(
),0,2
1,
2
1(
),1,1,1(321-=-==t t p p p t )
3.假设总体T
X X X X ),,(321=的协方差矩阵为úúúû
ù
êêê
ëé--=S 50
2
040
202
,求X 的主成分,,,321Y Y Y 并计算各主成分的贡献率和累计贡献率,确定应取几个主成分。
并计算各主成分的贡献率和累计贡献率,确定应取几个主成分。
4.设T
p
X X X X ),,,(2
1
=的协方差矩阵为的协方差矩阵为
úúúúú
û
ù
êêê
êêë
é=S pp
s
s s 00
022
11
,其中pp
s s s ³³³ (22)
11,试求X 的主成分及主成分具有
的特征值。
的特征值。
(i i x y =,方差为ii s )
三.简答题
1.试述主成分分析的基本思想及求解步骤。
试述主成分分析的基本思想及求解步骤。
2.简述主成分分析中累积贡献率的具体意义。
简述主成分分析中累积贡献率的具体意义。
第七章因子分析
一判断题 1.因子载荷矩阵经过旋转后,每个公因子对原始变量的贡献度2
i g 不变。
( ) 2.因子分析模型中公共因子i F 是互不相关、不可测的变量,并且()1i Var F =。
( ) 3.因子分析一般从变量的相关系数阵出发求因子模型。
( ) 4.因子载荷矩阵经过旋转后,变量i
X 的共同度2
i h 不变。
( )
5.因子分析模型中特殊因子与公共因子是不相关的。
( )
6.因子分析与主成分分析都是一种降维,简化数据的方法,都是通过把原变量转化为新变量的线性组合达到降维的目的。
( )
7.主成分分析中,主成分是不唯一的,但在因子分析中,因子模型是唯一的。
( ) 二. 计算题
1.设标准化变量321,,X X X 的协差阵(即相关阵)为的协差阵(即相关阵)为 ÷÷÷ø
öçççèæ=135
.045.035.0163
.045.063.01R R 的特征值和相应的单位正交化的特征向量分别为:36
.0,68.0,96.1321===l l l ),18.0,64.0,75.0(),84.0,49.0,22.0(),51.0,59.0,63.0(321--=-==l l l
要求:要求:
1) 计算因子载荷矩阵A ,并建立因子模型;,并建立因子模型; 2)计算变量3
X 的共同度2
3h 和公因子2F 的方差贡献22
g
,并说明其各自的统计意义。
2. 为研究某一片树叶的叶片形态,选取50片叶测量其长度x1(mm)和宽度x2(mm),按样本数据求得其平均值和协差阵为úû
ùêëé===4548
4890
,92,13421S x x ,求相关系数矩阵R ,并由R
出发进行因子分析。
出发进行因子分析。
三.简答题
1.简述因子模型e +=AY X 中载荷矩阵A 的统计意义。
的统计意义。
2因子分析与主成分分析的区别与联系
(1) 因子分析从变量的相关性出发,根据相关性的大小将变量进行分组,同组变量的相
关性较强,关性较强,不同组变量的相关性较弱,不同组变量的相关性较弱,不同组变量的相关性较弱,每组代表一个结构,每组代表一个结构,每组代表一个结构,这个结构用一个公因子这个结构用一个公因子表示,将变量表示成公因子的线性组合和特殊因子的和。
表示,将变量表示成公因子的线性组合和特殊因子的和。
主成分分析是从空间生成的角度寻找能解释诸多变量变异绝大部分的几组彼此不
相关的新变量。
相关的新变量。
(2) 因子分析是把变量表示成公因子的线性组合和特殊因子的和,主成分分析是把主成分表示成各变量的线性组合。
分表示成各变量的线性组合。
(3) 抽取因子的方法不仅有主成分法,抽取因子的方法不仅有主成分法,还有主轴因子法,还有主轴因子法,还有主轴因子法,极大似然估计法等,极大似然估计法等,极大似然估计法等,主成分分主成分分
析只有主成分法抽取主成分。
析只有主成分法抽取主成分。
(4) 主成分分析中当给定的协差阵或相关系数阵的特征值唯一时,主成分一般是固定
的,而因子分析中的因子不是固定的,可以旋转得到不同的因子。
的,而因子分析中的因子不是固定的,可以旋转得到不同的因子。
四.下表是以学生六门考试成绩为变量,下表是以学生六门考试成绩为变量,从相关系数阵出发,从相关系数阵出发,从相关系数阵出发,以主成分法抽取因子,以主成分法抽取因子,进行因子分析的部分结果,根据表格回答下列问题:子分析的部分结果,根据表格回答下列问题:
表1 Total Variance Explained Component Initial Eigenvalues
Total % of Variance Cumulative %
1 3.735 62.254 62.254 2 1.133 18.887 81.142 3 .457 7.619 88.761 4 .323 5.376 94.137 5 .199 3.320 97.457 6
.153
2.543
100.000
表2 Component Matrix(a) 表3 Rotated Component Matrix(a)
5.
(1) 写出变量21,X X 的相关系数阵R 的特征根的特征根 及 621,,,X X X 的方差和;的方差和; (2) 假设用i Y 表示主成分,表示主成分,写出前二个主成分的表达式及写出前二个主成分的表达式及1Y 的贡献率和前两个主成分的累计贡献率并说明累计贡献率的统计意义;累计贡献率并说明累计贡献率的统计意义; (3) 写出旋转后的因子载荷矩阵A 及因子模型;及因子模型;
(4) 求变量math 的共同度2
1
h 及因子2F 的方差贡献2
2
g
,并解释2
1
h
,2
2
g
的统计意义;
(5) 对因子1F ,2F 进行合理的命名和解释。
进行合理的命名和解释。
第八章相应分析
一.判断题
1.相应分析中,行惯量与列惯量相同。
( )
2.对变量进行相应分析时,应首先检验变量之间的独立性,只有当变量不独立时,进行相应分析才有意义。
( )
3.相应分析实际是对两组高维空间的点的二维投影进行分析,相应分析实际是对两组高维空间的点的二维投影进行分析,并且相应分析主要是建立在图并且相应分析主要是建立在图形分析的基础上,因此,相应分析的结果带有一定的主观性。
( ) 二.计算题
1.假定有两个因素B A ,,每个因素各有两个水平,每个因素各有两个水平,随机考察随机考察100个样品,个样品,得到一个二维的列得到一个二维的列
Component
1 2 math -.806 .353 phys -.674 .531
chem -.675 .513
literat .893 .306
history .825 .435
english
.836
.425
Component 1 2 math -.387 .790 phys -.172 .841 chem -.184 .827 literat .879 -.343 history .911 -.201 english
.913
-.216
联表如下,求:联表如下,求:
(1)频率矩阵F ;
(2)因素A 的第一个水平的分布轮廓;的第一个水平的分布轮廓; (3)因素A 两个水平之间的2
c 距离;距离;
(4)检验因素B A ,是否独立。
(050=a ,841.3)1(2
05.0=c )
第九章典型相关分
析
一.判断题
1.典型相关分析是研究多组
变量之间相关关系的一种
多元统计方法。
( )
2.典型相关分析是识别并量化两组变量之间的关系,将两组变量的相关关系的研究转化为一组变量的线性组合与另一组变量的线性组合之间的相关关系的研究。
( )
3.若Y b V X a U ¢=¢=,是两组变量Y X ,的第一对典型相关变量,则V U ,是Y X ,的所有线性组合对中相关系数最大的一对。
( )
4.进行典型相关分析时,若变量的量纲不同时,需要对变量进行标准化或从相关阵出发求典型相关变量;而若变量的单位相同时,则不需要对数据进行标准化,直接分析即可。
( )
5.若r k V U k k ,,2,1,, =是变量Y X ,的典型相关变量,则的典型相关变量,则
r k V D U D k k ,,2,1,1)(,1)( ===,并且j i V V Cov U U Cov j i j i ¹==,0),(),(( )
6. 若r k V U k k ,,2,1,, =是变量Y X ,的典型相关变量,2211,S S 分别是变量Y X ,的方差
阵,12S 是变量Y X ,的协方差阵,r i i ,,2,1,2
=l 是矩阵211
22
12
111
S S
S S
--的特征根,则
(1)r j j i V U Cov r i j i V U Cov j i i j i >¹===¹=或,0),(.,,2,1,,0),( l 。
其中r 为矩
阵211
22
121
11
S S
S S
--的秩。
( )
(2)若2
2
22
1r l l l ³³³ ,则第一典型相关系数为2
1l 。
( )
(3)若22
2
2
1
r l l
l
³³³ ,)1()
1(,b
a
分别为矩阵21
122
12
111
S
S
S S
--,121
11
21
122
S S
S S
--相
应于21
l 的特征向量,则)
2()
1()
1()
1(,X
b X
a
¢¢
即为第一对典型相关变量。
( )
7. 典型相关分析中,分别求出两组变量的第一主成分,两个第一主成分即构成第一对典型
相关变量。
( )
因素
A
因素B
1B 2B
1A 50 20
2A 10 20
8.利用样本对两组变量)
2()
1(,X
X
进行典型相关分析时,即使)
2()
1(,X
X
互不相关,也有可
能得到的典型相关变量的协差阵不为零,因而利用样本数据进行典型相关分析时要对原始变量的协差阵是否为零进行检验。
( ) 9.典型载荷分析是了解每组变量提取的典型变量解释的该组样本总方差的比例,典型载荷分析是了解每组变量提取的典型变量解释的该组样本总方差的比例,从而定量的从而定量的测度典型变量所包含的原始信息量的大小;典型冗余分析是指原始变量与典型变量之间的相关性分析。
( ) 10.对变量进行相应分析时,应首先检验变量之间的独立性,只有当变量不独立时,进行相应分析才有意义。
( )
二.以下是对一对二维变量的典型相关分析的结果,请根据结果回答下列问题。
表1 Canonical Correlations 1 .788 2
.054
表2 Test that remaining correlations are zero
Wilk's Chi-SQ DF Sig.
1 .378 20.930 4.000 .000 2 .997 .062 1.000 .803
表3 Raw Canonical Coefficients for Set-1 表4 Raw Canonical Coefficients for Set-2
1 2 x1 -.057 -.140 x2 -.071 .187
表5 Canonical Loadings for Set-1 表6 Proportion of Variance of Set-1
Explained by Its Own Can. Var.
1 2 x1 -.935 -.354 x2 -.927
.375
(1)写出两对典型相关变量的相关系数;)写出两对典型相关变量的相关系数;
(2)应该选几对典型相关变量,为什么?并写出典型相关变量;)应该选几对典型相关变量,为什么?并写出典型相关变量; (3)1x 与其典型相关变量的相关系数是多少?与其典型相关变量的相关系数是多少?
(4)第一组变量被自身的典型变量解释的方差比例是多少?)第一组变量被自身的典型变量解释的方差比例是多少? 三.简答题
1.针对典型相关分析而言,简述典型变量与典型相关系数的概念。
2.简述典型相关分析中典型载荷分析及典型冗余分析的内容与作用。
第十章多维标度法
一.判断题
1 2 y1 -.051 -.174 y2
-.080
.262
Prop Var CV1-1 .867 CV1-2
.133
1.古典多维标度法中,若距离矩阵D 为欧几里得矩阵,则D 的构图唯一。
的构图唯一。
( )
2.所有的距离矩阵都是欧几里得矩阵。
( )
3.多维标度分析中,若内积距离阵B 的特征根全部大于零,则距离阵D 为欧几里得矩阵。
( ) 二.计算题
1.假设距离矩阵úúúúú
úúû
ùê
êêê
ê
êêë
é=0
10310
23
10
3231
0D ,求D 的拟合构图。
的拟合构图。
2.给定距离阵úúúúú
úû
ùêê
êê
ê
êë
é=0
10
210
2210
12210D ,求它的拟合构造点,并说明它是否是欧式型的。
三.简答题
1.简述古典多维标度分析的思想。
2.2.论述古典多维标度法的求解步骤。
论述古典多维标度法的求解步骤。
论述古典多维标度法的求解步骤。