(完整word版)实用多元统计分析相关习题

合集下载

(完整版)多元统计分析试题及答案

(完整版)多元统计分析试题及答案

2009学年第2学期 考试科目:多元统计分析 考试类型:(闭卷) 考试时间:100 分钟

学号 姓名 年级专业

一、填空题(5×6=30)

22121212121

~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ

⎛⎫

∑==∑=

⎪⎝⎭

+-1、设其中则Cov(,)=____.

10

31

2~(,),1,,10,()()_________i i i i X N i W X X μμμ='

∑=--∑、设则=服从。

()1

2

34

433,4

92,32

16___________________

X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝

=∑、设随机向量且协方差矩阵则它的相关矩阵

4、

__________, __________,

________________。

215,1,

,16(,),(,)

15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

二、计算题(5×11=50)

(),

123设X=x x x 的相关系数矩阵通过因子分析分解为

211X h =

的共性方差111

X σ

=

的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.4473

0.8350.4470.1032013

R ⎛

- ⎪⎛⎫⎛⎫ ⎪

-⎛⎫ ⎪ ⎪

⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪

(完整版)多元统计分析试题及答案

(完整版)多元统计分析试题及答案

2009学年第2学期 考试科目:多元统计分析 考试类型:(闭卷) 考试时间:100 分钟

学号 姓名 年级专业

一、填空题(5×6=30)

22121212121

~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ

⎛⎫

∑==∑=

⎪⎝⎭

+-1、设其中则Cov(,)=____.

10

31

2~(,),1,,10,()()_________i i i i X N i W X X μμμ='

∑=--∑、设则=服从。

()1

2

34

433,4

92,32

16___________________

X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝

=∑、设随机向量且协方差矩阵则它的相关矩阵

4、

__________, __________,

________________。

215,1,

,16(,),(,)

15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

二、计算题(5×11=50)

(),

123设X=x x x 的相关系数矩阵通过因子分析分解为

211X h =

的共性方差111

X σ

=

的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.4473

0.8350.4470.1032013

R ⎛

- ⎪⎛⎫⎛⎫ ⎪

-⎛⎫ ⎪ ⎪

⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪

《多元统计分析》习题

《多元统计分析》习题

《多元统计分析》习题分为三部分:思考题、验证题和论文题

思考题

第一章绪论

1﹑什么是多元统计分析?

2﹑多元统计分析能解决哪些类型的实际问题?

第二章聚类分析

1﹑简述系统聚类法的基本思路。

2﹑写出样品间相关系数公式。

3﹑常用的距离及相似系数有哪些?它们各有什么特点?

4﹑利用谱系图分类应注意哪些问题?

5﹑在SAS和SPSS中如何实现系统聚类分析?

第三章判别分析

1﹑简述距离判别法的基本思路,图示其几何意义。

2﹑判别分析与聚类分析有何异同?

3﹑简述贝叶斯判别的基本思路。

4﹑简述费歇判别的基本思路。

5﹑简述逐步判别法的基本思想。

6﹑在SAS和SPSS软件中如何实现判别分析?

第四章主成分分析

1﹑主成分分析的几何意义是什么?

2﹑主成分分析的主要作用有那些?

3﹑什么是贡献率和累计贡献率,其意义何在?

4﹑为什么说贡献率和累计贡献率能反映主成分中所包含的原始变量的信息?

5﹑为什么要用标准化数据去估计V的特征向量与特征值?

6﹑证明:对于标准化数据有S=R。

7﹑主成分分析在SAS和SPSS中如何实现?

第五章因子分析

1﹑因子得分模型与主成分分析模型有何不同?

2﹑因子载荷阵的统计意义是什么?

3﹑方差旋转的目的是什么?

4﹑因子分析有何作用?

5﹑因子模型与回归模型有何不同?

6﹑在SAS和SPSS中如何实现因子分析?

第六章对应分析

1﹑简述对应分析的基本思想。

2﹑简述对应分析的基本原理。

3﹑简述因子分析中Q型与R 型的对应关系。

4﹑对应分析如何在SAS和SPSS中实现?

第七章典型相关分析

1﹑典型相关分析适合分析何种类型的数据?

(完整版)多元统计分析试题及答案

(完整版)多元统计分析试题及答案

2009学年第2学期 考试科目:多元统计分析 考试类型:(闭卷) 考试时间:100 分钟

学号 姓名 年级专业

一、填空题(5×6=30)

22121212121

~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ

⎛⎫

∑==∑=

⎪⎝⎭

+-1、设其中则Cov(,)=____.

10

31

2~(,),1,,10,()()_________i i i i X N i W X X μμμ='

∑=--∑、设则=服从。

()1

2

34

433,4

92,32

16___________________

X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝

=∑、设随机向量且协方差矩阵则它的相关矩阵

4、

__________, __________,

________________。

215,1,

,16(,),(,)

15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

二、计算题(5×11=50)

(),

123设X=x x x 的相关系数矩阵通过因子分析分解为

211X h =

的共性方差111

X σ

=

的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.4473

0.8350.4470.1032013

R ⎛

- ⎪⎛⎫⎛⎫ ⎪

-⎛⎫ ⎪ ⎪

⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪

(完整word版)应用多元统计分析习题解答主成分分析

(完整word版)应用多元统计分析习题解答主成分分析

主成分分析

6.1 试述主成分分析的基本思想。

答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。当第一个组合不能提取止。这就是主成分分析的基本思想。

6.2 主成分分析的作用体现在何处?

答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;主成分分析的作用就是在降低数据“维数”

6.3 简述主成分分析中累积贡献率的具体含义。 答:主成分分析把p 个原始变量12,,

,p X X X 的总方差()tr Σ分解成了p 个相互独立的变量p 个主成分的,忽

略一些带有较小方差的主成分将不会给总方差带来太大的影响。这里我们()m p <个主成分,则称

11

p

m

m k

k

k k ψλλ

===∑∑ 为主成分1,

,m Y Y 的累计贡献率,累计贡献率表明1,,m Y Y 综合12,,

,p X X X 的能力。通常

取m ,使得累计贡献率达到一个较高的百分数(如85%以上)。 答:这个说法是正确的。

即原变量方差之和等于新的变量的方差之和

6.5 试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。

答:从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的。从协方差矩阵出发的,其结果受变量单位的影响。主成分倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现得不够,也存在“大数吃小数”的问题。实际表明,这种差异有时很大。我

6.6 已知X =()’的协差阵为 试进行主成分分析。

(完整word版)多元统计分析期末试题及答案

(完整word版)多元统计分析期末试题及答案

22121212121

~(,),(,),(,),,

1X N X x x x x x x ρμμμμσρ

⎛⎫

∑==∑=

⎪⎝⎭

+-1、设其中则Cov(,)=____.

10

31

2~(,),1,,10,()()_________i i i i X N i W X X μμμ='

∑=--∑L 、设则=服从。

()1

2

34

433,4

92,32

16___________________

X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝

=∑、设随机向量且协方差矩阵则它的相关矩阵

4、

__________, __________,

________________。

215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--L 、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

12332313116421(,,)~(,),(1,0,2),441,

2142X x x x N x x x x x μμ-⎛⎫

⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭

-⎛⎫

+ ⎪⎝⎭

、设其中试判断与是否独立?

(),

1

2

3设X=x x x 的相关系数矩阵通过因子分析分解为

211X h =

的共性方差111X σ=

的方差21X g =

1公因子f 对的贡献1213

30.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.10320

13

R ⎛

- ⎪⎛⎫⎛⎫

(完整word版)多元统计分析模拟试题

(完整word版)多元统计分析模拟试题

(完整word版)多元统计分析模拟试题

多元统计分析模拟试题(两套:每套含填空、判断各二十道)

A卷

1)判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐步

判别法。

2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类。

3)主成分分析中可以利用协方差矩阵和相关矩阵求解主成分。

4)因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、极

大似然法

5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析

6)分组数据的Logistic回归存在异方差性,需要采用加权最小二乘估计

7)误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为

P e=√1?R2

8)最短距离法适用于条形的类,最长距离法适用于椭圆形的类。

9)主成分分析是利用降维的思想,在损失很少的信息前提下,把多个指标转化

为几个综合指标的多元统计方法。

10)在进行主成分分析时,我们认为所取的m(m<p,p为所有的主成分)个主成< p="">

分的累积贡献率达到85%以上比较合适。

11)聚类分析的目的在于使类内对象的同质性最大化和类间对象的异质性最大

12)y1是随机变量,并且有y1~N(0,1),那么y12服从(卡方)分布。

13)在对数线性模型中,要先将概率取对数,再分解处理,公式:ηij=lnp ij=

,i,j=1,2

lnp i+lnp.j+ln p ij

p j p i

14)将每个原始变量分解为两部分因素,一部分是由所有变量共同具有的少数几

个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子

应用多元统计分析试题及答案

应用多元统计分析试题及答案

一、填空题:

1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.

2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.

3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型聚类和

R型聚类。

4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。

5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。

6、若

()

(,), P

x N αμα

∑=1,2,3….n且相互独立,则样本均值向量x服从的分布

为_x~N(μ,Σ/n)_。

二、简答

1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。

2、简述相应分析的基本思想。

相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因素A和行因素B 的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情

况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A 、B 的联系。 3、简述费希尔判别法的基本思想。

实用多元统计分析相关习题学习资料

实用多元统计分析相关习题学习资料

实用多元统计分析

相关习题

练习题

一、填空题

1.人们通过各种实践,发现变量之间的相互关系可以分成(相关)和(不相关)两种类型。多元统计中常用的统计量有:样本均值、样本方差、样本协方差和样本相关系数。2.总离差平方和可以分解为(回归离差平方和)和(剩余离差平方和)两个部分,其中(回归离差平方和)在总离差平方和中所占比重越大,则线性回归效果越显著。3.回归方程显著性检验时通常采用的统计量是(S R/p)/[S E/(n-p-1)]。

4.偏相关系数是指多元回归分析中,(当其他变量固定时,给定的两个变量之间的)的相关系数。

5.Spss中回归方程的建模方法有(一元线性回归、多元线性回归、岭回归、多对多线性回归)等。

6.主成分分析是通过适当的变量替换,使新变量成为原变量的(线性组合),并寻求(降维)的一种方法。

7.主成分分析的基本思想是(设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来替代原来的指标)。

8.主成分表达式的系数向量是(相关系数矩阵)的特征向量。

9.样本主成分的总方差等于(1)。

10.在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为(方差贡献度)。主成分的协方差矩阵为(对称)矩阵。主成分表达式的系数向量是(相关矩阵特征值)的特征向量。

11.SPSS中主成分分析采用(analyze—data reduction—facyor)命令过程。12.因子分析是把每个原始变量分解为两部分因素,一部分是(公共因子),另一部分为(特殊因子)。

13.变量共同度是指因子载荷矩阵中(第i行元素的平方和)。

(完整word版)应用多元统计分析试题及答案

(完整word版)应用多元统计分析试题及答案

一、填空题:

1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法。

2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.

3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。

4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。

5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。

6、若

()

(,), P

x N αμα

∑=1,2,3….n且相互独立,则样本均值向量x服从的分布为_x~

N(μ,Σ/n)_。

二、简答

1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想.

在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。

2、简述相应分析的基本思想。

相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为 .要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况.把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。

应用多元统计分析试题及答案

应用多元统计分析试题及答案

一、填空题:

1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.

2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.

3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。

4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。

5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。

6、若

()

(,), P

x N αμα

∑=1,2,3….n且相互独立,则样本均值向量x服从的分布

为_x~N(μ,Σ/n)_。

二、简答

1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。

在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。

2、简述相应分析的基本思想。

相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素 A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。

(完整版)多元统计分析试题及答案

(完整版)多元统计分析试题及答案

2009学年第2学期 考试科目:多元统计分析 考试类型:(闭卷) 考试时间:100 分钟

学号 姓名 年级专业

一、填空题(5×6=30)

22121212121

~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ

⎛⎫

∑==∑=

⎪⎝⎭

+-1、设其中则Cov(,)=____.

10

31

2~(,),1,,10,()()_________i i i i X N i W X X μμμ='

∑=--∑、设则=服从。

()1

2

34

433,4

92,32

16___________________

X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝

=∑、设随机向量且协方差矩阵则它的相关矩阵

4、

__________, __________,

________________。

215,1,

,16(,),(,)

15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

二、计算题(5×11=50)

(),

123设X=x x x 的相关系数矩阵通过因子分析分解为

211X h =

的共性方差111

X σ

=

的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.4473

0.8350.4470.1032013

R ⎛

- ⎪⎛⎫⎛⎫ ⎪

-⎛⎫ ⎪ ⎪

⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪

应用多元统计分析试题及答案

应用多元统计分析试题及答案

一、填空题:

1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.

2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.

3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。

4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。

5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。

6、若

()

(,), P

x N αμα

∑=1,2,3….n且相互独立,则样本均值向量x服从的分布

为_x~N(μ,Σ/n)_。

二、简答

1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。

在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。

2、简述相应分析的基本思想。

相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素 A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。

应用多元统计分析试题及答案

应用多元统计分析试题及答案

一、填空题:

1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.

2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.

3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。

4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。

5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。

6、若

()

(,), P

x N αμα

∑=1,2,3….n且相互独立,则样本均值向量x服从的分布

为_x~N(μ,Σ/n)_。

二、简答

1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。

在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。

2、简述相应分析的基本思想。

相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素 A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。

(完整word版)多元统计分析习题

(完整word版)多元统计分析习题

1.已知n=4,p=3的一个样本数据阵

143X =626,X S 833534ρ

⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥

⎢⎥⎣⎦

计算,,v,

2.已知2

35142

411

300103

2

2X ⎡⎤⎢⎥⎢⎥⎢⎥=⎢

⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦

,用最短、最长、中间距离法聚类,并画出聚类树形图

3.已知52=22⎡⎤

∑⎢⎥⎣⎦

,要求: ①求特征根1

2λλ, ②求特征向量12μμ,

③构造主成分

12

,F F

④计算1F 的方差Var(F 1)和2F 的方差Var(F 2)

⑤计算()()()()111221

22,,,,;;;F X F X F X F X ρρρρ

4.设有12,G G 两个总体,从中分别抽取容量为3的样品如下:

要求:(1)样本的均值向量()

()12

,X

X 及离差阵12,S S

(2)假定()()1

2

==∑∑∑,用12,S S 联合估计∑

(3)已知待判样品(27)X T

=,分别用距离判别法、Fisher 判别

法、Bayes 判别法判定X 的归属。

5.设111=n 个和122=n 个的观测值分别取自两个随机变量1X 和

2X 。假定这两个变量服从二元正态分布,且有相同的协方差阵。

样本均值向量和联合协方差阵为:

⎥⎦⎤

⎢⎣⎡--=111X ,⎥⎦⎤⎢⎣⎡=122X ,⎥⎦⎤⎢⎣⎡--=∑8.41.11.13.7。新样品⎥⎦

⎤⎢⎣⎡=21X ,

要求用Bayes 法和Fisher 进行判别分析。

6.已知2变量协方差阵⎥⎦

⎣⎡=∑3224

,要求:(1)求∑的特征根及其对应的单位特征向量;(2)组建主成分1F 、2F ;(3)验证

应用多元统计分析试题及答案

应用多元统计分析试题及答案

一、填空题:

1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.

2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.

3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。

4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。

5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。

6、若

()

(,), P

x N αμα

∑=1,2,3….n且相互独立,则样本均值向量x服从的分布

为_x~N(μ,Σ/n)_。

二、简答

1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。

在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。

2、简述相应分析的基本思想。

相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素 A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

练习题

一、填空题

1.人们通过各种实践,发现变量之间的相互关系可以分成(相关)和(不相关)两种类型。多元统计中常用的统计量有:样本均值、样本方差、样本协方差和样本相关系数。

2.总离差平方和可以分解为(回归离差平方和)和(剩余离差平方和)两个部分,其中(回归离差平方和)在总离差平方和中所占比重越大,则线性回归效果越显著。3.回归方程显著性检验时通常采用的统计量是(S R/p)/[S E/(n-p-1)]。

4.偏相关系数是指多元回归分析中,(当其他变量固定时,给定的两个变量之间的)的相关系数。

5.Spss中回归方程的建模方法有(一元线性回归、多元线性回归、岭回归、多对多线性回归)等。

6.主成分分析是通过适当的变量替换,使新变量成为原变量的(线性组合),并寻求(降维)的一种方法。

7.主成分分析的基本思想是(设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来替代原来的指标)。

8.主成分表达式的系数向量是(相关系数矩阵)的特征向量。

9.样本主成分的总方差等于(1)。

10.在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为(方差贡献度)。主成分的协方差矩阵为(对称)矩阵。主成分表达式的系数向量是(相关矩阵特征值)的特征向量。

11.SPSS中主成分分析采用(analyze—data reduction—facyor)命令过程。

12.因子分析是把每个原始变量分解为两部分因素,一部分是(公共因子),另一部分为(特殊因子)。

13.变量共同度是指因子载荷矩阵中(第i行元素的平方和)。

14.公共因子方差与特殊因子方差之和为(1)。

15.聚类分析是建立一种分类方法,它将一批样品或变量按照它们在性质上的(亲疏程度)进行科学的分类。

16.Q型聚类法是按(样品)进行聚类,R型聚类法是按(变量)进行聚类。

17.Q型聚类统计量是(距离),而R型聚类统计量通常采用(相关系数)。

18.六种Q型聚类方法分别为(最长距离法)、(最短距离法)、(中间距离法)、(类平均法)、(重心法)、(离差平方和法)。

19.快速聚类在SPSS中由(k-均值聚类(analyze—classify—k means cluster))过程实现。

20.判别分析是要解决在研究对象已(已分成若干类)的情况下,确定新的观测数据属于已知类别中哪一类的多元统计方法。

21.用判别分析方法处理问题时,通常以(判别函数)作为衡量新样本点与各已知组别接近程度的指标。

22.进行判别分析时,通常指定一种判别规则,用来判定新样本的归属,常见的判别准则有(Fisher准则)、(贝叶斯准则)。

23.类内样本点接近,类间样本点疏远的性质,可以通过(类与类之间的距离)与(类内样本的距离)的大小差异表现出来,而两者的比值能把不同的类区别开来。这个比值越大,说明类与类间的差异越(类与类之间的距离越大),分类效果越(好)。24.Fisher判别法就是要找一个由p个变量组成的(线性判别函数),使得各自组内点的

(离差)尽可能接近,而不同组间点的尽可能疏远。 二、简答题

1、简述复相关系数与偏相关系数。

答:复相关系数:又叫多重相关系数。复相关是指因变量与多个自变量之间的相关关系。例如,某种商品的需求量与其价格水平、职工收入水平等现象之间呈现复相关关系。

偏相关系数:又叫部分相关系数。部分相关系数反映校正其它变量后某一变量与另一变量的相关关系。偏相关系数是指多元回归分析中,当其他变量固定后,给定的两个变量之间的的相关系数。 偏相关系数的假设检验等同于偏回归系数的t 检验。 复相关系数的假设检验等同于回归方程的方差分析。

2、简述逐步回归分析方法的具体实施步骤。 答:逐步回归过程如下:

1)自变量的剔除;

2)重新进行少一个自变量的多元线性回归分析; 3)重新进行多一个自变量的多元线性回归分析;

4)重新进行上述步骤,直至无法再删除和再引入自变量为止。

3、提取样本主成分的原则。

答:主成分个数提取原则为主成分对应的特征值大于1的前m 个主成分。特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此,一般可以用特征值大于1作为纳入标准。

4、简述系统聚类法的基本思想及主要步骤。

答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。 系统聚类过程是:假设总共有n 个样品(或变量),第一步将每个样品(或变量)独自聚成一类,共有n 类;第二步根据所确定的样品(或变量)“距离”公式,把距离较近的两个样品(或变量)聚合为一类,其它的样品(或变量)仍各自聚为一类,共聚成n 1类;第三步将“距离”最近的两个类进一步聚成一类,共聚成n 2类;……,以上步骤一直进行下去,最后将所有的样品(或变量)全聚成一类,也简称聚集法。还有与以上方法相反的称分解法。

5、简述快速聚类(k —均值聚类)的基本思想及主要步骤。

答:基本思想:1.一个样品分配给最近中心(均值)的类中,将所有样品分成k 个初始类。2.通过欧式距离将每个样品划入离中心最近的类中,并对得到样品或失去样品的类重新计算中心坐标。3.重复步骤2,直到所有样品都不能再分配时为止。

6、判别分析的分类。

答:判别分析是多元统计分析中用于判别样本所属类型的一种统计分析方法。

判别分析按判别的组数来分,有两组判别分析和多组判别分析;按区分不同总体所用的数学模型来分,有线性判别和非线性判别;按判别对所处理的变量方法不同,有逐步判别、序贯判别等;按判别准则不同,有距离判别、贝叶斯判别(Bayes )、费歇(Fisher )判别等。

7、简述Fisher 判别规则及具体判别步骤。

答:Fisher 判别法的基本思想:从多个总体(类)抽取一定的样本,借助方差分析的思想,建立p 个指标的线性判别函数,把待判样品代入线性判别函数,然后与临界值比较,就可判样品属于哪个类。

Fisher 判别法的具体算法步骤:由Fisher 线性判别式

()M M S 211

*-=

-ωω求解向量ω*的步骤:

① 把来自两类ωω21

训练样本集X 分成ω1和ω2两个子集X1和X2。

相关文档
最新文档