多元统计分析重点

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多元统计分析重点宿舍版

第一讲:多元统计方法及应用;多元统计方法分类(按变量、模型、因变量等) 多元统计分析应用

选择题:①数据或结构性简化运用的方法有:多元回归分析,聚类分析,主成分分析,因子分析 ②分类和组合运用的方法有:判别分析,聚类分析,主成分分析 ③变量之间的相关关系运用的方法有:多元回归,主成分分析,因子分析, ④预测与决策运用的方法有:多元回归,判别分析,聚类分析 ⑤横贯数据:{因果模型(因变量数):多元回归,判别分析相依模型(变量测度):因子分析,聚类分析

多元统计分析方法

选择题:①多元统计方法的分类:1)按测量数据的来源分为:横贯数据(同一时间不同案例的观测数据),纵观数据(同样案例在不同时间的多次观测数据) 2)按变量的测度等级(数据类型)分为:类别(非测量型)变量,数值型(测量型)变量

3)按分析模型的属性分为:因果模型,相依模型 4)按模型中因变量的数量分为:单因变量模型,多因变量模型,多层因果模型

第二讲:计算均值、协差阵、相关阵;相互独立性

第三讲:主成分定义、应用及基本思想,主成分性质,主成分分析步骤

主成分定义:何谓主成分分析 就是将原来的多个指标(变量)线性组合成几个新的相互无关的综合指标(主成分),并使新的综合指标尽可能多地反映原来的指标信息。

主成分分析的应用 :(1)数据的压缩、结构的简化;(2)样品的综合评价,排序

主成分分析概述——思想:①(1)把给定的一组变量X1,X2,…XP,通过线性变换,转换为一组不相关的变量Y1,Y2,…YP 。(2)在这种变换中,保持变量的总方差(X1,X2,…Xp 的方差之和)不变,同时,使Y1具有最大方差,称为第一主成分;Y2具有次大方差,称为第二主成分。依次类推,原来有P 个变量,就可以转换出P 个主成分(3)在实际应用中,为了简化问题,通常找能够反映原来P 个变量的绝大部分

方差的q (q

主成分性质:1)性质1:主成分的协方差矩阵是对角阵:(2)性质2:主成分的总方差等于原始变量的总方差(3)性质3:主成分Yk 与原始变量Xi 的相关系数为:

ρ(YK,Xi )=√

λ√σii

tki,并称之为因子负荷量(或因子载荷量)。

主成分分析的具体步骤:①将原始数据标准化;②建立变量的相关系数阵;③求的特征根为**

10p λλ≥

≥≥,相应的特征向量为***12,,,p T T T ;④由累积方差贡献率确

定主成分的个数(m ),并写出主成分为**()i i Y T '=X ,1,2,

,i m =

第四讲:因子分析定义,因子载荷统计意义,因子分析模型及假设,因子旋转

因子分析定义:因子分析就是通过对多个变量的相关系数矩阵的研究,找出同时影响或支配所有变量的共性因子的多元统计方法。

因子载荷统计意义: 1.因子载荷

ij

a 的统计意义

对于因子模型

1122i i i ij j im m i

X a F a F a F a F ε=++

++++ 1,2,,i p =

我们可以得到,

i

X 与

j

F 的协方差为:

1

Cov(,)Cov(,)

m

i j ik k i j k X F a F F ε==+∑

=1

Cov(,)Cov(,)

m

ik k j i j k a F F F ε=+∑

=

ij

a

如果对

i

X 作了标准化处理,

i

X 的标准差为1,且

j

F 的标准差为1,因此

,Cov(,)Cov(,)i j X F i j ij

X F r X F a =

== (7.6)

那么,从上面的分析,我们知道对于标准化后的i

X ,

ij

a 是

i

X 与

j

F 的相关系数,它

一方面表示i

X 对

j

F 的依赖程度,绝对值越大,密切程度越高;另一方面也反映了

变量

i

X 对公共因子

j

F 的相对重要性。了解这一点对我们理解抽象的因子含义有非

常重要的作用。 2.变量共同度

2

i h 的统计意义

设因子载荷矩阵为A ,称第i 行元素的平方和,即

22

11,2,,m

i

ij j h a i p

===∑ (7.7)

为变量

i

X 的共同度。

由因子模型,知

22

2

1122()()()()()

i i i im m i D X a D F a D F a D F D ε=++++

222

12()

i i im i a a a D ε=++

++

22

i i h σ=+ (7.8)

这里应该注意,(7.8)式说明变量i

X 的方差由两部分组成:第一部分为共同度

2

i h ,

它描述了全部公共因子对变量

i

X 的总方差所作的贡献,反映了公共因子对变量

i

X 的影响程度。第二部分为特殊因子i ε对变量i X 的方差的贡献,通常称为个性方差。

如果对

i

X 作了标准化处理,有

22

1i i h σ=+ (7.9) 3、公因子

j

F 的方差贡献

2j

g 的统计意义

设因子载荷矩阵为A ,称第j 列元素的平方和,即

22

11,2,,p

j

ij i g a j m

===∑

为公共因子

j

F 对X 的贡献,即

2j

g 表示同一公共因子

j

F 对各变量所提供的方差贡献

之总和,它是衡量每一个公共因子相对重要性的一个尺度。

相关文档
最新文档