多元统计复习题-题干

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

因子分析复习题

1.试述因子分析与主成分分析的联系与区别。

区别

主成分分析:以原变量的线性组合将原变量组合成少数几个主成分。

因子分析:将原变量分解成几个公因子的线性组合,从而更好地理解原变量的内在关系。

两者的分析重点不一致

C=AX

主成分为原始变量线性组合,重点在综合原始变量信息。

X=LF+e

原始变量为公因子与特殊因子线性组合,公因子重点反映支配原始变量的不可观测的潜在因素。

联系

主成分分析:数据降维(多项变少项)

因子分析是通过主成分推导而来。

两者的分析重点不一致

C=AX

主成分为原始变量线性组合,重点在综合原始变量信息。

X=LF+e

原始变量为公因子与特殊因子线性组合,公因子重点反映支配原始变量的不可观测的潜在因素。

2.因子分析主要可应用于哪些方面?

因子分析:将原变量分解成几个公因子的线性组合,从而更好地理解原变量的内在关系。

用途:心理学、社会学和经济学。

作用:分类、从显在变量里探索不可直接观察的公共因子

3.简述因子模型错误!未找到引用源。中载荷矩阵L的统计

意义。

4.在进行因子分析时,为什么要进行因子旋转?正交旋转

(最大方差因子旋转)的基本思路是什么?

因子旋转

•使得每一个变量在某一个因子上负荷尽量大

而在其他因子上负荷尽量小——varimax!

•所有因子保持不相关——互相垂直

•旋转后共性方差不变

5. 设某客观现象可用X=(错误!未找到引用源。)’来描述,在因子分析时,从约相关阵出发计算出特征值为错误!未找到引用源。由于错误!未找到引用源。,所以找前两个特征值所对应的公共因子即可,又知错误!未找到引用源。对应的正则化特征向量分别为(0.707,-0.316,0.632)’及(0,0.899,0.4470)’,要求:

(1)计算因子载荷矩阵A,并建立因子模型。

(2)计算共同度错误!未找到引用源。。

(3)计算第一公因子对X的“贡献”。

6.评价我国35个中心城市的综合发展水平,选取反映城市综合发展水平的12个指标如下:非农业人口数(万人)、工业总产值(万元)、货运总量(万吨)、批发零售住宿餐饮业从业人数(万人)、地方政府预算内收入(万元)、城乡居民年底储蓄余额(万元)、在岗职工人数(万人)、在岗职工工资总额(万元)、人均居住面积(平方米)、每万人拥有公共汽车数(辆)、人均拥有铺装道路面积(平方米)、人均公共绿地面积(平方米)。下面基于相关矩阵对所得数据进行因子分析,结果如下。

表1 Descriptive Statistics

表2 KMO and Bartlett's Test

表3 Rotated Component Matrix

求:1、写出正交因子模型;

2、根据上述运算结果,试填写下表(3分)

3、解释共同度及累积贡献率的含义,并计算前三个公因子的累积贡献率;

4、请说明表2的作用,并对结果做出评价;

5、请解释三个旋转公因子的含义。

判别分析

1、试述判别分析的实质。

判别分析是用于判别样品所属类型的一种统计分析方法, 是在已知历史上的某些方法已把研究对象分成若干类的情况下,根据判别函数对未知所属类别的事物

进行分类的一种分析方法。

2、简述贝叶斯判别法的基本思想和方法。

基本思想(错分率*损失)

假定:g个总体服从多元正态分布。

错分概率:j类个体被分到i类记为P(i,j),

损失:错分造成的损失C(i|j)。

方法:(g个类别,p个指标)

Bayes判别准则:平均而言,总的错分损失最小。

3、简述费希尔判别法的基本思想和方法。

基本思想:(使组间方差比组内方差最大化)即重叠部分最小

方法:

两类组间判别:

多类组间判别

找一个方向(变量的线性组合),使得多组个体在此方向上投影之间的重叠部分尽可能少。

变量数目g个,可以有g-1个判别函数

阈值:根据专业知识确定

与两组判别相比,多组之间的判别常常效率不高。

4、试析贝叶斯判别法和费希尔判别法的异同。

Fisher 判别的分数是尽可能拉开各组个体间的相对距离,贝叶斯判别是比较属于各类的概率,按照最大的概率来做判断。

对于两类间判别,费雪判别和贝叶斯判别是等价的,两个贝叶斯分类函数之差与得费雪判别函数相当。

5、 收集了22例某病患者的三个指标(X1,X2,X3)的资

料列于下表,其中前期患者(A )类12例,晚期患者(B )类10例。试作判别分析。

(1) 计算变量的类均数及类间均值差Dj ,计算结果列于表2。

表2 变量的均数及类间均值差

(2) 计算合并协方差矩阵:

类别 例数 1X 2X 3X A

12 -3 4 -1 B

10

4 -

5 1 类间均值差j D

-7

9

-2

6、 观察131例糖尿病患者,要求其患眼无其他明显眼前段

疾患, 眼底无明显其他视网膜 疾病和视神经、葡萄膜等疾患,测定了他们的以上各指标值,并根据统一标准诊断其疾患类型,记分类指标名为group 。(表中仅列出前5例)。试以此为训练样本, 仅取age,vision,at,bv 和qpv 5项指标, 求分类函数, 并根据王××的信息:

解此正规方程得

070.01-=C ,225.02=C ,318.03-=C

判别函数为

1230.0700.2250.318y X X X =-+-。

逐例计算判别函数值i y 列于表1中的Y 列,同 时计算出 1.428A y =、 1.722B y =-与总均数0.004y =-。

相关文档
最新文档