复试问题(多元统计分析)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、 多元统计分析(人大-何晓群第三版)

1. 马氏距离与欧氏距离的比较。

是否考虑了总体的方差(分散性)

2.

21()'()d X X μμ-=-∑-的三种解释。 3. 聚类分析的思想。

4. 判别分析的思想、应用条件及假设。

当被解释变量是属性变量而解释变量是度量变量时,判别分析是合适的统计分析方法。

把这类问题用数学语言来表达,可以叙述如下:设有n 个样本,对每个样本测得p 项指标(变量)的数据,已知每个样本属于k 个类别(或总体)G1,G2, …,Gk 中的某一类,且它们的分布函数分别为F1(x),F2(x), …,Fk(x)。我们希望利用这些数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来,并对测得同样p 项指标(变量)数据的一个新样本,能判定这个样本归属于哪一类。

应用条件:(1)分组类型在两组以上;(2)每组案例的规模必须至少在一个以上;(3)解释变量必须是可测量的,才能够计算其平均值和方差,使其能够应用于同积函数。

假设:(1)每一个判别变量(解释变量)不能使其他解释变量的线性组合。

(2)各组变量的协方差矩阵相等。

(3)各判别变量之间具有多元正态分布。

5. 距离判别和贝叶斯判别的思想和关系。

距离判别法:样品离哪个总体距离最近,就判它为哪个总体。只要求知道总体均值和协方差阵,不涉及总体分布类型,简单实用,不过没考虑各总体出现的机会大小(先验概率)和错判造成的损失。

贝叶斯思想:假定对研究的对象已经有一定的认识,常用先验概率分布来描述这个认识,然后我们取得一个样本,用样本来修正已有的认识(先验概率分布),得到后验概率分布,各种统计推断都通过后验概率分布来进行。

将贝叶斯思想用于判别分析就得到了贝叶斯判别。

距离判别只要求知道总体的数字特征,不涉及总体的分布函数,当参数未知和协方差时,就用样本的均值和协方差矩阵来估计。距离判别方法简单实用,但没有考虑到每个总体出现的机会大小,即先验概率,没有考虑到错判的损失。贝叶斯判别法正是为了解决这两个问题提出的判别分析方法。

6. 费希尔判别的思想。

Fisher 判别的思想是投影,将k 组p 维投影到某一个方向,使得他们的投影组与组之间尽可能的分开(怎么衡量呢?)。————>一元方差分析的思想。

7. 逐步判别的思想。

答:什么叫判别分析方法?逐步筛选变量使得判别函数中仅保留判别能力显著的变量。与逐步回归法类似,即逐个引入变量,每次引入一个判别能力最强的变量,然后对判别式中的老变量逐个检验,剔除不再显著的变量,如此下去,直至不能再剔除也不能再引入为止。

8. 判别分析和聚类分析的联系与区别。

9.判别分析的过程。(P95)

10.系统聚类法的过程(P66)

11.主成分分析的基本思想。(fan笔记)

答:关键词:

12.主成分的性质。(fan笔记)

13.主成分分析中应注意的问题。(fan笔记)

14.主成分与原始变量之间的关系。

15.主成分分析的步骤。(P128)

16.因子分析的思想。(fan笔记)

17.因子分析模型的解释。(fan笔记)

18.因子分析中的因子载荷、主成分分析中的因子负荷的区别和联系。

19.主成分分析和因子分析的异同。(P152+fan笔记)

20.因子分析求解时主成分法的缺点。

21.因子旋转的目的。

22.对应分析的思想。

23.典型相关分析的思想。(P197)

典型相关分析(canonical correlation analysis)是研究两组变量之间相关关系的多元分析方法。它借用主成分析降维的思想,分别对两组变量提取主成分,且使从两组变量提取的主成分之间的相关程度达到最大,而从同一组内部提取的各主成分之间互不相关,用从两组之间分别提取的主成分的相关性来描述两组变量整体的线性相关关系。

典型相关分析的思想首先由Hotelling于1936年提出,计算机的发展解决了典型相关分析在应用中计算方面的困难,目前成为普遍应用的进行两组变量之间相关性分析的技术。本章主要介绍典型相关分析的思想,基本理论及分析方法,并介绍利用SPSS软件进行典型相关分析的方法。

典型相关分析研究两组变量之间整体的线性相关关系,它是将每一组变量作为一个整体来进行研究而不是分析每一组变量内部的各个变量。所研究的两组变量可以是一组变量是自变量,而另一组变量是因变量的情况,两组变量也可以处于同等的地位,但典型相关分析要求两组变量都至少是间隔尺度的。

典型相关分析是借助于主成分分析的思想,对每一组变量分别寻找线性组合,使生成的新的综合变量能代表原始变量大部分的信息,同时,与由另一组变量生成的新的综合变量的相关程度最大,这样一组新的综合变量称为第一对典型相关变量,同样的方法可以找到第二对,第三对,…,使得各对典型相关变量之间互不相关,典型相关变量之间的简单相关系数称为典型相关系数,典型相关分析就是用典型相关系数衡量两组变量之间的相关性。

相关文档
最新文档