多元统计分析方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多元统计分析概述
目录
一、引言 (3)
二、多元统计分析方法的研究对象和主要内容 (3)
1.多元统计分析方法的研究对象 (3)
2.多元统计分析方法的主要内容 (3)
三、各种多元统计分析方法 (3)
1.回归分析 (3)
2.判别分析 (6)
3.聚类分析 (8)
4.主成分分析 (10)
5.因子分析 (10)
6. 对应分析方法 (11)
7. 典型相关分析 (11)
四、多元统计分析方法的一般步骤 (12)
五、多元统计分析方法在各个自然领域中的应用 (12)
六、总结 (13)
参考文献 (14)
谢辞 (15)
一、引言
统计分布是用来刻画随机变量特征及规律的重要手段,是进行统计分布的基础和提高。多元统计分析方法则是建立在多元统计分布基础上的一类处理多元统计数据方法的总称,是统计学中的具有丰富理论成果和众多应用方法的重要分支。在本文中,我们将对多元统计分析方法做一个大体的描述,并通过一部分实例来进一步了解多元统计分析方法的具体实现过程。
二、多元统计分析方法的研究对象和主要内容
(一)多元统计分析方法的研究对象
由于大量实际问题都涉及到多个变量,这些变量又是随机变量,所以要讨论多个随机变量的统计规律性。多元统计分析就是讨论多个随机变量理论和统计方法的总称。其内容包括一元统计学中某些方法的直接推广,也包括多个随即便量特有的一些问题,多元统计分析是一类范围很广的理论和方法。
现实生活中,受多个随机变量共同作用和影响的现象大量存在。统计分析中,有两种方法可同时对多个随机变量的观测数据进行有效的分析和研究。一种方法是把多个随机变量分开分析,一次处理一个随机变量,分别进行研究。但是,这样处理忽略了变量之间可能存在的相关性,因此,一般丢失的信息太多,分析的结果不能客观全面的反映整个问题,而且往往也不容易取得好的研究结论。另一种方法是同时对多个随机变量进行研究分析,此即多元统计方法。通过对多个随即便量观测数据的分析,来研究随机变量总的特征、规律以及随机变量之间的相互关系。所以,多元统计分析是研究多个随机变量之间相互依赖关系及内在统计规律的一门统计学科。
(二)多元统计分析方法的主要内容
近年来,随着统计理论研究的不断深入,多元统计分析方法的内容一直在丰富。其中,主要内容包括多元正态总体参数估计、假设检验和常用的多元统计方法。多元正态总体参数估计、假设检验是多元统计推断的核心和基础,而常用的多元统计分析方法则是具体应用。从形式上,常用多元统计分析方法可划分为两类:
一类属于单变量常用的统计方法在多元随机变量情况下的推广和应用,如多元回归分析,典型相关分析等;
另一类是对多元变量本身进行研究所形成的一些特殊方法。如主成分分析,因子分析,聚类分析,判别分析,对应分析等。
三、各种多元统计分析方法
具体来说,常用的多元统计分析方法主要包括:多元回归分析、聚类分析、判别分析、主成分分析、因子分析、对应分析、典型相关分析等。下面我们对各种多元统计分析方法就行分别描述,
(一)回归分析
回归分析是最灵活最常用的统计分析方法之一,它用于分析一个因变量与一个或多个自变量之间的关系。特别是用于:(1)定量的描述和解释相互关系;(2)估测或预测因变量的值。
回归分析方法是在众多的相关变量中,根据实际问题考察其中一个或多个变量与其余变量的依赖关系。如果只要考察一个变量与其余多个变量之间的相互依赖关系,我们称为多元回归问题。若要同时考察多个因变量与多个自变量之间的相互依赖关系,我们称为多因变量的多元回归问题。
多元回归分析是研究因变量Y与m个自变量
12···
m
x x
,,,x的相关关系,而
且总是假设因变量Y 为随机变量,而12···m x x ,,,
x 为一般变量。 下面我们来看一下多元线性回归模型的建立。
假定因变量Y 与12···m x x ,,,
x 线性相关。收集到的n 组数据(12,,,t t t tm y x x x ,)(t=1,2,···n )满足以下回归模型:
{
11022···+(1,2,,)
()0,(),(,)0()~(0,),t t m tm t t t i j t y x x t n E Var Cov i j N βββεεεσεεεσ=+++====≠或相互独立(t=1,2,n).
记
C=11
111(1)1m n n nm x x X x
x ⎛⎫
⎪
= ⎪ ⎪⎝⎭
, 01
1212
,,n m n y y y Y βεβεβεβε⎡⎤⎡⎤⎡⎤===⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦
则所建回归模型的矩阵形式为
{
2()(),
0,,n n Y C E D I εεβεσ=+==
或
{
2,
~(0,),n n Y C N I βεεσ=+
并称它们为经典多元回归模型,其中Y 是可观测的随机向量,ε是不可观测的随机向量,C 是已知矩阵,2βσ,是未知参数,并设n>m ,且rank(C)=m+1。 在经典回归分析中,我们讨论模型中参数01(,,
,)m ββββ'=和2σ的估计和检
验问题。近代回归分析中讨论变量筛选、估计的改进,以及对模型中的一些假设进行诊断等问题。
我国国内生产总值与基本建设投资额的大小有密切关系,研究发现两变量之间存在线性关系。根据甘肃省1990-2003年的国内生产总值与基本建设投资额数据,研究它们的数量规律性,探讨甘肃省基本建设投资额与国内生产总值的数量关系,原始数据见下表。
利用excel进行分析,具体输出以下数据,
平方和自由度方差 F 检验值回归1553189.7 1 1553189.7
残差59475.667 12 4956.3056 313.3765001
离差1612665.4 13
复相关系数R =.981386594345333
剩余标准差SY =70.4010340269248
回归方差与剩余方差之比 F =313.376500123223
各个自变量的t 检验值
17.70244334