袁卫《统计学》笔记和典型题(含历年真题)详解 第6章~第7章【圣才出品】
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 / 100
圣才电子书
①计算各误差平方和
十万种考研考证电子书、题库视频学习平台
a.总误差平方和 SST
SST 是全部数据总误差程度的度量,它反映了自变量和残差变量的共同影响。其计算公
式为:
k ni
SST
(xij x )2
i1 j1
b.水平项误差平方和(组间平方和)SSA
观测值
因素(i)
(j)
A1
A2
…
Ak
1
x11
x21
…
xk1
2
x12
x22
…
xk2
n
x1n
x2n
…
xkn
其中,A 表示因素,因素的 k 个水平(总体)分别用 A1,A2,…,Ak 表示,每个观测
值用 xij ( i =1,2,…,k;j=1,2,…,n)表示,即 xij 表示第 i 个水平(总体)的第 j 个
SSA 是对随机误差和系统误差的大小的度量,它反映了自变量对因变量的影响,也称
为自变量效应或因子效应。其计算公式为:
k
SSA ni (xi x )2 i 1
c.误差项平方和(组内平方和、残差平方和)SSE
SSE 是对随机误差的大小的度量,它反映了除自变量对因变量的影响之外,其他因素对
因变量的总影响。其计算公式为:
1 / 100
圣才电子书 十万种考研考证电子书、题库视频学习平台
二、单因素方差分析
当方差分析中只涉及一个分类型自变量时,称为单因素方差分析。它所研究的是一个分
类型自变量对一个数值型因变量的影响。
1.数据结构
单因素方差分析的数据结构,如表 6-1 所示。
表 6-1 单因素方差分析的数据结构
3.方差分析中的多重比较
多重比较方法(例如最小显著差异方法)是通过对总体均值之间的配对比较来进一步检
验到底哪些均值之间存在差异。最小显著差异方法(LSD)是由费希尔提出的,其进行检验
的具体步骤为:
(1)提出假设:H0:μi=μj,H1:μi≠μj;
(2)计算检验统计量: xi x j ;
(3)计算 LSD,其公式为:
k ni
SSE 的关系为:
SST= SSA+ SSE
②计算统计量
均方:由于各误差平方和的大小与观测值的多少有关,为了消除观测值多少对误差平方
和大小的影响,需要将其平均,也就是用各平方和除以它们所对应的自由度。
三个平方和所对应的自由度分别为:
SST 的自由度为 n-1,其中 n 为全部观测值的个数;SSA 的自由度为 k-1,其中 k
圣才电子书
十万种考研考证电子书、题库视频学习平台
第 6 章 方差分析
6.1 复习笔记
一、方差分析引论 1.方差分析及其有关术语 方差分析是检验多个总体均值是否相等的统计方法。它是通过检验各总体的均值是否相 等来判断分类型自变量对数值型因变量是否有显著影响。 在方差分析中,所要检验的对象称为因素或因子;因素的不同表现称为水平或处理;每 个因子水平下得到的样本数据称为观测值。 2.方差分析的基本思想和原理 组内误差:来自水平内部的数据误差。它反映了一个样本内部数据的离散程度,只含有 随机误差。 组间误差:来自不同水平之间的数据误差。这种差异可能是由于抽样本身形成的随机误 差,也可能是由于行业本身的系统性因素造成的系统误差。因此,组间误差是随机误差和系 统误差的总和,它反映了不同样本之间数据的离散程度。 3.方差分析中的基本假定 (1)每个总体都应服从正态分布,即对于因素的每一个水平,其观测值是来自正态分 布总体的简单随机样本。 (2)各个总体的方差σ2 必须相同,即对于各组观察数据,是从具有相同方差的正态总 体中抽取的。 (3)观测值是独立的。
观测值。从不同水平中所抽取的样本量可以相等,也可以不相等。
2.分析步骤
(1)提出假设
检验因素的 k 个水平(总体)的均值是否相等,需要提出假设为:
H0: 1 2 … i … k
自变量对因变量没有显著影响
H1:μi( i =1,2,…,k)不全相等
自变量对因变量有显著影响
(2)构造检验的统计量
3 / 100
圣才电子书 十万种考研考证电子书、题库视频学习平台
为因素水平(总体)的个数;SSE 的自由度为 n-k。
SSA 的均方(组间均方)MSA 为:
MSA
组间平方和 =
SSA
自由度 k 1
SSE 的均方(组内均方)MSE 为:
MSE
组内平方和 =
SSE
自由度 n k
LSD t / 2 (n k )
MSE
1 ni
1 nj
式中,k 是因素中水平的个数;MSE 为组内方差;ni 和 nj 分别是第 i 个样本和第 j 个样
本的样本量。
(4)根据显著性水平 作出决策:如果| xi x j |>LSD,则拒绝 H0;如果| xi x j | <LSD,则不能拒绝 H0。
将 MSA 和 MSE 进行对比,即得到所需要的检验统计量 F。当 H0 为真时,二者的比值 服从分子自由度为 k-1、分母自由度为 n-k 的 F 分布,即
F MSA F k 1,n k
MSE
(3)统计决策
若 F> F (k-1,n-k),则拒绝原假设 H0,表明 i ( i =1,2,…,k)之间的差异
三、双因素方差分析 1.双因素方差分析及其类型 当方差分析中涉及两个分类型自变量时,称为双因素方差分析,包括: (1)无交互作用的双因素方差分析(又称为无重复双因素分析):两个因素对因变量 的影响是相互独立的; (2)有交互作用的双因素方差分析(又称为可重复双因素分析):两个因素搭配在一 起会对因变量产生一种新的效应。 2.无交互作用的双因素方差分析
是显著的,即所检验的因素对观测值有显著影响。
若 F< F (k-1,n-k),则不拒绝原假设 H0,没有证据表明 i ( i =1,2,…,k)
之间有显著差异,即这时还不能认为所检验的因素对观测值有显著影响。
(4)方差分析表(如表 6-2 所示)
表 6-2 方差分析表的一般形式
误差来源
平方和 SS
自由度 df 均方 MS F 值
P 值 F 临界值
组间(因素影响)
SSA
k-1
MSA
MSA/MSE
组内(误差)
SSE
n-k
MSE
总和
SST
n-1
在进行决策时,可以直接利用方差分析表中的 P 值与显著性水平 的值进行比较。若
P< ,则拒绝 H0。
4 / 100
圣才电子书 十万种考研考证电子书、题库视频学习平台