应用多元统计分析-第四章 均值向量和协差阵检验
多元统计分析实验指导书——实验一均值向量和协方差阵检验
实验一SPSS软件的基本操作与均值向量和协方差阵的检验【实验目的】通过本次实验,了解SPSS的基本特征、结构、运行模式、主要窗口等,了解如何录入数据和建立数据文件,掌握基本的数据文件编辑与修改方法,对SPSS有一个浅层次的综合认识。
同时能够掌握对均值向量和协方差阵进行检验。
【实验性质】必修,基础层次【实验仪器及软件】计算机及SPSS软件【实验内容】1.操作SPSS的基本方法(打开、保存、编辑数据文件)2.问卷编码3.录入数据并练习数据相关操作4.对均值向量和协方差阵进行检验,并给出分析结论。
【实验学时】4学时【实验方法与步骤】1.开机2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS3.认识SPSS数据编辑窗、结果输出窗、帮助窗口、图表编辑窗、语句编辑窗4.对一份给出的问卷进行编码和变量定义5.按要求录入数据6.练习基本的数据修改编辑方法7.检验多元总体的均值向量和协方差阵8.保存数据文件9.关闭SPSS,关机。
【实验注意事项】1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。
2.遇到各种难以处理的问题,请询问指导教师。
3.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员同意,禁止使用移动存储器。
4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导教师或实验室管理人员同意。
5.上机时间,禁止使用计算机从事与课程无关的工作。
【上机作业】1.定义变量:试录入以下数据文件,并按要求进行变量定义。
表1学号姓名性别生日身高(cm)体重(kg)英语(总分100分)数学(总分100分)生活费($代表人民币)200201 刘一迪男1982.01.12 156.42 47.54 75 79 345.00 200202 许兆辉男1982.06.05 155.73 37.83 78 76 435.00 200203 王鸿屿男1982.05.17 144.6 38.66 65 88 643.50 200204 江飞男1982.08.31 161.5 41.68 79 82 235.50 200205 袁翼鹏男1982.09.17 161.3 43.36 82 77 867.00 200206 段燕女1982.12.21 158 47.35 81 74200207 安剑萍女1982.10.18 161.5 47.44 77 69 1233.00 200208 赵冬莉女1982.07.06 162.76 47.87 67 73 767.80 200209 叶敏女1982.06.01 164.3 33.85 64 77 553.90 200210 毛云华女1982.09.12 144 33.84 70 80 343.00200211 孙世伟男1981.10.13 157.9 49.23 84 85 453.80200212 杨维清男1981.12.6 176.1 54.54 85 80 843.00男1981.11.21 168.55 50.67 79 79 657.40 200213 欧阳已祥200214 贺以礼男1981.09.28 164.5 44.56 75 80 1863.90200215 张放男1981.12.08 153 58.87 76 69 462.20200216 陆晓蓝女1981.10.07 164.7 44.14 80 83 476.80200217 吴挽君女1981.09.09 160.5 53.34 79 82200218 李利女1981.09.14 147 36.46 75 97 452.80200219 韩琴女1981.10.15 153.2 30.17 90 75 244.70200220 黄捷蕾女1981.12.02 157.9 40.45 71 80 253.00要求:1)变量名同表格名,以“()”内的内容作为变量标签。
多元统计分析变量样本均值和协方差阵的相等检验
实验名称
变量样本均值和协方差阵的相等检验
姓名
学号
班级
实验地点
实验日期
指导教师
实验目的:
1.检验样本均值和协方差阵是否相等。
2.检验变量是否符合正态分布。
涉及实验的相关情况介绍(包含使用软件或实验设备等情况):
1、实验设备:一台电脑、互联网、SAS软件、投影仪。
2、实验相关知识点:
样本均值和协方差阵的估计
变量是否服从正态分布
实验报告(2):
在主要城市废气中主要污染物排放情况数据中六个变量互不影响,工业二氧化硫,工业氮氧化物,工业烟尘都符合正态分布,而生活二氧化硫,生活氮氧化物,生活烟尘在QQ图上的表现较为符合正态分布。
注实验报告电子版命名方式为:学号+姓名+实验名称。
实验过程:
1.自行车租用数据:
样本均值和协方差阵估计
样本均值相等
BOX’S M-协方差相等
检验变量是否服从正态分布
实验结论(1):
在自行车租用数据中四个变量互不影响,互不相关,变量都符合正态分布。在实验中,பைடு நூலகம்行单变量正态检验时,从QQ图,箱型图可以得出变量服从正态分布。
2.“主要城市废气中主要污染物排放情况”
第四讲均值向量和协方差阵的检验
2
若两总体协差阵相等且未知时,
n1n2 ˆ 1 ( X Y ) ~ T 2 ( p, n n 2) T ( X Y )' 1 2 n1 n2
2
根据两个样本可得μ1和μ2的无偏估计量为
1 n1 x xi n1 i 1 1 n2 y yi n2 i 1 1 1 X Y ~ N p 0,( ) n21 n2 n1n2 X Y ~ N p 0, n1 n2
L1 L2 ˆ 又 ~ Wp (n1 n2 2, ) n1 n2 2
检验原k个观测指标向量之间的互协方差阵是否为零,就是要 检验如下的假设:
H0 : ij 0, i j, i, j 1, 2,, k
若对此p维观测指标向量进行了n次观测,得到了一个容量 为n的样本 x(1) , x(2) , x(n )
并已计算出了样本叉积矩阵向量,则可将此样本叉积 矩阵按原k个观测指标向量进行分块,得到如下的分块 叉积矩阵为:
方差分析表
协方差阵的检验
单个总体协方差阵相等的检验
总体协方差阵是否等于已知常数矩阵的检验
H0 : 0 , H1 : 0
总体协方差阵是否等于已知常数矩阵倍数的 检验
H0 : 0 , H1 : 0
2 2
多总体协方差阵相等的检验
假设有k个多元正态总体,它们的分布分别 为 N p (1, 1 ),, N p (k , k ) 。现从每个总体中分别 随机抽取了一个样本,要根据这些样本,对于 这些总体的协方差阵是否相同进行检验。 首先,列出原假设和备择假设。它们分别为:
应用多元统计分析_课后答案
图 2.1
Descriptives 对话框
2.
单击 Options 按钮,打开 Options 子对话框。在对话框中选择 Mean 复选框,即计 算样本均值向量,如图 2.2 所示。单击 Continue 按钮返回主对话框。
图 2.2 Options 子对话框 3. 单击 OK 按钮,执行操作。则在结果输出窗口中给出样本均值向量,如表 2.1,即 样本均值向量为(35.3333,12.3333,17.1667,1.5250E2) 。
2.5 解: 依据题意,X= 57000 40200 21450 21900 45000 28350
′
15 16 12 8 15 8
27000 18750 12000 13200 21000 12000
144 36 381 190 138 26
′ E(X)= ∑6 α=1 x(α) = (35650,12.33,17325,152.5) n σ1 σ2 ρ2 (x1 −μ1 )2 σ2 1
+
σ2 1
(x2 −μ2 )2 σ2 2 )2
= = [
(x1 −μ1 )2 σ2 1 ρ(x1 −μ1 ) σ1
− −
2ρ(x1 −μ1 )(x2 −μ2 ) σ1 σ2 (x2 −μ2 ) 2 ] σ2
+
E( X ) μ
n→∞
lim E(
1 1 ������) = lim E( ������) = Σ n→∞ ������ n−1
2.7 试证多元正态总体 的样本均值向量 ̅) = E ( ΣX 证明: E(������ (α) ) = E (ΣX (α) ) =
n n 1 1 nμ n 1 n2
exp[−
应用多元统计分析-第四章 均值向量和协差阵检验
假设检验的过程-以妇女身高为例
形式上,上面的关于总体均值的H0 相对 于H1的检验记为:
H 0 : 160cm H1 : 160cm
我们将 H1 : 160cm 的假设称为双 尾检验 ,即前面说述的假设检验。
假设检验的过程-以妇女身高为例
如果备选假设为: H1 : 160cm
第三,确定显著性水平 根据样本所得的数据来拒绝零假设的概 率应小于0.05,当然也可能是0.01, 0.005,0.001等等。 显著性水平就是小概率水平,但小概率 并不能说明不会发生,仅仅是发生的概 率很小罢了。拒绝正确零假设的错误常 被称为第一类错误(type I error)。
假设检验的过程
有第一类错误,就有第二类错误; 那是备选假设正确时反而说零假设正确 的错误,称为第二类错误(type II error)。 在一般的假设检验问题中,由于备选假 设往往不是一个点,所以无法算出犯第 二类错误的概率。
假设检验的过程
第四,根据数据计算检验统计量的实现 值(t-值)和根据这个实现值计算p-值; 这一步一般都可由计算机软件来完成。 第五,进行判断:如果p-值小于或等于a, 就拒绝零假设,这时犯错误的概率最多 为 ;如果p-值大于 ,就不拒绝零假 设,因为证据不足。
这就是双尾概率,p值为0.045,即p=4.5%
假设检验的过程-以妇女身高为例
首先要提出一个原假设,如妇女身高的 均值等于160cm( 160cm )。这种原假 设也称为零假设(null hypothesis),记 为H0。 与此同时必须提出对立假设,如妇女身 高均值不等于160cm( 160cm )。对立 假设又称为备选假设或备择假设 (alternative hypothesis)记为H1。
多元正态分布均值向量和协差阵的检验
而
Y n(X 0) ~ Np (0,)
故 T02 n(X 0)T 1(X 0) ~ 2( p)
(2)协差阵未知时,均值向量的检验
H0:=(0 0为已知向量),H1: 1
假设H
成立,检验统计量为
0
F (n 1) p 1T 2 ~ F ( p, n p) (n 1) p
第三章 多元正态分布均值向量和
协差阵的检验
一、均值向量的检验
二、协差阵的检验
一、均值向量 •的假设检验
1、霍特林(Hotelling)T 2分布
定义1:设X ~ N p (, ),S ~ Wp (n, ),且X与S相互独立,n p,
则称统计量 T 2 nX T S 1X的分布为非中心霍特林T 2分布,
X (i) ~ N4 (1, ), i 1,2,,10; Y(i) ~ N4 (2 , ), i 1,2,,10
且两组样本相互独立,有共同未知协方差阵 0
假设检验 H0 : 1 2 , H1 : 1 2
构造统计量
F
(n+m 2) (n+m
p 2) p
X
~N
p
(0,
2
n
)
,
在一元统计中,若 t ~ t(n 1) 分布, 则 t2 ~ F (1, n 1) 分布,即把t分布转化为F分 布来处理,在多元统计分析中统计量也有类 似的性质。
定理1:设X ~ N p (0, ), S ~ Wp (n, ),且X与S相互独立, 令 T 2 nX T S 1 X 则 n p 1T 2 ~ F ( p, n p 1)
再由样本值计算出统计量T02,比较
若T02
多元统计分析——均值向量和协方差阵检验
多元统计分析——均值向量和协方差阵检验均值向量检验是评估两个或多个总体均值是否相等的方法。
在多元统计分析中,均值向量检验常用于比较不同组别或条件下的均值是否有差异。
假设有k个样本组别,每个组别有n个观测值,那么总共有nk个观测值。
假设每个观测值有p个测量变量,那么每个样本组别的均值向量可以表示为一个p维的向量。
我们的目标是比较这k个均值向量是否相等。
常用的均值向量检验方法有Hotelling's T-squared统计量和Wilks' Lambda统计量。
Hotelling's T-squared统计量是基于方差-协方差阵的一个推广,它考虑了样本组别的大小和协方差结构。
它的计算公式为:T^2=n(p-k)/(k(n-1))*(x1-x)^TS^(-1)(x1-x)其中,n是每个组别的观测数,p是变量的个数,k是组别的个数,x1是第一个组别的均值向量,x是总体均值向量,S是协方差阵。
T^2的分布是一个自由度为k,维度为p的非中心F分布。
Wilks' Lambda统计量是基于协方差阵的特征值的一个变换,它的计算公式为:Lambda = ,W,/,B其中,W是所有组别的散布矩阵(Within-groups scatter matrix),B是总体的散布矩阵(Between-groups scatter matrix)。
Wilks' Lambda的分布是一个自由度为k和n-k-1的F分布。
协方差阵检验是评估两个或多个总体协方差阵是否相等的方法。
在多元统计分析中,协方差阵检验常用于比较不同组别或条件下的变量之间的协方差结构是否有差异。
假设有k个样本组别,每个组别有n个观测值,那么总共有nk个观测值。
假设每个观测值有p个测量变量,那么每个样本组别的协方差阵可以表示为一个p维的矩阵。
我们的目标是比较这k个协方差阵是否相等。
常用的协方差阵检验方法有Hotelling-Lawley's Trace统计量和Pillai-Bartlett's Trace统计量。
多元统计分析——均值向量和协方差阵检验33页PPT
46、法律有权打破平静。——马·格林 47、在一千磅法律里,没有一盎司仁 爱。— —英国
48、法律一多,公正就少。——托·富 勒 49、犯罪总是以惩罚相补偿;只有处 罚才能 使犯罪 得到偿 还。— —达雷 尔
50、弱者比强者更能富 ❖ 丰富你的人生
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应,言行相称。——韩非
第四章 多元正态总体均值向量和协差阵的假设检验
210
280 280 293 210 190 310 200 189 280 190 295 177
100
65 117 114 55 64 110 60 110 88 73 114 103
34
63 48 63 30 51 90 62 69 78 63 55 54
468
416 468 395 546 507 442 440 377 299 390 494 416
1.当
已知时,检验用的统计量为
2、当
未知时,检验用的统计量为
(二)两个正态总体均值的比较检验 设从总体 中抽出一个样本 中抽出一个样本 ,从总体
,要进行的假设检验为
1.两个正态分布总体方差
和
已知时,检验用的统计量
2.两个正态分布总体方差
和
未知,但
(三)多个正态总体均值的比较检验 设有k个正态总体分别为 本:各总体的样本如下: 从k个总体中各自独立的抽取一个样
经计算得
拒绝原假设
甲和丁存在显著差别
第二节 协方差阵的检验 一、检验
设
要检验
是来自
的样本是已知的正定矩阵,检验的统计量是对于方阵A =
,将它对角线的所有元素相加所得的和,称为矩阵A的迹,记为trA=
当
及
时
的
分位点表
二、检验
检验用的统计量是
当
不大且
时,
的上
分位点
销售方式3 X1 65 X2 33 X3 480 X4 260
2
3 4 5 6 7 8 9 10 11 12 13 14
119
63 65 130 69 46 146 87 110 107 130 80 60
应用多元统计分析课后答案
第二章2.1.试叙述多元联合分布和边际分布之间的关系。
解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=的子向量的概率分布,其概率密度函数的维数小于p 。
2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。
解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。
2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1a x b ≤≤,2c x d ≤≤。
求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数; (3)判断1X 和2X 是否相互独立。
(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd cc d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 12122222()()2[()2()]()()()()dd cc d c x a x b a t x a t dt b a d c b a d c ------=+----⎰2212122222()()[()2()]1()()()()d cdcd c x a x b a t x a t b a d c b a d c b a------=+=----- 所以由于1X 服从均匀分布,则均值为2b a +,方差为()212b a -。
多元正态分布均值向量和协差阵的检验m
的样本,则统计量 t 其中 显然
2 2 与前面给出的 T 统计量形式类似,且 X ~ N 0, , n 由此可见,T 2分布是一元统计分布中 t分布的推广。
HotellingT
2
分布基本性质
在一元统计中,若统计量t ~ t n 1分布, 则t 2 ~ F 1, n 1分布,即把t分布的统计量转 化为F统计量来处理,在多元统计分析中T 2 统计量也具有类似的性质。
n p 2 给定检验水平 ,查F分布表,使P T F , n 1 p 可确定出临界值 F,再用样本值计算出 T 2。 n p 2 若 T F,则否定H 0,否则H 0相容。 n 1 p
H 0 : 0
H1 : 0
这里所谓的不合理,并不是形式逻辑中的绝对矛 盾,而是根据小概率原理,即发生概率很小的随 机事件再一次试验中几乎不可能发生,通常把概 率不超过0.05的时间当做小概率事件。
二、假设检验中的否定域和接受域
H0 为原假设或零假设,H1为对立假设或备择假 设
拒绝原假设的区域称为拒绝域或否定域,否定域 之外的区域为接受域 若根据样本值计算的统计量之值落入拒绝域,则 认为原假设不成立,称为在显著性水平α下拒绝 H0,否则认为成立,称为在显著性水平α下接受
关于μ和∑的各种形式的假设检验
构成了本章内容。本章的许多内容 是一元的直接推广,但由于多指标 问题的复杂性,本章只列出检验用 的统计量,详细介绍如何使用这些 统计量做检验。
第一节 均值向量的检验 第二节 协差阵的检验
假设检验的四个基本步骤:
⑴提出待检验的假设H0和H1。 ⑵给出检验的统计量及其服从的分布。 ⑶给定检验水平α,查统计量的分布表,
《应用多元统计分析》第五版PPT(第四章)-简化版(SPSS24)-作为选读
82.0
x
60.2 14.5
,
8.0
x
μ0
2.2 1.5
31.600 8.040 0.500
S
8.040 0.500
3.172 1.310
1.310 1.900
4.3107 14.6210 8.9464
S
1
23.13848 1
14.6210 8.9464
59.7900 37.3760
❖ 首先得出丁商品对原假设H0的拒绝起到了很大的作 用。
❖ 剔除丁商品后再对其他三种商品进行三元方差分析 检验。
32
❖ 说明对甲、乙、丙这三种商品,销售方式Ⅰ,Ⅱ和Ⅲ 的总体均值向量之间无显著差异。
❖ 可认为甲商品对三种销售方式的差异无明显影响。
33
§4.6 协方差矩阵相等性的检验
❖ 该齐性检验的主要用途: ➢ (1)希望对多个总体均值向量进行比较检验; ➢ (2)考虑是否采用联合协方差矩阵。 ❖ 设k个总体π1,π2,⋯,πk的分布分别是Np (μ1, Σ1), Np (μ2, Σ2) ,⋯,
❖ 设有k个总体π1,π2,⋯,πk,它们的分布分别是Np(μ1,Σ),Np(μ2,Σ),
⋯,Np(μk,Σ),今从这k个总体中各自独立地抽取一个样本,取 自总体πi的样本为xi1, xi2 , , xini ,i=1,2,⋯,k。现欲检验
H0:μ1=μ2=⋯=μk,H1:μi≠μj,至少存在一对i≠j
H0:μ=μ0,H1:μ≠μ0
表4.2.1
某地区农村男婴的体格测量数据
编号 1 2 3 4 5 6
身高(x1) 78 76 92 81 81 84
胸围(x2) 60.6 58.1 63.2 59.0 60.8 59.5
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
为什么要假设检验?
这样的例子很多,其实只要我们进行比 较、判断时:总体与样本比,不同总体 之间比,样本与样本比等,都要用到假设 检验。
那么如何检验呢?
如何假设检验?
还是回到妇女身高的例子,已知样本均值与总 体均值相差2cm,这2cm是如何造成的? 是抽样误差造成的身高没变化 2cm产生的原因 不仅是误差, 确实是身高发生了变化
如何假设检验?
首先可假设这2cm的误差是由抽样误差造 成的。 在总体参数估计中我们学过了样本均值 的分布: 样本均值( x )服从N ( X , )
n
即:
样本均值( x )服从正态分布 ( X, N 即 : x N (160, 5 ) 100
n
)
P( X , X ) 68.27%
P( X 2 , X 2 ) 95.45%
P( X 3 , X 3 ) 99.37%
如何假设检验?
那么:( x X ) 2cm, 等于? 个标准差
Spss输出结果
One -Sampl e Sta tisti cs N WEIGHT 50 Mean 498.3472 Std. Deviation 4.33466 Std. Error Mean .61301
One -Samp le Te st Test Value = 500 Sig. (2-tailed) .010 Mean Difference -1.6528 95% Confidence Interval of the Difference Lower Upper -2.8847 -.4209
8
6
4
2 Std. Dev = 4.33 Mean = 498.3 0 491.0 493.0 495.0 497.0 499.0 501.0 503.0 505.0 N = 50.00 490.0 492.0 494.0 496.0 498.0 500.0 502.0 504.0 506.0
WEIGHT
根据一个样本对其总体均值大小进行检验 即:
H 0 : 500 H1 : 500
或:
H 0 : 500 H1 : 500
根据一个样本对其总体均值大小进行检验 检验统计量就是作为对均值的标准化的 x 0 t s n 符号中的 0 通常表示为零假设中的均 值(即总体的均值,这里是500) Spss选项:Analyze—Compare mean— One-Sample T Test
df 9
根据一个样本对其总体均值大小进行检验 可以发现p-值为0.1243(计算机输出的双 尾检验的p-值除以2),因此,没有证据 否定零假设。 这时的检验统计量t=1.2336。也可以画出 类似于图6.的图(图6.)这时的t分布的自 由度为9。
这就是双尾概率,p值为0.045,即p=4.5%
假设检验的过程-以妇女身高为例
首先要提出一个原假设,如妇女身高的 均值等于160cm( 160cm )。这种原假 设也称为零假设(null hypothesis),记 为H0。 与此同时必须提出对立假设,如妇女身 高均值不等于160cm( 160cm )。对立 假设又称为备选假设或备择假设 (alternative hypothesis)记为H1。
One -Samp le Tes t Test Value = 20 Sig. (2-tailed) .249 Mean Difference 1.1300 95% Confidence Interval of the Difference Lower Upper -.9422 3.2022
EXH
t 1.234
图6. 50包红糖重量的直方图
根据一个样本对其总体均值大小进行检验
这个直方图看上去象是正态分布的样本。于是 不妨假定这一批袋装红糖有正态分布。 由于厂家声称每袋500g(标明重量),因此零 假设为总体均值等于500g(被怀疑对象总是放 在零假设); 而且由于样本均值少于500g(这是怀疑的根 据),把备选假设定为总体均值少于500g(这 种备选假设为单向不等式的检验为单尾检 验,)。
例3.2(Spss数据exh.sav)汽车厂商声称 其发动机排放标准的一个指标平均低于 20个单位。 在抽查了10台发动机之后,得到下面的 排放数据:17.0、21.7、17.9、22.9、20.7、 22.4、17.3、21.8、24.2、25.4。 该样本均值为21.13。究竟能否由此认为 该指标均值超过20?
第三,确定显著性水平 根据样本所得的数据来拒绝零假设的概 率应小于0.05,当然也可能是0.01, 0.005,0.001等等。 显著性水平就是小概率水平,但小概率 并不能说明不会发生,仅仅是发生的概 率很小罢了。拒绝正确零假设的错误常 被称为第一类错误(type I error)。
假设检验的过程
第四章 多元正态总体
均值向量和斜方差阵 的检验
第一节
假设检验的回顾
为什么要假设检验?
我们举妇女身高的例子, 如果在2002年对10000 名妇女的身高进行了全 面调查,得出平均身高 为160cm,标准差为5cm。 在2004年对该妇女(还 是原总体)进行了随机 抽样调查,调查了100 名妇女,测得样本身高 162cm,标准差为5cm。
有第一类错误,就有第二类错误; 那是备选假设正确时反而说零假设正确 的错误,称为第二类错误(type II error)。 在一般的假设检验问题中,由于备选假 设往往不是一个点,所以无法算出犯第 二类错误的概率。
假设检验的过程
第四,根据数据计算检验统计量的实现 值(t-值)和根据这个实现值计算p-值; 这一步一般都可由计算机软件来完成。 第五,进行判断:如果p-值小于或等于a, 就拒绝零假设,这时犯错误的概率最多 为 ;如果p-值大于 ,就不拒绝零假 设,因为证据不足。
假设检验的过程-以妇女身高为例
形式上,上面的关于总体均值的H0 相对 于H1的检验记为:
H 0 : 160cm H1 : 160cm
我们将 H1 : 160cm 的假设称为双 尾检验 ,即前面说述的假设检验。
假设检验的过程-以妇女身高为例
如果备选假设为: H1 : 160cm
Tail Probability for t(59) 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 p-value=0.005 0 -5 -4 -3 t=-2.696 -2 -1 0 t value 1 2 3 4 5
Density of t(59)
根据一个样本对其总体均值大小进行检验
如果是两个以上总体的均值检验,则将 用到方差分析,到方差分析一章时,再 进行介绍。
根据一个样本对其总体均值大小进行检验
例3.1:如果你买了一包标有500g重的一包红糖, 你觉得份量不足。于是你找到监督部门; 当然他们会觉得一包份量不够可能是随机的。 于是监督部门就去商店称了50包红糖(数据在 sugar.sav); 其中均值(平均重量)是498.35g;这的确比 500g少,但这是否能够说明厂家生产的这批红 糖平均起来不够份量呢? 于是需要统计检验。 首先,可以画出这些重量的直方图(图5.)
根据一个样本对其总体均值大小进行检验 这次的假设检验问题就是:
H 0 : 20 H1 : 20
Spss选项:Analyze—Compare mean— One-Sample T Test
Spss输出结果
One -Samp le St atist ics N EXH 10 Mean 21.1300 Std. Deviation 2.89676 Std. Error Mean .91604
抽样误差,即( x X )在 2
n
范围内的概率为 5% 99.4
.即 : P 2 (x X ) 2 99.45% n n
抽样误差,即( x X )在 3
n
范围内的概率为 99.73 %
.即 : P 3 (x X ) 3 99.73% n n
如何假设检验?
因此我们就需要计算:样本均值与总体 均值的差究竟等于几个标准差,即:
162 160 2 t 4 5 0.5 n 100 (x X )
所以说明样本均值与总体均值的差不仅是 抽样误差,而是确实两者之间存在着显著 的差异,即该批妇女的身高增高了!
如何假设检验?
小概率事件:在一次事件中几乎不可能 发生的事件。 一般称之为“显著性水平,用 表示。
显著性水平一般取值为:
0.05,即5% 0.01,即1%
如何假设检验?
在用计算机软件进行假设检验时,计算 机输出的检验结果是:t-值和p-值(pvalue)
T值就是我们刚才计算过的t值,对于不 同的分布,计算t值的方法和公式不一样。 p-值(p-value)就是对应于t值及之外的双 尾概率,即小概率。
WEIGHT
t -2.696
df 49
根据一个样本对其总体均值大小进行检验
计算结果是t=-2.696(也称为t值), 同时得到p值为0.005(由于计算机输出的为双尾检验的p值,比单尾的大一倍,应该除以2)。 看来可以选择显著性水平为0.005,并宣称拒绝 零假设,而拒绝错误的概率为0.005。 对于这里红糖的具体问题则可以认为,红糖标 记重量为500g是不能接受的,实际上平均起来 要少于500g。 下面图6.2给出一个t分布图,让我们看看到底 这t统计量取值在什么位置。看得出来,在直观 上这也的确是个小概率事件。