5第五章假设检验
教育与心理统计学 第五章 假设检验考研笔记-精品
假设检验中的小概率原理[一级][16J]
假设检验的基本思想是概率性质的反证法,即其基本思想是基于〃小概率事件在一次实验中不可能发生”这一原理。首先假定虚无假设为
真,在虚无假设为真的前提下,如果小概率事件在一次试验中出现,则表明〃虚无假设为真"的假定是不止确的,因为假定小概率事件在
一次试验中是不可能出现的,所以也就不能接受虚无假设,应当拒绝零假设。若没有导致小概率事件出现,那就认为"虚无假设为真”的
假定是正确的,也就是说要接受虚无假设。假设推断的依据:小概率事件是否出现,这是对假设作出决断的依据。
检验的假设
Ho为真
真实情况
检验的事件发生的概率在99%或95%的范围内
检验的事件发生的概率在5%或1%以内
错误的概率,其前提是“Ho为假
②它们都是在做假设检验的统计决策时可能犯的错误,决策者同时面临犯两种错误的风险,因此都极力想避免或者减少它们,但由于在忠
体间真实差异不变情况下,它们之间是一种此消彼长的关系,即a大时,0小;c(和B不能同时减少。
③在其他条件不变的情况下,不可能同时减小或增大两种错误的发生可能,常用的办法是固定a的情况下尽可能减小B,比如通过增大样本
若进行假设检验时总体的分布形态已知,需要对总体的未知参数进行假设检验,称其为参数假设检验。
(三)非参数检验[一级]
若对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验,通常称为非参数假设检验。
(四)小概率事件和显著性水平
(1)假设推断的依据就是小概率原理
小概率事件:通常情况下,将概率不超过0.05(即5%)的事件当作“小概率事件",有时也定为概率不超过0.01(即1%)或0.001(0.1%\
管理统计学:第5章_假设检验
统计显著性
3. 一项检验在统计上是“显著的”,意思是指: 这样的(样本)结果不是偶然得到的,或者说, 不是靠机遇能够得到的。
– 拒绝原假设,表示这样的样本结果并不是
偶然得到的;不拒绝原假设(拒绝原假设的 证据不充分) ,则表示这样的样本结果只 是偶然得到的。
华南理工大学精品课程
解:研究者抽检的意图是倾向于证
实这种洗涤剂的平均净含量并不符
绿叶 洗涤剂
合说明书中的陈述。建立的原假设
和备择假设为
H0 : 500
华南理工大学精品课程
H1 : < 500
500g
例题分析
【例】一家研究机构估计,某城市中家庭拥有汽车 的比例超过30%。为验证这一估计是否正确,该 研究机构随机抽取了一个样本进行检验。试陈 述用于检验的原假设与备择假设。
华南理工大学精品课程
双侧检验与单侧检验
假设 原假设
表5-1 假设检验的基本形式
双侧检验
单侧检验 左侧检验 右侧检验
H0 : μ =μ0 H0: 0 H0: 0
备择假设 H1 :μ≠μ0 H1: μ<μ0 H1 :μ>μ0
华南理工大学精品课程
2、两类错误与显著性水平
假设检验中的两类错误 1. 第Ⅰ类错误(弃真错误)
解:研究者想收集证据予以证明 的假设应该是“生产过程不正常 ”。建立的原假设和备择假设为
H0 : 10cm H1 : 10cm
华南理工大学精品课程
例题分析
【例】某品牌洗涤剂在它的产品说明书中声称:平 均净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设
第五章假设检验
第五章假设检验本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。
通过学习,要求:1.掌握统计检验的基本概念,理解该检验犯两类错误的可能;2. 熟练掌握总体均值与总体成数指标的各种检验方法;包括:z 检验、t 检验和p- 值检验;4. 掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验; 5. 能利用Excel 进行假设检验。
第一节假设检验概述一、假设检验的基本概念假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。
假设检验与区间估计结合起来,构成完整的统计推断内容。
假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。
本章分别讨论这两类检验方法。
进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理” ,对假设的正确性做出判断。
这种思维方法与数学里的“反证法” 很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。
反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。
其实,我们在日常生活中,不仅不肯接受概率为0 的事件,而且对小概率事件,也持否定态度。
比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。
所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。
这种事件称为“实际不可能事件” 。
小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平 a 0<加1)作为小概率的界限,a的取值与实际问题的性质有关。
所以,统计检验又称显著性检验。
下面通过一个具体例子说明假设检验是怎样进行的。
【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。
第五章-假设检验与回归分析
件,得到拒绝域;
步骤 4:明确或计算样本均值 x ,得到U 变量的观测值 u x 0 n 0
若观测值 u 落入拒绝域,则拒绝零假设 H 0 ,即接受备择假设 H1 ,
否则不能拒绝零假设 H 0 。
第五章 假设检验与回归分析 例1、 已知某面粉自动装袋机包装面粉,每袋面粉重量 Xkg
服从正态分布 N(25,0.02) ,长期实践表明方差 2 比较稳定,从
第五章 假设检验与回归分析
U 检验的步骤:
步骤 1:提出零假设 H 0 : 0 与备择假设 H1 ;
步骤 2:明确所给正态总体标准差 0 值、样本容量 n 的
值,当零假设 H 0 成立时,构造变量
U X 0 n ~ N(0,1) 0
第五章 假设检验与回归分析
步骤 3:由所给检验水平 的值查标准正态分布表求出对应 的双侧分位数 u 的值或上侧分位数 u 的值,构造小概率事
u
2
0.05, u 1.96 ,
2
第五章 假设检验与回归分析
x 0 n
12.5 12 1 100
5 u
2
1.96
故拒绝 H0 ,即认为产品平均质量有显著变化。
小结与提问:
理解假设检验的基本原理、概念;掌握假设检验的步骤。
课外作业:
P249 习题五 5.01, 5.02,5.03。
0.10,再在表中第一列找到自由度 m n 1 7 1 6 ,
其纵横交叉处的数值即为对应的 t 分布双侧分位数 t 1.943
2
,使得概率等式
PT 1.943 0.10
成立。这说明事件 T 1.943是一个小概率事件,于是得到
拒绝域
t 1.943
第五章 假设检验与回归分析
第五章 假设检验
Di
4.1 3.8
1.0
4.2
5 15.3 12.0
3.3
6 13.9 14.7 -0.8
7 20.0 18.1 1.9
8 16.2 13.8 2.4
9 15.3 10.9 4.4
作业(以下任选一道)
1、查阅近两年的心理学和教育学权威杂志各一套(例 如,可查阅这几个年度的《心理学报》和《教育研究》 各一套),对其论文中使用的统计方法进行一项描述
(两个样本的“t”检验) 五、相关系数的显著性检验 六、方差差异的显著性检验
假设检验的一般步骤
(1)建立虚无假设和备择假设
双侧检验为:H0:µ=µ0
H1:µ‡µ0
单侧检验为:H0:µ<=µ0 或 H0:µ>=µ0
H1:µ>µ0 或 H1:µ<µ0
(2)寻找合适的统计量及其抽样分布,并计算统计量
T’=-1.929;SE2=3.468;t’ a/2=2.049
练习题5
对9个被试进行两种夹角(15o,30o)的缪 勒—莱依尔错觉实验结果如下,问两种夹角的 情况下错觉量是否有 显著差异?
被试 1
2
3
4
15o 14.7 18.9
17.2 15.4
30o 10.6 15.1
16.2 11.2
Z1.84;SE1.793
两类错误
H0为真
接受H0 拒绝H0
正确 α错误
前提 H0为假 β错误 正确
总体平均数的假设检验例题1
全区统一考试物理平均分μo=50,标准差σo=10.某 校的一个班(n=41)平均成绩 X =52.5.问该班成 绩与全区平均成绩差异是否显著.
(总体正态,总体方差已知)
(05)第5章 假设检验1
临界值: t0.05(35)=1.6896
拒绝H0
0.05
检验统计量:
t x 0 5275 5200 3.75
s / n 120 36
t0.05 (35) 1.6896
决策:拒绝H0 结论: 改良后的新品种产量有显著 提高
6 - 33 0 1.6896 z
6-7
统计学
STATISTICS
一个假设检验的例子
P112—【例3.33】
一个汽车电池制造商声称其最好的电池寿命的分布 为均值54个月,标准差为6个月。假设某一消费 组织决定购买50个这种电池作为样本检验电池的 寿命,以核实这一声明。
(1)假设这个制造商之所言是真实的,试描 述这50个电池样本的平均寿命的抽样分布。
STATISTICS
5.1 假设检验的基本原理
一、假设的陈述 二、显著性水平 三、统计量与拒绝域 四、利用P值进行决策
统计学
STATISTICS
5.1.1 假设的陈述
现实生活中,人们经常要对某个“假设”作出判断, 确定它是真的还是假的。在研究领域,研究者在 检验一种新的理论时,首先要提出一种自己认为 是正确的看法,即假设。
1 (1.53) 1 0.9370 0.0630
说明在显著性水平为0.05下不能判定汽车电池的 平均寿命不到54个月。但在显著性水平为0.1下可 以判定汽车电池的平均寿命不到54个月。
6 - 12
统计学
STATISTICS
原假设与备择假设
统计学
STATISTICS
原假设
(null hypothesis)
备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
第五章假设检验与回归分析
第五章假设检验与回归分析本章主要介绍了假设检验和回归分析两种统计方法。
一、假设检验假设检验是通过收集样本数据来对总体参数的假设进行推断的一种统计方法。
假设检验的步骤如下:1.建立原假设和备择假设:原假设是需要进行检验的参数的假设值,备择假设是对原假设的一种否定或补充。
通常将备择假设设置为我们要验证的假设。
2.收集样本数据:根据样本数据进行统计分析,并计算出检验统计量。
3.确定显著性水平:显著性水平是拒绝原假设的最大错误概率,通常取0.05或0.014.计算拒绝域的临界值:根据显著性水平和自由度,在统计表中查找检验统计量的临界值。
5.比较检验统计量和临界值:如果检验统计量落在拒绝域内,则拒绝原假设,否则接受原假设。
二、回归分析回归分析是一种用于研究两个或多个变量之间关系的统计方法。
它可以用来建立一个变量对另一个变量的预测模型。
回归分析的步骤如下:1.收集数据:根据需要收集自变量和因变量的数据。
2.建立模型:选择适当的回归模型,将自变量和因变量进行数学表达。
3.估计参数:使用最小二乘法等方法,对模型参数进行估计。
4.检验模型:通过检验模型的显著性水平,确定模型是否合理。
5.利用模型:使用估计的模型来进行预测和分析。
回归分析可以分为简单线性回归和多元线性回归两种。
简单线性回归是指只有一个自变量和一个因变量之间的关系,多元线性回归是指有多个自变量和一个因变量之间的关系。
回归分析的应用非常广泛,可以用于市场营销、财务管理、经济预测等领域。
通过回归分析,可以找到影响因变量的主要因素,并对未来的变化进行预测。
总之,假设检验和回归分析是统计学中两种重要的方法。
假设检验用于对总体参数的假设进行验证,回归分析用于研究变量之间的关系。
这两种方法在实际应用中具有广泛的价值。
第5章_假设检验
面向21世纪 课程教材
第五章
假设检验
第二节
某研究者估计本市居民家庭电脑拥有率为30%。现随机调查了200个家庭,其 中68家拥有电脑。试问研究估计是否可信?( =10%) 提出假设:原假设:Ho:P=0.3; 备择假设:Ha:p≠0.3
样本比例 P=m/n=68/200=0.34 由于样本容量相当大,因此可近似采用Z检验法 p p0 0.34 0.3 z 1.194 p (1 p ) 0.34 0.66 n 200
面向21世纪 课程教材
第五章
假设检验
第二节
2.方差检验过程 (1)提出原假设Ho和备择假设Ha。
2 H0 : 2 0
2 Ha : 2 0
(2)构造检验统计量:
(n 1) s 2
2
~
2
(n-1)
2 2分布。 在Ho成立的条件下,统计量 服从自由度为n-1的
(3)确定显著性水平。 (4)规定决策规则。 在双侧检验的情况下,拒绝区域在两侧,如果检验统计量大于右侧临界 值,或小于左侧临界值,则拒绝原假设。若是单侧检验,拒绝区域分布 在一侧,具体左侧还是右侧,可根据备择假设Ha的情况而定。 (5)进行判断决策。
面向21世纪 课程教材
第五章
假设检验
第二节
某厂采用自动包装机分装产品,假定每包重量报从正态分 布,每包标准重量为1000克,某日随机抽查9包,测得样本 平均重量为986克,标准差为24克,试问在0.05的检验水平 上,能否认为这天自动包装机工作正常?
;H 根据题意,提出假设: H0 : 1000 1: 1000
面向21世纪 课程教材
第二节 总体均值、比例和 方差的假设检验
假设检验 全
1
信号检测与估计
假设检验
问题如何提出:雷达需要从回波信号中判断有 无目标存在,通信需要判断接收到的究竟是几 个可能的发射信号中的哪一个○1 。
由于接收机热噪声、信道畸变或目标起伏,使 得我们观测到的信号具有不确定性○2 ,因此有必 要运用统计的方法来指导我们进行选择。
统计假设检验就是根据观测样本对几种可能
型,并按照某种最优准则设计接收机,最后对
接收机的性能进行评估。本章重点讨论最后两
点○4 。
3
信号检测与估计
假设检验
5.1 引言-introduction
4
信号检测与估计
假设检验
5.2 简单检测问题-A Simple Detection Problem
假定消息取值为 m0 (比如 0)或 m1 (比如 1), 由于事先并不知道传递的是什么消息,所以将 其视作取值为 m0 或 m1 的随机变量 m ,各自出现的 概率分别为 P0 和 P1 :
(7)
其中可将参数α 或它的函数定义为“信噪比”
(SNR)。
图 5.2 给出了以(7)式中信噪比 SNR 为参量
时, P(D1 | H0 ) 和 P(D1 | H1) = 1− P(D0 | H1) 的关系曲线。 图 5.2 也是接收机工作特性(Receiver operating
characteristic, ROC)的一种形式。
p0 ( y)P(H0 )
py (y)
所以判决规则成为,若
λ(y) =
p0 ( y) p1( y)
>
P(H0 )
P(H1)
(3)
则选择 H1,即 m = m1 。 p0 ( y) 和 p1( y) 都称为似然函数 (likelihood function),λ(y) 称为似然比(likelihood
第5章 假设检验
总体比率的假设检验
在大样本情况下,样本比率近似服从正态分 布,即: (1 ) p ~ N(, ) n 将其标准化:
p Z= ~ N (0,1) (1 ) n
可用Z检验法对总体比率进行假设检验。
25
若采用双侧检验,即H0: = 0, H1: ≠ , 0 则临界值为-Z a/2和Z a/2, 当|Z |> Z a /2时,位于拒 拒绝区域,拒绝原假设;当|Z |≤ Z a /2时,位于接 受区域,接受原假设 0 若采用左侧检验,即H0: ≥ , H1: < ,则 0 临界值为-Z a, 当Z <-Z a 时,位于拒绝区域,拒 绝原假设;当Z ≥ -Z a 时,位于接受区域,接受原 假设 若采用右侧检验,即H0: ≤ , H1: > ,则 0 0 临界值为Z a, 当Z >Z a 时,位于拒绝区域,拒 绝原假设;当Z ≤ Z a 时,位于接受区域,接受原 假设
5
生产技术改革前,某种零件的平均长度为4cm, 即0=4cm,技术改革后,从全部生产的零件中随 机抽取100个,测得零件的平均长度为3.5cm。 判断:技术改革后零件的平均长度是否发生了显 著性的变化。在这个题目中,原假设和备择假设 该如何选取? 从样本可看出,研究者想证明的结论是零件的平 均长度发生了显著性的变化,因此备择假设确定 为: H1: ≠4cm,随之可确定原假设为: H0: =4cm,即所提的原假设和备择假设为: H0: =4cm, H1: ≠4cm
6
生产技术改革前,某种零件的平均长度为4cm, 即0=4cm,技术改革后,从全部生产的零件中随 机抽取100个,测得零件的平均长度为3.5cm。 判断:技术改革后零件的平均长度是否比以前偏 短。在这个题目中,原假设和备择假设该如何选 取? 从样本可看出,研究者想证明的结论是零件的平 均长度偏短,因此备择假设确定为: H1: < 4cm,随之可确定原假设为: H0: ≥4cm,即 所提的原假设和备择假设为: H0: ≥4cm , H1: <4cm
第-五-章--假设检验.
H1 0
双侧检验与单侧检验
(假设的形式)
假设 原假设
单侧检验 双侧检验
左侧检验 右侧检验
H0 : = 0 H0 : 0 H0 : 0
备择假设 H1 : ≠0 H1 : < 0 H1 : > 0
2、选择适当的统计量,并确定 其分布形式
1.Z
x 0
n
3.t
x 0
s
n
2.Z
x s
地加以拒绝的风险为0.05。
已知:0 125,0 150, n10030,x 120,0 0.05
?
证明: 45
H0 1200(0)
解 :H 0: 12 ,H 5 1:0 125
由 0 .0知 5 Z 1 1 .645
而 Zx 0 1125 00 1025 03.33 1.645
1、二者互为消长。
PZZ H0为真 PZZ H1为真
2、在检验中,对和 的选 择取决于犯两类错误所要付出的
代价。通常的做法是先确定。
3、若要同时减少和,或
给定α而使β减少,就必须增大样 本容量n。
4、 β的大小不仅与临界值有关, 而且还与原假设的参数值 0 与总体参
数的真实值 之间的差异大小有关。
已知: 0 500,n 50 30 x 510,s 8, 5%
?
求: 500
解 :H 0:5,0 H 10 :500
由 0.0知 5Z1.645
而Z x 0 510500
s
8
n
50
8.751.645 接受 H1,拒绝 H0
即在现有的显著性水平下,
可以认为装得太满.
三、正态总体、方差未知、 小样本
已知 :X~N100,?0,0 1000
医学统计5第五章 假设检验
二、双侧检验和单侧检验
在进行t 检验时,如果其目的在于检验两个总体均数 是否相等,即为双侧检验。例如检验某种新降压药与常 用降压药效力是否相同?就是说,新药效力可能比旧药 好,也可能比旧药差,或者力相同,都有可能。
如果我们已知新药效力不可能低于旧药效力,例如 磺胺药+磺胺增效剂从理论上推知其效果不可能低于单用 磺胺药,这时,无效假设为H0, 备择假设为H1: 1>2 , 统计上称为单侧检验。
第五章 假设检验
一、假设检验的基本思想
例:已知一般中学男生的心率平均数为74次/分钟, 标准差为6次/分钟,为研究经常参加体育锻炼的中学 生心脏功能是否增强,在某地区随机抽取常年参加体 育锻炼的男生100名,求得心率平均数为65次/分钟。
如果一个事件发生的概率很小,那么在只进行一次试 验时这个事件是“不会发生的”,一旦发生了,称其 为小概率事件。统计类错误
设H0:=0,H1:>0, =0.05, 将拒绝了正确的无效假设 H0 称为I 类错误(type I error):也称为假阳性错误,当实际上真的为0,即H0: =0原本是正确的,但由于偶然因素的影响,随机抽样时, 得 到 一个较 大 的检验 统 计量 t 值 ,故 t t, 时 , 则 P0.05 时,按所取检验水准 只能拒绝H0,接受H1,结 论为>0, 由于拒绝了实际上是正确的H0,此推断结论当 然是错误的,即犯了I 型错误。I 型错误的概率是=0.05。
本例是均数的比较,是将常年参加体育锻炼心率平均 数为65次/分钟(它代表的总体有一总体均数)与一般中学 男生的心率平均数为74次/分钟。
研究者可能有两种目的: – ① 推断两个总体均数有无差别。不管是常年参加体育锻
炼心率高于一般,还是常年参加体育锻炼心率低于一般, 两种可能性都存在,研究者同等关心,应当用双侧检验。 – ② 根据专业知识,已知常年参加体育锻炼心率不会低于 一般,或是研究者只关心常年参加体育锻炼心率是否高 于一般,不关心常年参加体育锻炼心率是否低于一般, 应当用单侧检验。
第五章_假设检验
? 如果实际非法赌博的金额远低于 $200 , 即H 0并不正确,但你运气欠佳,得到的样 本估计的均值十分接近 200 ,则你应该推 翻H 0。但样本数据却不足以推翻错误的假 设,此时你犯了型 II 的错误
检验统计量的值
检验统计量的值
第3步
确定显著性水平,计算 临界值及拒绝域
第3步
计算P值
第4步 作比较,并给出假设检 第6步 判断P值的大小,并给
验的结论
出假设检验的结论
单个总体的假设检验
? 单个总体均值检验
? 例解
? 某电子元件批量生产的质量标准为平均使用寿 命1200小时。某厂宣称他们采用一种新工艺生 产的元件质量大大超过规定标准。为了进行验 证,随机抽取了100件作为样本,测得平均使用 寿命1245小时,标准差300小时。在显著性水平 为0.05时,能否说该厂生产的电子元件质量显 著地高于规定标准?
? P-value 是不仅止于告诉我们在某一显著水平下是 否拒绝H 0,如果我们知道P-value = .002 则我们 知道H 0不但在.05 的显著水平下会被拒绝,在 .005 的水平下也会被拒绝
– 如果仅知道P-value =.04 ,则是否拒绝H 0可以由读 者来决定,如果某一研究人员决得.01才算显著, 则H 0不会被拒绝,如果将显著水平置于.05 ,则拒 绝
统计量部分的面积
? 被称为观察到( the observed significant level ) 的显著性水平
? P-value 告诉我们:「如果零假设为真,我们观
察到目前数据显示的检验统计量的概率有多高?」 如果这个概率很小,则我们可以拒绝零假设,因 为如果假设为真,则仅有很小的概率抽取任意的 随机样本会得到目前的观察值
第五章-假设检验
H0: 1500 H1: 1500
1-29
第二十九页,编辑于星期五:十八点 三十四分。
单侧检验
(原假设与备择假设的确定)
一项研究表明,改进生产工艺后,会使 产品的废品率降低到2%以下。检验这 一结论是否成立
研究者总是想证明自己的研究结论(废品率 降低)是正确的
H0: 355 H1: 355
1-28
第二十八页,编辑于星期五:十八点 三十四分。
单侧检验
(原假设与备择假设的确定)
一项研究表明,采用新技术生产后,将 会使产品的使用寿命明显延长到1500小 时以上。检验这一结论是否成立
研究者总是想证明自己的研究结论(寿命延 长)是正确的
备择假设的方向为“>”(寿命延长)
假设其中真有99个白球,摸 出红球的概率只有 1/100 ,
这是小概率事件。
➢小概率事件在一次试验中竟然发生了,不能不 使人怀疑所作假设的正确性,因此可以认为这 个盒子应该不是装有99个白球的那个盒子。
这个例子中所使用的推理方法,称为“带概率性
质的反证法”,或“概率反证法”。
2022/8/9
1-11
抽样分布
拒绝域 /2
1 -
置信水平 拒绝域 /2
临界值
H0值 临界值
样本统计量
1-26
第二十六页,编辑于星期五:十八点 三十四分。
双侧检验 (显著性水平与拒绝域)
抽样分布
拒绝域 /2
1 -
置信水平 拒绝域 /2
临界值
H0值 临界值
样本统计量
1-27
第二十七页,编辑于星期五:十八点 三十四分。
单侧检验
第五章 假设检验
第一节 假设检验概述 第二节 总体参数检验 第三节 非参数检验
5第五章 一元线性回归的假设检验
(OLS)估计量有最小方差。这使得OLS估计 量有着优良的性质可以进行统计推断
完全满足这些假定的方程在现实中是不存 在的,但这些假定为我们提供了一个比较 的基准,本课其他部分主要是围绕假定不 被满足时,分析后果,提出解决办法。返 回
第二节 OLS估计量的性质:高斯-马 尔可夫定理 p127
一、高斯-马尔可夫定理
当X是非随机的时,该假定自动满足 X是抽样时候人为设定的:比如前例中把家庭收入分
组
假定5:正态性假定:随机误差项服从正态分布
i ~ N (0, )
2
假定6:样本容量N>待估参数个数 假定7:解释变量 X值有变异性
即X有一个相对较大的取值范围 如果X只在一个狭窄的范围内变动,则无法充分估计X
若
|t| t /2(n-2),则拒绝H1 ,接受H0 ;返回
4、例题:葡萄酒拍卖价格的回归分 析
数据 应变量: ln(price): 1952~1980年间共10批, 用来自六个葡萄种植场的的葡萄酿造的60种不同 葡萄酒的价格,取其对数形式 自变量:
Age: 葡萄酒存放年数 Temp:葡萄生长期平均气温 Rain:8/9月份降雨量 Wrain:葡萄生长期前一年10月到次年3月降雨量
b
i
(n 2) Sb2i
b2
i
~ 2 (n 2)
ˆ bi bi 则t ~ t (n 2), 可以利用该信息进行统计检验 Sbi
返回
第三节 一元线性回归模型的假设检验 p130
一、检验 二、参数的显著性检验 三、回归的拟合优度检验 四、回归分析结果的报告 五、综合实例:美国商业部门工资和生产 率的关系 返回
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
利用 P 值 进行决策
什么是P 值?
(P-value)
1. 在原假设为真的条件下,检验统计量的观察 值大于或等于其计算值的概率
– 双侧检验为分布中两侧面积的总和
2. 反映实际观测到的数据与原假设H0之间不一 致的程度 3. 被称为观察到的(或实测的)显著性水平
4. 决策规则:若p值<, 拒绝 H0
/2
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(单侧检验 )
抽样分布
拒绝H0 置信水平
1-
临界值
0
样本统计量
假设检验中的小概率原理
什么小概率? 1. 在一次试验中,一个几乎不可能发生 的事件发生的概率 2. 在一次试验中小概率事件一旦发生, 我们就有理由拒绝原假设 3. 小概率由研究者事先确定
(significant level) 1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率
– 被称为抽样分布的拒绝域
3. 表示为 (alpha)
– 常用的 值有0.01, 0.05, 0.10
4. 由研究者事先确定
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
为什么要假设检验?
为了回答这个问题,我们必须知道: 样本平均身高与总体平均身高之差
x X 162 160 2cm
是由什么原因造成(或带来)的,即 是抽样误差造成的身高没变化 2cm产生的原因 不仅是误差, 确实是身高发生了变化
为什么要假设检验?
又如:同一种产品的两品牌产品的性能 和规格一样,但是某一质量参数的平均 值不同,现从两品牌中各抽取100产品,得 到: 甲平均参数74.82,标准差10.06 乙平均参数76.74,标准差9.11 请问:这两个品牌的平均质量参数是否 有显著的差异?
• 被称为显著性水平
2. 第Ⅱ类错误(取伪错误)
– 原假设为假时未拒绝原假设 – 第Ⅱ类错误的概率记为 (Beta)
错误和 错误的关系
和 的关系就像 翘翘板,小 就 大, 大 就小
你不能同时减 少两类错误!
显著性水平
假设检验中犯第一类错误的概率, 成为显著性水平
显著性水平
绿叶 洗涤 剂
500g
提出假设
(例题分析)
【例】一家研究机构估计,某城市中家庭拥有 汽车的比例超过30%。为验证这一估计是否正确 ,该研究机构随机抽取了一个样本进行检验。 试陈述用于检验的原假设与备择假设 解:研究者想收集证据予以支持的假设 是“该城市中家庭拥有汽车的比例超过 30%”。建立的原假设和备择假设为 H0 : 30% H1 : 30%
(null hypothesis)
1. 研究者想收集证据予以反对的假设 2. 又称“0假设” 3. 总是有符号 , 或 4.表示为 H0
–
–
–
H0 : = 某一数值 指定为符号 =, 或 例如, H0 : 10cm
备择假设
(alternative hypothesis)
提出假设
(结论与建议)
1. 原假设和备择假设是一个完备事件组,而且 相互对立
– 在一项假设检验中,原假设和备择假设必有一 个成立,而且只有一个成立
2. 先确定备择假设,再确定原假设 3. 等号“=”总是放在原假设上 4. 因研究目的不同,对同一问题可能提出不同 的假设(也可能得出不同的结论)
检验统计量
3.小概率由研究者事先确定
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ... ... 因此我们拒 绝假设 = 50
... 如果这是总 体的真实均值 20
= 50 H0
样本均值
假设检验的基本思想?
提出假设 作出决策
拒绝假设 别无选择!
总体
我认为平均年龄 是50岁
提出假设
(例题分析)
【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量 不少于500克。从消费者的利益出发,有关研究人员要通过 抽检其中的一批产品来验证该产品制造商的说明是否属实。 试陈述用于检验的原假设与备择假设
解:研究者抽检的意图是倾向于证 实这种洗涤剂的平均净含量并不符 合说明书中的陈述 。建立的原假设 和备择假设为 H0 : 500 H1 : < 500
为什么要假设检验?
还有:某减肥产品夸口说它的减肥效果 是如何如何的好,如果我们有一些志愿 者对该产品试服减肥,减肥前和减肥后 的体重发生了一些差异。 请问:体重发生的差异是否显著的?即 减肥是否真有效果,是否能相信该减肥 产品的减肥效果?
为什么要假设检验?
这样的例子很多,其实只要我们进行比 较、判断时:总体与样本比,不同总体 之间比,样本与样本比等,都要用到假设 检验。
0.05,即5% 0.01,即1%
在用计算机软件进行假设检验时,计算 机输出的检验结果是:t-值和p-值(pvalue)
T值就是我们刚才计算过的t值,对于不 同的分布,计算t值的方法和公式不一样。 p-值(p-value)就是对应于t值及之外的双 尾概率,即小概率。
这就是双尾概率,p值为0.045,即p=4.5%
双侧检验与单侧检验
1. 备择假设没有特定的方向性,并含有符号 “”的假设检验,称为双侧检验或双尾 检验(two-tailed test) 2. 备择假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验或 单尾检验(one-tailed test)
– – 备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
假设检验的基本问题
假设的陈述 两类错误与显著性水平 统计量与拒绝域 利用P值进行决策
假设的陈述
什么是假设?
(hypothesis)
对总体参数的具体 数值所作的陈述
– 总体参数包括总体均值 、比例、方差等
– 分析之前必需陈述
我认为这种新药的疗效 比原有的药物更有效!
原假设与备择假设
原假设
检验统计量
(test statistic)
1. 根据样本观测结果计算得到的,并据以对原 假设和备择假设作出决策的某个样本统计量
2. 对样本估计量的标准化结果
– – 原假设H0为真 点估计量的抽样分布
点估计量 — 假设值 标准化检验统计量 点估计量的抽样标准差
3. 标准化的检验统计量
拒绝域
显著性水平和拒绝域
1. 研究者想收集证据予以支持的假设 2. 也称“研究假设” 3. 总是有符号 , 或 4. 表示为 H1
– –
H1 : <某一数值,或 某一数值 例如, H1 : < 10cm,或 10cm
提出假设
(例题分析)
【例】 一种零件的生产标准是直径应为10cm,为 对生产过程进行控制,质量监测人员定期对一台 加工机床检查,确定这台机床生产的零件是否符 合标准要求。如果零件的平均直径大于或小于 10cm,则表明生产过程不正常,必须进行调整。 试陈述用来检验生产过程是否正常的原假设和被 择假设 解:研究者想收集证据予以证明的假设应该是 “生产过程不正常”。建立的原假设和备择假设 为 H0 : 10cm H1 : 10cm
162 160 2 t 4 5 0.5 n 100 (x X )
所以说明样本均值与总体均值的差不仅是 抽样误差,而是确实两者之间存在着显著 的差异,即该批妇女的身高增高了!
小概率事件:在一次事件中几乎不可能 发生的事件。 一般称之为“显著性水平,用 表示。 显著性水平一般取值为:
(左侧检验 )
抽样分布
拒绝H0
临界值
0
样本统计量
观察到的样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
拒绝H0
临界值
0
样本统计量
显著性水平和拒绝域
(右侧检验 )
抽样分布
拒绝H0
0
观察到的样本统计量
临界值
样本统计量
显著性水平和拒绝域
(右侧检验 )
抽样分布
拒绝H0
0
临界值
样本统计量
双侧检验 ,
即:
n
)
样本均值( x )服从正态分布 ( X, N 即 : x N (160, 5 ) 100
n
)
样本均值( x )与总体均值( X )在一个
n
范围内
的概率为68.27%.即 : P ( x X ) 68.27% n
第五章 简单统计推断2
假设检验
为什么要假设检验?
我们举妇女身高的例子,如果在2002年对10000 名妇女的身高进行了全面调查,得出平均身高 为160cm,标准差为5cm。 在2004年对该妇女(还是原总体)进行了随机 抽样调查,调查了100名妇女,测得样本身高 162cm,标准差为5cm。 请问:调查结果是否说明这批妇女的身高升高 了?
双侧检验与单侧检验
(假设的形式)
假设
原假设 备择假设
双侧检验
H0 : = 0 H1 : ≠0
单侧检验
左侧检验
H0 : 0 H1 : < 0
右侧检验
H0 : 0 H1 : > 0
两类错误
假设检验中的两类错误
1. 第Ⅰ类错误(弃真错误)
– 原假设为真时拒绝原假设 – 第Ⅰ类错误的概率记为
那么如何检验呢?
如何假设检验?
还是回到妇女身高的例子,已知样本均值与总 体均值相差2cm,这2cm是如何造成的? 是抽样误差造成的身高没变化 2cm产生的原因 不仅是误差, 确实是身高发生了变化