第八讲假设检验的计算1单总体
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八讲:单总体的假设检验
1
单总体假设检验的分类
单总体
均值
比例
方差
Z 检验
(一端和两端)
t 检验
(一端和两端)
Z 检验
(一端和两端)
F检验
(一端和两端)
2
一、基本知识
3
1、 建立假设:陈述原/零/虚无假设 H0 和研究/备择假设 H1
一般我们把实际被检验的假设称为零假设(用符号H0来表示),并用这 与备择假设(H1)相对比.
结论:
从总体上看,在0.05的显著性 水平上,新机床加工的零件的 椭圆度与以前有显著差异
17
大样本总体均值假设检验(一端)
1. 假定条件:总体服从正态分布 2.研究假设有<或>符号 3.使用 z 统计量
z xM Sn
18
大样本总体均值的假设检验 (一端)
拒绝 H0
0 左侧:H0: ≥ 0
H1: < 0
16
例题1(计算结果)
来自百度文库
解: H0: M = 0.081
H1: M 0.081
= 0.05
n = 200
临界值| Z a |=1.96 2
拒绝 H0
拒绝 H0
.005
.005
-1.96 0 1.96 Z
检验统计量:
zxM0.0760.0812.83 s n 0.025 200
决策:
拒绝H0,接受H1。
6
3.一端检验与二端检验
在何种情况下选择一端检验还是二端检验? 取决于是否可以确定研究假设(H1)的方向. 如果H1能定出方向,如<或>,则为一端检验. 如果H1定不出方向,如≠,则样本的统计值落在抽样
分布的右端或左端的可能性是相同的,因而要用二 端检验. 如果所选定的显著度相同的,二端检验比一端检验 更难否定原假设/虚无假设. 所以,要求成立研究假设时最好是尽可能清楚.
个开区间) 但由于非参数检验不理会总体的情况,在推论时就较为困
难,准确性也会因此而影响。因此,在总体确实具备某些 条件时,参数检验要比非参数检验法好。
11
二、检验的基本步骤
1. 建立假设:陈述原假设 H0和研究假设 H1 2.选择显著性水平 和否定域 3.求抽样分布 4.计算检验统计量 5.做判断
一般来讲,零假设总是假设几个组之间不存在差异,或几个变量之没有 关系,而备择假设则假设它们之间存在正相关或负相关的关系.
实际上,研究者一般都预期零假设是错误的,应予以否定,并据此而接
受备择的H1.但为了计算概率分布,在操作过程中,却必须先把H0看 作正确的.如果我们能证明H0是正确的可能性很少,那么就可以据 此顨 排除抽样误差的说法,百认为H1”可能”是对的。
12
三 、单个总体均值和比例的假设检验
(一)单个总体均值的检验 (二)单个总体比例的检验
13
(一)单个总体均值的检验
14
1.大样本总体均值检验(两端)
1.假定条件:总体服从正态分布
2.原假设为:H0: M=M0; 研究假设为:H1:M M0
3. 使用 z 统计量(通常n≥100)
z xM sn
拒绝 H0
Z
0
Z
右侧:H0: ≤ 0
H1: > 0
19
例题2
某批发商欲从生产厂家购进一批 灯泡,根据合同规定,灯泡的 使用寿命平均不能低于1000 小时。已知灯泡使用寿命服从 正态分布,标准差为20小时。 在总体中随机抽取100只灯泡, 测得样本均值为960小时。批 发商是否应该购买这批灯泡? (=0.05)
20
例题2(计算结果)
解:H0: 1000
H1: < 1000 = 0.05
检验统计量:
z x 0 960 1000 20 n 20 100
n = 100
Z 临界值 a =-1.65
拒绝域
-1.65 0
Z
决策:
在 = 0.05的水平上拒绝H0
结论:
因此,从总体来看,在0.05 的显著性水平上,这批灯泡 的使用寿命低于1000小时
5
与否定域相关连的统计学概念是显著度 (level of significance),表示否定域在整 个抽样分布中所占的比例,也即表示样本 的统计值落在否定域内的机会。
显著度(P)的大小,视研究的需要而定, 但在当前的社会学研究中,一般是以 p≤0.05作为准则.
当然,显著度愈小,便 愈难否定原假设,也即 愈难证明研究假设/备择假设是对的.
21
2、小样本单总体均值的两端 t 检验
1. 假定条件
总体为正态分布
2. 使用t 统计量(t的分布形态决取于自由度。 Df=n-1)
检验假设的基本原则是直接检验H0,因而间接地检验H1,目的是排
除抽样误差的可能性。
4
2、选择显著性水平和否定域
P153 所谓否定域(CR),就是抽样分布内
一端或两端的小区域,如果样本的统计 值在此区域范围内,则否定原假设。 我们可以指定否定域在抽样分布的一端, 也可以是两端。究竟是一端还是两端, 则要视研究假设(H1)的性质而定。
7
假 研究的问题(以总体均值M的检验为例)
设 两端检验 左端检验 右端检验
H 1 u≠u0
H 0 u=u0
u<u0 u≥u0
u>u0 u≤ u0
8
4、两种错误(typeⅠ和typeⅡ)
当我们以样本的统计值来检验假设时,最 后的结果无论是否定还是接受,都可能犯 错误.
第一种错误(弃真的错误):是指否定H0,但 实际上H0是正确的概率.
N(0,1)
Z检验
15
例题1
某机床厂加工一种零件,根据经验知 道,该厂加工零件的椭圆度近似服从 正态分布,其总体均值为 M0=0.081mm,总体标准差为s= 0.025 。 今换一种新机床进行加工,抽取 n=200 个 零 件 进 行 检 验 , 得 到 的 椭 圆 度均值为0.076mm。试问新机床加工 零件的椭圆度的均值与以前有无显著 差异?(=0.05)
第二种错误(纳伪的错误):是指接受H0, 但实际上H0是错误的概率。
这两种错误是成反比的,是对立的。
9
真实情况 H0为真 H0不真
所做决策
接受H0
拒绝H0
正确
犯第Ⅰ类错误 (弃真)
犯第Ⅱ类错误 正确 (纳伪)
10
5、两种检验的角度:参数检验与非参 数检验
(1)参数检验(Z、T、F)要求总体具备一些条件: 正态分布;定距测量层次;方差齐性等 (2)非参数检验(X2) ①总体分布不易确定(也就是不知道是不是正态分布); ②分布呈非正态而无适当的数据转换方法; ③等级资料; ④一段或两段无确定数据等(比如一段的数据是>50,是一
1
单总体假设检验的分类
单总体
均值
比例
方差
Z 检验
(一端和两端)
t 检验
(一端和两端)
Z 检验
(一端和两端)
F检验
(一端和两端)
2
一、基本知识
3
1、 建立假设:陈述原/零/虚无假设 H0 和研究/备择假设 H1
一般我们把实际被检验的假设称为零假设(用符号H0来表示),并用这 与备择假设(H1)相对比.
结论:
从总体上看,在0.05的显著性 水平上,新机床加工的零件的 椭圆度与以前有显著差异
17
大样本总体均值假设检验(一端)
1. 假定条件:总体服从正态分布 2.研究假设有<或>符号 3.使用 z 统计量
z xM Sn
18
大样本总体均值的假设检验 (一端)
拒绝 H0
0 左侧:H0: ≥ 0
H1: < 0
16
例题1(计算结果)
来自百度文库
解: H0: M = 0.081
H1: M 0.081
= 0.05
n = 200
临界值| Z a |=1.96 2
拒绝 H0
拒绝 H0
.005
.005
-1.96 0 1.96 Z
检验统计量:
zxM0.0760.0812.83 s n 0.025 200
决策:
拒绝H0,接受H1。
6
3.一端检验与二端检验
在何种情况下选择一端检验还是二端检验? 取决于是否可以确定研究假设(H1)的方向. 如果H1能定出方向,如<或>,则为一端检验. 如果H1定不出方向,如≠,则样本的统计值落在抽样
分布的右端或左端的可能性是相同的,因而要用二 端检验. 如果所选定的显著度相同的,二端检验比一端检验 更难否定原假设/虚无假设. 所以,要求成立研究假设时最好是尽可能清楚.
个开区间) 但由于非参数检验不理会总体的情况,在推论时就较为困
难,准确性也会因此而影响。因此,在总体确实具备某些 条件时,参数检验要比非参数检验法好。
11
二、检验的基本步骤
1. 建立假设:陈述原假设 H0和研究假设 H1 2.选择显著性水平 和否定域 3.求抽样分布 4.计算检验统计量 5.做判断
一般来讲,零假设总是假设几个组之间不存在差异,或几个变量之没有 关系,而备择假设则假设它们之间存在正相关或负相关的关系.
实际上,研究者一般都预期零假设是错误的,应予以否定,并据此而接
受备择的H1.但为了计算概率分布,在操作过程中,却必须先把H0看 作正确的.如果我们能证明H0是正确的可能性很少,那么就可以据 此顨 排除抽样误差的说法,百认为H1”可能”是对的。
12
三 、单个总体均值和比例的假设检验
(一)单个总体均值的检验 (二)单个总体比例的检验
13
(一)单个总体均值的检验
14
1.大样本总体均值检验(两端)
1.假定条件:总体服从正态分布
2.原假设为:H0: M=M0; 研究假设为:H1:M M0
3. 使用 z 统计量(通常n≥100)
z xM sn
拒绝 H0
Z
0
Z
右侧:H0: ≤ 0
H1: > 0
19
例题2
某批发商欲从生产厂家购进一批 灯泡,根据合同规定,灯泡的 使用寿命平均不能低于1000 小时。已知灯泡使用寿命服从 正态分布,标准差为20小时。 在总体中随机抽取100只灯泡, 测得样本均值为960小时。批 发商是否应该购买这批灯泡? (=0.05)
20
例题2(计算结果)
解:H0: 1000
H1: < 1000 = 0.05
检验统计量:
z x 0 960 1000 20 n 20 100
n = 100
Z 临界值 a =-1.65
拒绝域
-1.65 0
Z
决策:
在 = 0.05的水平上拒绝H0
结论:
因此,从总体来看,在0.05 的显著性水平上,这批灯泡 的使用寿命低于1000小时
5
与否定域相关连的统计学概念是显著度 (level of significance),表示否定域在整 个抽样分布中所占的比例,也即表示样本 的统计值落在否定域内的机会。
显著度(P)的大小,视研究的需要而定, 但在当前的社会学研究中,一般是以 p≤0.05作为准则.
当然,显著度愈小,便 愈难否定原假设,也即 愈难证明研究假设/备择假设是对的.
21
2、小样本单总体均值的两端 t 检验
1. 假定条件
总体为正态分布
2. 使用t 统计量(t的分布形态决取于自由度。 Df=n-1)
检验假设的基本原则是直接检验H0,因而间接地检验H1,目的是排
除抽样误差的可能性。
4
2、选择显著性水平和否定域
P153 所谓否定域(CR),就是抽样分布内
一端或两端的小区域,如果样本的统计 值在此区域范围内,则否定原假设。 我们可以指定否定域在抽样分布的一端, 也可以是两端。究竟是一端还是两端, 则要视研究假设(H1)的性质而定。
7
假 研究的问题(以总体均值M的检验为例)
设 两端检验 左端检验 右端检验
H 1 u≠u0
H 0 u=u0
u<u0 u≥u0
u>u0 u≤ u0
8
4、两种错误(typeⅠ和typeⅡ)
当我们以样本的统计值来检验假设时,最 后的结果无论是否定还是接受,都可能犯 错误.
第一种错误(弃真的错误):是指否定H0,但 实际上H0是正确的概率.
N(0,1)
Z检验
15
例题1
某机床厂加工一种零件,根据经验知 道,该厂加工零件的椭圆度近似服从 正态分布,其总体均值为 M0=0.081mm,总体标准差为s= 0.025 。 今换一种新机床进行加工,抽取 n=200 个 零 件 进 行 检 验 , 得 到 的 椭 圆 度均值为0.076mm。试问新机床加工 零件的椭圆度的均值与以前有无显著 差异?(=0.05)
第二种错误(纳伪的错误):是指接受H0, 但实际上H0是错误的概率。
这两种错误是成反比的,是对立的。
9
真实情况 H0为真 H0不真
所做决策
接受H0
拒绝H0
正确
犯第Ⅰ类错误 (弃真)
犯第Ⅱ类错误 正确 (纳伪)
10
5、两种检验的角度:参数检验与非参 数检验
(1)参数检验(Z、T、F)要求总体具备一些条件: 正态分布;定距测量层次;方差齐性等 (2)非参数检验(X2) ①总体分布不易确定(也就是不知道是不是正态分布); ②分布呈非正态而无适当的数据转换方法; ③等级资料; ④一段或两段无确定数据等(比如一段的数据是>50,是一