第三章 统计假设检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n
n
)。
一、u 检验
1. 何为 u 检验?
所谓 u 检验,即检验所用统计量为 u ,或者根据正态分 布计算概率。
2. 适用范围
(1) 由正态总体中抽样,n ≥30 (大样本)或 n<30(小样本); (2) 由非正态总体中抽样 n ≥30 (大样本)。
适 用 范 围
如果, 1)σ2为已知; 2)σ2虽然未知,但 n≥30(大样本)时; 均可用 u 检验来确定H0:μ=μ0 能否成立。
引进品种在16个田块种植,平均产量为370 kg/亩。 问:新品种与原品种在产量上有无本质差异。
H0:μ=μ0= 360kg/亩是错误的 正确的: μ= 370 kg/亩
当α=5%时: 正确的 μ= 370kg/亩, σx=10 kg/亩 所确定的正态分布中落入错误 的H0,即μ=μ0= 360kg/亩确定的置信区间(340.4 , 379.6)的概率为:
2. 犯两类错误的概率
犯α错误的概率:由于人为规定显著水平α为5%和1%,即否定区间的 概率为5%和1%,所以犯α型错误的概率为5%或1%。 犯β错误的概率:错误的总体μ=μ0决定的置信区间落在正确的总体μ 所 确定正态分布中的概率。
例: 某地一般小麦品种产量为360 kg/亩,标准差σ=10 kg/亩。
一、统计假设 (Hypothesis)
1. 基本概念 (Basic concept)
统计假设: 是对样本之间差异的显著性所做的是与否的假定; 是对两个样本或多个样本的来源是否一致所做的假定; 是对两个样本或多个样本间差异的来源所做的假定。 假设的种类: 零值假设(Null hypothesis): 记作H0, 亦称无效假设或解消假设。 含义:假定样本统计值之间的差异和波动是由试验误差引起 的,他们来自同一总体,无本质差别。 备择假设(Alternative hypothesis):记作HA。 含义:假定样本统计值之间的差异和波动不是由试验误差引 起的,而是存在本质差异。 H0与HA的关系: 二者是对立事件,一起构成完全事件系。 H0成立,则否定HA, 称为差异不显著; H0被否定,则接受HA,称为差异显著。
sx
s n

1.5 100
0.15
此处进行了参数的点估计
u
x sx

30.1 29.8 0.15
2
第3步:推断H0 正误 由于1.96 (u0.05) < u < 2.58 (u0.01) ,所以可在5%的显著水平上否定H0 : μ= μ0 = 29.8mm,接受HA,两者差异达显著水平,新品种的纤维长度 显著不同于原品种。
第二节 单个平均数的检验
U测验
检验某一样本 x 所属总体平均数μ和某一指定总体平均 数 μ0 的差异是否显著。
检验依据:平均数的抽样分布。 中心极限定律证明:当样本容量 n 很大时,不论原总 体是否属于正态分布,样本平均数 x 都遵从正态分布。
x
即 x 服从 N ( ,E ( x) 例
已知某棉花品种的纤维长度平均为29.8 mm。从一新品种中以n=100抽 样,平均纤维长度 x 30.1mm , s 1.5mm ,问:新品种的纤维长度是否不 同于原品种? 分析:总体方差未知,但 n>30 ,故可采取u检验。 第1步:提出假设 H0 :μ= μ0 = 29.8 mm; HA :μ≠μ0。 第2步:计算u值
区间估计 (Estimation of interval): 以一定概率作保证估计出参数所在的区间
统计假设检验
请思考以下问题
1.在同一田块种植玉米,重复5次。
肥料A, 产量500 kg/亩: 肥料B, 产量520 kg/亩。问: 肥料B的效果是否比A好?
2.某地一般小麦品种产量为360 kg/亩。
总体到样本
样本到总体
试验设计
试验过程
统计推断
• 一个试验方案中的一个处理相当于一个样本, 方案中有 n 个处理,则相当于该试验包括 n 个样本。 • 试验结束后,用方案中的 n 个处理(即 n 个样本)来 推断试验的处理效应。
统计推断
参数估计(Estimation of parameters) 点估计 (Estimation of point): 用统计数估计相应的参数
二、统计假设检验的基本方法
某地一般小麦品种产量为360 kg/亩,标准差σ =40 kg/亩, 引进品种在16个田块种植,平均产量为380 kg/亩。 问:新品种与原品种在产量上有无本质差异?
分析:
单个样本平均数与已知总体进行比较。 已知: μ0 =360 kg/亩,σ=40 kg/亩 x =380 kg/亩,n=16。
2 y 0.4472 n 10
U y 0

y
101 100 2.236 0.4472
-1.96
0
1.96
U=2.236>1.96,落在了否定区间,否定H0假设,该机工作不正常,需修理。
三、统计假设检验的两尾检验与一尾检验
两尾检验:
适用于样本所属总体μ 可能 >, 也可能 < 对比总体μ 0的假设检验。 否定区间分布在置信区间的左、右两侧。
概念的回忆:
样本平均数的标准差 x , 亦称样本平均数标准误差, 简称标准误差或 标准误。 平均数标准误和 u 值的计算如下:
x
n
u
当n
x 0
x
≥30,可用 sx 代替 x 。

已知大田小麦生长后期不喷磷,千粒重 μ 0 =36.0 g, σ 2=6.4g2; 试验 表明,喷磷:千粒重 x =37.9g,n = 10。 问:小麦生长后期叶面喷施磷对千粒重是否有作用? 分析;已知总体方差 ,故可以用u检验。
第三章 统计假设检验与t检验
(Chapter 3 Hypothesis testing in statistics & t test)
第一节 统计假设检验的基本原理 (Unit 1. Basic principles)
误差理论指导下制定试验方案→误差理论指导下进行各类 试验→试验后进行统计分析(在后一阶段接着学习)
a-μ 340.4 - 390 u1 = = σ x 10 = - 4.96 u2 = b-μ 379.6 - 390 = σ x 10 = - 1.04
P = P (u2) - P (u1) = P( - 1.04) - P (- 4.96) = - 0.35 +0.50 = 0.15
3)精密设计试验,增大样本容量n,使重复间变异变小,从而使 x 减 小,犯β的概率均减小。
σx = σ /√n = 40 /√16 =10 kg/亩
u1 = a-μ 340.4 - 390 = σ x 4 = - 12.4 u2 =
σx = σ /√n = 40 /√100 =4 kg/亩
b-μ 379.6 - 390 = σ x 4 = - 2.6
P = P (u2) - P (u1) = P(- 2.6) - P(- 12.4) = 0.04
方法3:根据u值直接判断——简化方法。
当 u ≥ 1.96 时,样本误差x - μ一定落在(-1.96σx,1.96σx) 之外, P(u) ≤ 0.05,可在5%的差异显著水平上否定H0。 当 u ≥ 2.58 时,样本误差x - μ一定落在 (-2.58σx,2.58σx) 之外, P(u) ≤ 0.01,可在1%的差异显著水平上否定H0。
方法2:根据置信区间进行判断。
α=5%时, 样本误差置信区间为(-1.96σx,1.96σx) 即 ( -19.6 , 19.6 ) α=1%时,样本误差置信区间为 (-2.58σx,2.58σx) 即 ( -25.8 , 25.8 )
样本误差x - μ0=380-360=20,落在( -19.6 , 19.6 )之外、 ( -25.8 , 25.8 )之内, 所以可在5%的差异显著水平上否定H0, 两品种差异达显著水平,新品种显著高 于老品种。得到这一结论的可靠度为95%。
假设方法
1. 对单个平均数的假设 Example: 某地一般小麦品种产量为 360 kg/ 亩,引进品 种在10个田块种植,平均产量为380 kg/亩。问:新引进品 种是否比当地一般小麦品种好? H0 : μ= μ0 = 360 kg/亩; HA : μ ≠μ0 2. 对两个平均数的假设 Example: 在同一田块种植玉米,重复5次。 肥料A, 产量500 kg/亩; 肥料B, 产量520 kg/亩。 问:肥料B的效果是否比A好? H0 : μ1= μ2 ; HA : μ1≠μ2
y

n

2 100
0.414
例:某工厂在正常工作状态时每包蔗糖重量具有N(100,2)特点。 某日抽查10包,得到每包蔗糖平均重量为101kg,问该打包机是否 处于正常工作状态?
假定H0:= 0=100,即该打包机处于正常工作状态。
假定HA:0,即该打包机处于不正常工作状态。
显著水平规定为:α=0.05。
一尾检验:
适用于样本所属总体μ应该 > ,或 < 对比总体μ0的假设检验。否定 区间仅分布在置信区间的左侧或右侧。
四、统计假设检验中的两类错误
1.两类错误
第一类错误:即弃真错误,否定正确H0 的错误。H0本来是正确的,但 检验结果否定了H0,又叫α错误。
第二类错误:即存伪错误,接受不正确H0的错误。H0本来是不正确的, 但检验结果却肯定了H0,又叫β错误。
u
查正态分布离差值表,当u=2时:P介于0.04~0.05之间。 第3步:根据确定的显著水平 α,划出置信区间或否定区间,判断无 效假设H0 是否成立
方法1:根据统计学小概率原理。
由于把 P < 5%的事件当作不可能事件对待。由于P<5%, 所以否定H0: μ= μ0 = 360 kg/亩;接受HA :μ≠μ0 ,新品种与 原品种在产量上的差异达到了 5%的显著水平 , 两者差异不 是随机误差,而是本质差异。
2
第1步:提出假设 H0 :μ= μ0 = 36.0 g; HA :μ≠μ0 第2步:计算u值
x
2
n

6.4 10
0.8
u
x 0
x

37.9 36.0 0.8
2.375
第3步:推断H0 正误 由于 0.05 , u0.05 1.96 , u 1.96 。 故可在5%的显著水平上否定 H0:μ = μ 0 = 36.0 g,接受HA,两者 差异达显著水平,小麦生长后期叶面喷施磷能显著增加千粒重。
第1步:提出假设 H0 : μ= μ0 = 360 kg/亩; HA : μ≠μ0
第2步:假定H0正确,计算检验所 用统计量的值。
σx = σ /√n = 40 /√16 =10 kg/亩
u = 380 - 360 x - μ0 = 10 σx = 2 -u P = P1 + P2 P1 P2
μ0
u1 =
a-μ = σ x
334.2 - 370 = -3.58 10
u2 =
b-μ = σ x
385.8 - 370 = 1.58 10
P = P (u2) - P (u1) = P(1.58) - P(-3.58) = 0.94
2. 减少两类错误的方法
1)提高显著水平:犯α错误的概率减少,犯β错误的概率增加。 2)增大μ和μ0或μ1和μ2之间的差值,差值愈大,一个总体的置信区 落入另一总体所确定的正态分布的概率就愈小,犯β错误的概率就 愈小。
a-μ 340.4 - 370 u1 = = σ x 10
= -2.96
u2 =
b-μ 379.6 - 370 = σ x 10
= 0.96
P = P (u2) - P (u1) = P(0.96) - P(-2.96) = 0.83147 - 0.00154 = 0.83
当α=1%时: 正确的 μ= 370kg/亩, σx=10 kg/亩 所确定的正态分布中落入错误 的H0,即μ=μ0= 360kg/亩确定的置信区间(334.2 , 385.8)的概率 为:
引进品种在10个田块种植,平均产量为 380 kg/亩。问: 新品种与原品种在产量上有无本质差异?
统计假设检验
简称: 假设检验(Testing of hypothesis)或统计检验,也 称为显著性检验(Tests of significance)。 含义:是对不同样本之间的差异是否显著,或试验的效 应能否确立(不同处理间的差异是否显著),所进 行的一种数学推断。 分类:包括u检验,t检验,χ2检验,方差分析四大类。
相关文档
最新文档