均值检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.3
5.3.1 单正态总体均值检验
当总体标准差 σ 已知时,有公式
均值检验
Z=
X −µ ~ N ( 0 , 1) σ n
当总体标准差 σ 未知时,有公式
t=
(X − µ) ~ t (n − 1) S n
式子中, S 为样本标准差:
n
S=
∑(X
i =1
i
− X j ) 2 (n − 1)
5.3.1 总体标准差 σ 已知 1 临界值法
5.3.2.1 双正态总体均值检验
假设 X ~ N ( µ1 , σ 1 ) , Y ~ N ( µ 2 , σ 2 ) ,从总体 X 中抽取样本 X 1 , X 2 ,⋯. X n ,样本均值为 X ,
2 2 2 样本方差为 S X ,样本标准差为 S X ,从总体 Y 中抽取的样本为 Y1 , Y2 ,⋯Y n ,样本均值为 Y , 样 2
根据不同的备择假设给出不同的拒绝域, (1) 关于总体均值 µ 常用的三对假设:
1) H 0 : µ = µ 0 , H1 : µ ≻ µ 0 ⎫ ⎬ 单边假设检验 2) H 0 : µ = µ 0 , H1 : µ ≺ µ 0 ⎭
H 0 : µ = µ 0 , H1 : µ ≠ µ 0
(2) 检验统计量选择 Z 统计量.
本方差为 SY ,样本标准差为 SY 。 分 3 种情况讨论: 1) H 0 : µ1 = µ 2 , H 1 : µ1 ≻ µ 2 2) H 0 : µ1 = µ 2 , H 1 : µ1 ≺ µ 2 3) H 0 : µ1 = µ 2 , H 1 : µ1 ≠ µ 2 1, σ 1 , σ 2 已知,可以采用统计量
例子
快递公司投递时间
2. 正态性检验 例子面粉数据 AD 检验,RJ 检验以及 KS 检验
5.3.2 双正态总体均值检验
要求:从两个正态总体中抽取样本。注意区分抽取的两组样本是独立的还是配对的。 区别:从两个总体中抽取的样本观测值彼此互不影响,抽取的样本量也可以不同,则这样的 样本是普通的独立样本;若选取的样本观测值是成对的,即使对选定的一组个体,分别观测 在两种处理之后的结果,则称这样的样本为配对样本。
H 0 : µ = 0, H1 : µ > 0
其具体形式可能有 3 种:
H 0 : µ = 0, H1 : µ > 0 H 0 : µ = 0, H1 : µ < 0 H 0 : µ = 0, H1 : µ ≠ 0
即都是单个正态总体均值是否为 0 的检验问题。 方法采用单样本的 t 检验。 在 MINITAB 中的操作方法是统计>基本统计量>单样本 t (Stat>Basic Statistics>1-Sample t) ,检验统计量变
双边假设检验
Z=
X − µ0 σ n
在 H 0 成立时, Z ~ N (0,1) (3)对应这 3 个备择假设,他们各自的拒绝域分别为: 1) H 1 : µ ≻ µ 0 时,拒绝域是: Z ≻ Z1−α 2) H 1 : µ ≺ µ0 时, 拒绝域是: Z ≺ Zα 。 根据标准正态分布的对称性, Zα = − Z1−α
2
大样本 (n ≥ 30) 时, 上述检验统计量的拒绝域中的 t 分位数都可以近似用标准正态分布分位 数来代替。
2
p 值比较法
通过 MINITAB 软件指令:统计>基本统计量>单样本(Stat>Basic Statistic>1-Sample t) 例子 面粉质量,此时不知道总体标准差
5.3.1.3 但总体检验所需要验证的条件
MINITAB 中,可以省略求出差值 d 的步骤直接用统计>基本统计量>配对 t(Stat>Basic Statistics>Paired t)即成对 t 检验来对两列原始数据直接进行
例子 减肥药药效问题
(2)样本量超过 40。此时不能查表,但是可以对游程总个数用正态近似。设立假设
H 0 :数据是相互独立的 H1 :数据不是相互独立的
求出中位数, 再以中位数为界, 用统计>非参数统计>游程检验 (Stat>Nonparametric>Runs test) 求出游程总数,并用正态近似法计算出 p 值,当 p 小于 α 时,拒绝原假设。 注:样本量超过 25 就可以使用正态近似法
数据在进行单样本 Z 检验或单样本 t 检验的时候必须验证所有数据同时符合下述条件: (1)数据观测值是相互独立的; (2)数据必须服从正态分布。
1. 独立性检验
方法:游程检验 假设检验的基础:我们所收集的数据是来自同一总体的随机独立样本。 定义: 依时间或其他顺序排列的有序数列中, 具有相同的时间或符号的连续部分成为一 个游程,常常记 r 为游程总个数。例如
{t > t1−α (n + m − 2)}, {t < −t1−α (n + m − 2)}, {t
> t1−α 2 (n + m − 2)
}
注意:实践中此种情况应用较多,即双样本的 t 检验。 条件: (1)两组样本内相互独立,两组间也相互独立; (2)两组数据均来自正态分布总体; (3)两个总体方差(或标准差)相等 σ 1 = σ 2
t=
X − µ0 ,在 H 0 成立的条件下, t ~ t ( n − 1) S n
(3)对应这三对假设,他们各自的拒绝域分别是: 1) H 1 : µ ≻ µ 0 时,拒绝域是 t > t1−α ( n − 1) 2) H 1 : µ ≺ µ0 时,拒绝域是 t < tα ( n − 1) ,根据 t 分布的对称性, tα = −t1−α , 此拒绝域可改写成 t < −t1−α ( n − 1) 3) H 1 : µ ≠ µ0 时,拒绝域是 t > t1−α ( n − 1)
2 2
3, σ 1 , σ 2 未知,且不知道 σ 1 = σ 2 且不知道 σ 1 = σ 2(或缺失知道二者不等) , 可以采用近似双样本的 t 检验, σ 1 , σ 2 未知, 其统计量为
t=
X −Y
2 SX S2 + Y n m
,其自由度 υ 去最接近下列数值 υ 的整数
2 SX S2 + Y )2 υ = 2 n2 m 2 ( S X n ) ( SY m) 2 + n −1 m −1
n
成t =
d Sd n
,S = d
∑ (d
i =1
i
− d )2
在显著收评为 α 时,拒绝域参照
n −1
H1 : µ ≻ µ 0 时,拒绝域是 t > t1−α (n − 1) H1 : µ ≺ µ 0 时,拒绝域是 t < tα (n − 1) H1 : µ ≠ µ 0 时,拒绝域是 t > t1−α 2 (n − 1)
例子 ①快递公司投递时间②面粉生产质量变化 5.3.1.2 总体标准差未知时 1 临界值法
(1)关于总体均值 µ 常用的三对假设:
1) H 0 : µ = µ 0 , H1 : µ ≻ µ 0 ⎫ ⎬ 单边假设检验 2) H 0 : µ = µ 0 , H1 : µ ≺ µ 0 ⎭
3) H 0 : µ = µ 0 , H 1 : µ ≠ µ 0 双边假设检验 (2)当小样本(n<30)时,用 σ 的估计 S 代替 Z 统计量中的 σ 而得到 t 统计量:
(
例子
生物需氧量 BOD;
A,B 两个工人生产轴棒直径
5.3.2.2
配对样的两批人,一批吃药,一批未吃药,用量总体的均 值检验问题,容易得出疗效不显著的结论②同一批人,先记录原始体重,在记录吃药后的体 重,这样把同一人用药前后的体重进行被叫,求出差值,即可度量出药效。检验方法:看体 重减少量 d 的均值是否为正数。 假设 X i , Yi 是第 i 位人士减肥前后的体重,则 d i = X i −Y i(i = 1,2,⋯ n) 是第 i 位人士的 体重减少量,记 µ 为体重减少量 d 的均值,则需要检验的问题变成
H 0 :数据是相互独立的 H1 :数据不是相互独立的
用 统计>质量工具>运行图(Stat>Quality Tools>Run Chart)可以给出游程总个数 r 的计算结 果,然后查表确定下临界值 R1 以及上临界值 R2 。当 r ≤ R1 或 r ≥ R2 时,拒绝原假设
例子 面粉质量数据是否独立
{
2
}
2, σ 1 , σ 2 未知,但是 σ 1 = σ 2 可以采用检验统计量:
t=
X −Y 1 1 SW + n m
2 2 (n − 1) S X + (m − 1) SY ,在 H 0 成立的条件下, t ~ t ( n + m − 2) ,则可可知三 n+m−2
其中 SW =
个 检 验 问 题 的 拒 绝 yuyu , 可 以 用 t 分 布 的 分 位 数 得 到 , 分 别 是
��� � ��� + + + + − − − − + + + − +− − − − � − −+ � ���
此游程数为 r=6 具体计算方法①样本量较小(小于 40)时,有临界值表可查;②在样本量较大的时, 可以使用正态近似,计算机软件可以直接算出结果。从 MINITAB 统计>非参数统计>游程检 验(Stat>Nonparametric>Runs Test)可以检验样本的独立性,也可以用来检验任何序列的随 机性,而不管这个序列是怎样产生的。 条件:大样本情况下,游程个数可以近似认为是正态分布。 缺点需要手工输入中位数才可以, 其默认功能是以平均值为界进行游程检验, 而独立性 检验必须以中位数为界进行游程检验。 根据样本量大小可分为 2 种情况 (1)当样本量不超过 40 时,设立如下假设
Z ≺ − Z1−α
3) H 1 : µ ≠ µ0 时,拒绝域是: Z ≺ Z1−α
2
Z1−α 是标准正态分布的 1 − α
分位数,
根据标准正态分布的对称性, Zα = − Z1−α
2
p 值比较法
已知总体标准差时, 通过 MINITAB 软件指令 “统计>基本统计量>单样本 Z (Stat>Basic Statistics>1-Sample Z)来实现
Z=
X −Y
2 σ 12 σ 2 + n m
在 H 0 成立,即 µ1 = µ 2 时, Z ~ N (0,1) 对检验问题 1) H 0 : µ1 = µ 2 , H 1 : µ1 ≻ µ 2 ,拒绝域为 {Z > Z1−α } 对检验问题 2) H 0 : µ1 = µ 2 , H 1 : µ1 ≺ µ 2 ,拒绝域为 {Z < − Z1−α } 对检验问题 3) H 0 : µ1 = µ 2 , H 1 : µ1 ≠ µ 2 ,拒绝域为 Z > Z1−α
相关文档
最新文档