正态总体及二项分布百分数的假设检验
正态总体参数的假设检验
的样本,EX
1 , DX
2 1
,
EY
2 , DY
2 2
,
则由中心极限定理知,
当n1和n2 较大时
U
X
Y
(1
2)
近似
~ N (0,1)
其中
2 1
n1
2 2
n2
故对大样本(n1和n2较大), 仍可用U检验法,这时拒绝条件仍如上表 所示.
如果
2 1
,
2 2
2
2 /2
2 (n 1)
2 2
0
2
2 1
概率统计(ZYH)
例1 某车间生产铜丝, 据经验知该车间生产的铜丝折 断力X~N(570,82).今换了一批质量较好的原材料,从性能上 看,估计折断力的方差不变,但不知折断力是否有所增强.故 从新生产的铜丝中抽取了十个样品,测得折断力(单位:N)为
n1
2 2
n2
T法
2 1
=
2 2
但未知
1 2 1 2 1 2
1 2 T
X Y
1 2
Sw 1 n1 1 n2
1 2 Sw
(n1 1)S12 (n2 1)S22 ) (n1 n2 2)
N (0,1)
N (0,1) t (n 1)
| U | u / 2 U u U u
| T | t / 2 T t T t
2法
2
2 0
数理统计17:正态总体参数假设检验
数理统计17:正态总体参数假设检验现在,我们对正态分布的参数假设检验进⾏讨论,这也是本系列的最后⼀部分内容。
由于本系列为我独⾃完成的,缺少审阅,如果有任何错误,欢迎在评论区中指出,谢谢!⽬录Part 1:基本步骤正态总体N (µ,σ2)参数的假设检验不外乎遵循以下的步骤:找到合适的统计量,⽤统计量的取值范围设计拒绝域。
假定原假设为真,考虑这个条件下统计量的分布。
根据统计量的分布,根据检验的⽔平要求设置拒绝域的边界值。
设计检验的核⼼在于假定原假设为真,这是因为检验的⽔平是基于弃真概率定义的,也就是说,要在第三步中写出检验的⽔平,就必须在H 0成⽴的情况下找出⼩概率事件的发⽣条件。
⽐如,对于均值的检验⼀共有三种:1.H 0:µ=µ0↔H 1:µ≠µ0;2.H 0:µ≥µ0↔H 1:µ<µ0;3.H 0:µ≤µ0↔H 1:µ>µ0.每⼀种⼜可以细分为⽅差σ2已知和⽅差σ2未知两种情况,但显然不论⽅差是否已知,最核⼼的统计量都应该是¯X,如果⽅差未知可能还要⽤到⽅差的替代:S 2。
以下,对于这三种问题,拒绝域分别应该是这样的:如果H 0被接受,则¯X 既不应该太⼤,也不应该太⼩,拒绝域的基础形式应该是{¯X >c 1}∪{¯X <c 2}.如果H 0被接受,则¯X 不应该太⼩,⽆论多⼤都可以,拒绝域的基础形式应该是{¯X <c }.如果H 0被接受,则¯X 不应该太⼤,⽆论多⼩都可以,拒绝域的基础形式应该是{¯X>c }.当然,这只是拒绝域的基础形式,实际情况下可能不⽌使⽤¯X,但基本思想应该是这样的。
对于⽅差的检验,则将检验统计量换成了S 2,或者均值已知情况下的离差平⽅和Q 2,步骤也和上⾯的差不多。
正态总体的假设检验
n
(Xi μ)2
P { i1
σ
2 0
χ
2 1
α 2
(
n)}
P{
i 1
σ
2 0
χ
2
α
(
n)}
α
2
所以拒绝域为: W
{
χ2
χ
2 1
α 2
(
n)
,χ
2
χ
2
α
(n)
}
2
2. μ未知时,总体方差σ2的假设检验 χ2 检验法
类型 原假设 备择假设
H0
H1
检验统计量
双边 检验
σ2
σ
2 0
σ2
得s=0.007欧姆.设总体服从正态分布,参数均未知,
问在显著性水平α=0.05下,能否认为这批导线的
标准差显著地偏大?
解: s2 0.0072 0.0052
原假设 H 0 : σ 2 0.0052,备择假设 H1 : σ 2 0.0052
检验统计量: χ 2 (n 1)S 2
σ2
拒绝域:
第二节 正态总体的假设检验
一、单一正态总体均值μ的假设检验
二、单一正态总体方差σ2的假设检验 三、两个正态总体均值的假设检验 四、两个正态总体方差的假设检验
一、单一正态总体均值μ的假设检验
设总体X~N (, 2). X1 , X2 , … , Xn是取自X的样本,
样本均值 X样,本方差S2
1.已知
T t(α n 1)
例1. 设某次考试的考生的成绩服从正态分布,从中随
机地抽取36位考生的成绩,算得平均成绩为66.5分,标 准差为15分,问在显著性水平0.05下,是否可以认为在 这次考试中全体考生的平均成绩为70分?
正态总体参数假设检验
犯第一类 错误 正确
正确 犯第二类 错误
Page 23
Chapter 7 假设检验
犯第一类错误的概率 和犯第二类错误的概率 可以用同一个函数表示,即所谓的势函数。定义 如下: 定义7.1.1 设检验问题 H0 : 0 vs H1 : 1
的拒绝域为W,则样本观测值落在拒绝域内 的概率称为该检验的势函数,记为
Page 20
Chapter 7 假设检验
正如在数学上我们不能用一个例子去证明一个 结论一样,用一个样本(例子)不能证明一个 命题(假设)是成立的,但可以用一个例子 (样本)推翻一个命题。因此,从逻辑上看, 注重拒绝域是适当的。
Page 21
Chapter 7 假设检验
三、选择显著性水平
检验可能犯以下两类错误: 其一是 H 0为真但样本观测值落在拒绝域中, 从而拒绝原假设 H 0 ,这种错误称为第一类错 误,其发生的概率称为犯第一类错误的概率, 或称拒真概率,通常记为.
用参数估计 的方法处理
用假设 检验的 方法来 处理
Page 4
Chapter 7 假设检验
假设检验的一般问题
一、什么是假设检验 二、假设检验的基本思想 三、双侧检验和单侧检验 四、假设检验中的拒绝域和接受域 五、假设检验的两类错误 六、假设检验中的P值 七、假设检验的步骤
Page 5
Chapter 7 假设检验
参数估计和假设检验
参数估计和假设检验是统计推断的两个 组成部分,都是利用样本对总体进行某 种推断,但推断的角度不同。参数估计 讨论的是用样本统计量估计总体参数的 方法。假设检验讨论的是用样本信息去 检验对总体参数的某种假设是否成立的 程序和方法。
Page 3
正态总体参数的假设检验
W1 ( 12 , )
统计量
2
(X
i 1
i
0 )
2 0
2
~ (n)
2
2、单个总体,未知, 的检验
统计量
2
2 (n 1) Sn 1
2 0
2
~ (n 1)
2
2
2 2 和 双侧检验:临界值 1
2 单侧检验:临界值 或 12
a) H 0 : 0 , H1 : 0 ; b) H 0 : 0 , H1 : 0
a), b) 为左单侧检验
x 0 H 0成立 统计量U ~ N (0,1) 0 / n
临界值为 u1 u
拒绝域W1 (, U 1 ) ,接受域 W0 [ U 1 , )
例 7.1.1 某药厂包装硼酸粉,规定每袋净重为 0.5 ( kg ) ,设每袋重量服从正态分布,标准差
0.014 (kg) 。为检验包装机的工作是否正常,随
机抽取 10 袋,称得净重分别为: 0.496 0.510 0.515 0.506 0.518 0.512 0.524 0.497 0.488 0.511 问这台包装机的工作是否正常
解:1)检验假设 H0 : 0; H1 : 0
2)统计量 t x 0 s/ n 3)计算观测值
H 0 成立
~ t (4)
x 45 . 98 , s 1 . 535
| 45 . 98 48 | | t | 2 . 942 1 . 535 / 5
4)与临界值比较 | t | 2 . 942 2 . 7764 t 0 .025 ( 4 ) (统计量的值落在拒绝域内) 结论:拒绝原假设,即认为 48 。
正态分布假设检验
正态分布假设检验一、概述正态分布假设检验是统计学中常用的一种方法,用于判断一个数据集是否符合正态分布。
正态分布是指在统计学中,当数据集的频率分布呈钟形曲线时,称其为正态分布。
正态分布在实际应用中非常广泛,因为许多自然现象都遵循这种分布规律。
对于一个数据集而言,如果它符合正态分布,则可以使用一系列的统计方法进行进一步的研究和分析。
二、检验方法1. 假设检验假设检验是指通过样本数据来推断总体参数的方法。
在正态分布假设检验中,我们需要对总体均值和标准差进行假设检验。
具体而言,我们需要提出原假设和备择假设两个假设:原假设:样本数据符合正态分布;备择假设:样本数据不符合正态分布。
在进行实际计算时,我们需要根据样本数据来计算出样本均值和标准差,并使用这些数据来推断总体均值和标准差是否符合正态分布。
2. 正态概率图正态概率图是判断一个数据集是否符合正态分布的常用方法之一。
它通过将数据集的分位数与正态分布的分位数进行比较,来判断数据集是否符合正态分布。
具体而言,正态概率图将数据集的每个值按照从小到大的顺序排列,并计算出每个值对应的标准化值(即该值与样本均值之间的差除以样本标准差)。
然后,将这些标准化值按照从小到大的顺序排列,并绘制在图表上。
如果数据集符合正态分布,则这些标准化值应当近似于一个直线。
3. 偏度和峰度检验偏度和峰度是用来描述一个数据集形态特征的指标。
在正态分布中,偏度为0,峰度为3。
因此,在进行正态分布假设检验时,我们可以通过计算样本偏度和峰度来判断样本是否符合正态分布。
具体而言,如果样本偏度和峰度与正态分布相差不大,则可以认为样本符合正态分布。
三、实例演示以下是一个实例演示,在Python中使用scipy库进行正态分布假设检验:```pythonimport numpy as npfrom scipy import stats# 生成100个随机数data = np.random.normal(0, 1, 100)# 进行正态性检验k2, p = stats.normaltest(data)alpha = 0.05# 输出检验结果print("p = {}".format(p))if p < alpha:print("数据不符合正态分布")else:print("数据符合正态分布")```在上述代码中,我们首先生成了一个包含100个随机数的数据集。
百分数的假设检验
(2) np 和 nq > 30 ,无需连续矫正,用u检验;
(3)事先不知两块麦田的锈病发病率孰高孰低, 用双尾检验。
(1)假设 H0: p1=p2 即两块麦田锈病发病率没有显著差异。 HA: p1 ≠ p2
(2)水平 选取显著水平α=0.01
(3)检验
pˆ1
u>2.58,P<0.01
(4)推断
在0.01显著水平上,否定H0,接受HA; 认为两块麦田锈病发病率有极显著差异,即地 势对小麦锈病的发生有极显著影响作用,低洼 地小麦锈病的发病率极显著高于高坡地。
例:某鱼场发生了药物中毒,
抽查甲池中的29尾鱼,有20尾死亡
抽查乙池中的28尾鱼,有21尾死亡
检验甲、乙两池发生药物中毒以后,鱼的死亡率 是否有显著性差异。
(3)检验
pˆ1
x1 n1
20 29
0.690
pˆ 2
x2 n2
21 28
0.750
p x1 x2 20 21 0.719 n1 n2 29 28
q 1 p 0.281
s pq( 1 1 ) 0.119pˆ1 pˆ 2n来自 n2tc pˆ1
pˆ 2
0.5 0.5 n1 n2
(1)2个样本频率的假设检验;
分 (2) 5 < np 和 nq < 30 ,需进行连续矫正,
析
因n1<30,n2<30,用t检验;
(3)事先不知两池鱼的死亡率孰高孰低,用双尾检验。
(1)假设 (2)水平
H0: p1=p2 即甲乙两池鱼的死亡率没有显著差异 HA: p1 ≠ p2 选取显著水平α=0.05
n
§6.4正态总体的假设检验
i=1 i=1 n
2. 两个总体方差的假设检验: 两个总体方差的假设检验
~ F(m, n)
P{F ≤ F−α 2 (m, n)} = P{F ≥ F 2 (m, n)} = α 1 α
拒绝域为: 拒绝域为 {F ≤ F −α 2 (m, n)}∪{F ≥ F 2 (m, n)} 1 α
2
P{χ ≤ χ
2
2 1−α
2
(n −1)} = P{χ ≥ χα (n −1)} = α
2 2 2
2
2
2
2 拒绝域为: 拒绝域为 {χ 2 ≤ χ 2 α (n −1)}∪{χ 2 ≥ χα (n −1)} 1−
判断: 的观测值落入拒绝域, 拒绝H 否则, 接受H 判断 χ2 的观测值落入拒绝域 拒绝 0 , 否则 接受 0.
2
2 0.975
( 9 ) = 2.70
χ2 的观测值为 χ2=15.20 的观测值为:
2 0.975
(10 ) ≤ χ ≤ χ
2 0.025
(10 )
所以在显著性水平α=0.05 下接受 0. 下接受H 所以在显著性水平
独立, 设X~N(μ1,σ12), Y~N(μ2,σ22) 独立 X1 , … , Xm , Y1 , …, Yn分别是取自X, Y 的样本, 分别是取自 的样本 H0: σ12=σ22, H1: σ12≠σ22 均已知: (1) μ1, μ2 均已知: m H0 为真时 取 为真时,取
2 2 2
2 2 1−α 2 2
2
2 2
拒绝域为
{χ ≤ χ
(n)}∪{χ ≥ χα (n)}
正态总体比例的假设检验
解题详细步骤见教材P226。
7
应用统计学
1
应用统计学
2
任务
正态总体比例的假设检验
一、一个总体比例的假设检验
根据棣莫佛—拉普拉斯中心极限定理,在大样本情况下,二项分布逼近 正态分布。所以,可以将这个问题转化为正态分布来处理,其检验统计量z 为
z p ~N(0 ,1) (1 )
n
(7-6)
p
式中,
——样本比例; ——总体比例的假设值。
解题详细步骤见教材P225。
4
任务
正态总体比例的假设检验
二、两个总体比例之差的假设检验
两个总体比例之差的假设检验与两个总体均值之差 的检验方法基本相同。单个总体的比例服从二项分布,
在大样本(或 np 5 )情况下,二项分布逼近正态分
布。因此,在大样本情况下,两个总体比例之差服从正 态分布,可以证明两个样本的比例之差
3
任务
正态总体比例的假设检验
一、一个总体比例的假设检验
例【7-7】
一位关心环境保护的公共福利团体的发言人宣称:“在这个工业区域内, 遵守政府制定的空气污染标准法则的工厂不到60%”。但环境保护局的工程 师却相信至少有60%的工厂是遵守这个法则的,于是从这个工业区域内抽出 了60家工厂并发现33家是遵守空气污染标准法则的。现环保局想知道真正的 比率是否达到了60%?( )
即
p p1n1 p2n2
n1 n2
(7-7)
在大样本条件下z ,统计p1 量p2 z为 ~N(0,1)
p(1
p)
1 n1
1 n2
(7-8)
6
任务
正态总体比例的假设检验
第四节 二项资料的百分数假设检验
1、单个样本百分数的假设测验
• 测试百分数β所属总体百分数与某一理论值或期望值p0的 差异显著性。 p (1 p ) • 样本百分数的标准误为: n
0 0 ˆ
故由
u
ˆ p p0
ˆ p
例:紫花与白花大豆杂交,在F2代共得到289株,其中紫 花208株,白花81株。如果花色受一对等位基因控制,根 据遗传学原理,F2代紫花与白花分离的比例应为3:1,即 紫花理论数为p=0.75,白花为q =1-p =0.25。问该试验是 否符合一对等位基因的的遗传规律?
Test of percent hypothesis
3、二项样本假设测验时的连续矫正
• 以上所分析的事例在性质上属于间断性变易,其分布是间 断性的二项分布。将其按照连续性的正态分布或 t 分布, 一般容易发生第一类错误。补救的办法是假设测验时进行 连续矫正。这种矫正工作当n<30,np<5时必须进行。 • 若符合下表的情况,可不作矫正,用u测验处理。
1 1 0 . 906 0 . 094 0 . 021 396 378
3 . 12
u
0 . 09392 0 . 8737 0 . 021
ˆ ˆ p1 p 2
因为:u.05=1.96,│u│(3.12)>u0.05,所以p<0.05。 推断:否定H0:p1=p2,接受HA:p1≠p2,即该试验中两块麦 田锈病的发生程度有显著差异。
Estimate of confidence interval
1、总体平均数μ的置信限 2、两总体平均数差数的置信限 3、二项总体百分数的置信限 4、两个二项总体百分数差数的置信限 5、区间估计与假设测验
假设检验二项分布与正态分布
第七章假设检验有了概率和概率分布的知识,接下来我们要逐步掌握统计检验的一般步骤。
既然按照数学规则得到的概率都不能用经验方法准确求得,于是,理论概率和经验得到的频率之间肯定存在某种差别,这就引出了实践检验理论的问题。
第一节二项分布二项分布是从著名的贝努里试验中推导而来。
所谓贝努里试验,是指只有两种可能结果的随机试验。
每当情况如同贝努里试验,是在相同的条件下重复n次,考虑的是“成功” 的概率,且各次试验相互独立,就可利用与二项分布有关的统计检验。
虽然许多分布较之二项分布更实用,但二项分布简单明了,况且其他概率分布的使用和计算逻辑与之相同。
所以要理解统计检验以及它所涉及的许多新概念,人们几乎都乐意从二项分布的讨论入手。
1.二项分布的数学形式二项试验中随机变量X的概率分布,即P(X=X) = C x p x q n-x on(7. 3)2.二项分布的讨论(1)二项分布为离散型随机变量的分布。
(2)二项分布的图形当p = 0. 5时是对称的,当p W 0. 5时是非对称的,而当n愈大时非对称性愈不明显。
(3)二项分布的数学期望E(X)=〃 = np,变异数D(X) = O2= npq。
(4)二项分布受成功事件概率p和试验次数n两个参数变化的影响,只要确定了p和n, 成功次数x的概率分布也随之确定。
因而,二项分布还可简写作B(x;n, p)。
(5)二项分布的概率值除了根据公式直接进行计算外,还可查表求得。
第二节统计检验的基本步骤概率分布不是一种研究者从资料中看到的分布,我们讨论它,不是出于对数学的爱好,而是因为统计推论的有关工作需要它。
所有的统计检验都包含某些特定的步骤:(1)建立假设;(2)求抽样分布(所谓抽样分布,就是把具体概率数值赋予样本每个或每组结果的概率分布);(3)选择显著性水平和否定域;(4)计算检验统计量;(5)判定。
1.建立假设统计检验是将抽样结果和抽样分布相对照而作出判断的工作。
取得抽样结果,依据描述性统计的方法就足够了。
正态总体下参数的假设检验
正态分布的性质
1 2
3
集中性
正态分布的曲线关于均值$mu$对称。
均匀性
正态分布的曲线在均值附近最密集,向两侧逐渐扩散。
稳定性
正态分布的方差$sigma^2$决定了曲线的宽度,方差越大 ,曲线越宽。
正态分布在统计学中的应用
两个总体比例的比较案例
案例描述
某项调查显示,某地区支持甲政 策的居民占60%,支持乙政策的 居民占40%。现从该地区随机抽 取200名居民进行调查,得到支持 甲政策的居民有120名,支持乙政 策的居民有80名。
检验步骤
首先计算两组的样本比例和支持 率,然后根据正态分布的性质计 算临界值,最后根据临界值判断 两组之间是否存在显著差异。
检验步骤
首先计算两组的样本均值和标准差,然后根据正态分布的性质计算临界值,最后根据临界值判断两组之间是否存在显 著差异。
结论
如果两组之间的差异超过临界值,则可以认为两种药物治疗慢性胃炎的疗效存在显著差异;否则,不能 认为两种药物治疗慢性胃炎的疗效存在显著差异。
单个总体比例的假设检验案例
案例描述
检验步骤
03
正态总体下参数的假设检验 方法
单个总体均值的假设检验
总结词
单个总体均值的假设检验是统计学中常见的一种检验方法,用于检验单个正态总体均值 的假设。
详细描述
在假设检验中,我们通常会提出一个关于总体均值的假设,然后使用样本数据来检验这 个假设是否成立。对于单个总体均值的假设检验,我们首先需要确定样本数据和总体分 布的性质,然后选择合适的统计量进行计算,最后根据统计量的分布和临界值来判断假
正态总体及二项分布百分数的假设检验
1正态总体参数的假设检验 1.1单个正态总体参数的假设检验 1.1.1单个正态总体均值的假设检验(1)已知方差20σ或已知样本为大样本时,对均值μ的检验。
样本为正态总体中抽取,方差已知;样本从正态总体中抽取,方差未知,但样本容量大于30。
1) 提出假设H 0,H A ; 2) 统计量u 计算: u =x−μ0σ/√n或u =x−μ0S/√n;H 0成立时,u ~N(0,1)3) 依据所给显著水平α,确定临界值u 0.5α或u α; 4) 比较所得统计量u 与临界值,判断H 0或H A 成立。
Excel 中用NORMSINV()返回u α,双尾检验中该函数中所用概率应为1-0.5α,单尾检验所用概率为1-α。
(2)方差20σ未知且已知样本为小样本时对均值μ的假设检验。
1)提出假设H 0,H A ; 2)统计量t 计算: t =x−μ0S/√nH 0成立时,t ~t(n-1)3)依据所给显著水平α,确定临界值t 0.5α或t α; 4)比较所得统计量t 与临界值,判断H 0或H A 成立。
TINV()返回t α,给出的为双尾概率。
即显著水平为α,单尾检验时应使用双倍所给显著水平概率2α为参数。
metlab 中给出为单尾概率。
1.1.2单正态总体方差的假设检验 1)提出假设H 0,H A ;2)H 0成立前提下统计量计算: χ2=(n−1)S 2σ02~χ2(n −1)3)依据显著水平α及(n-1)的自由度,取得χ2的临界值;4)判断H 0或H A 成立:)1(05.0122-<<-n αχχ或)1(5.022->n αχχ时,拒绝H 0;)1(22->n αχχ时拒绝H 0;)1(122-<-n αχχ时拒绝H 0。
Excel 中用CHIINV()返回单尾概率,故双尾检验时概率应使用0.5α,另需使用自由度f 为第二参数。
χ2 1.2两个正态总体参数的假设检验 1.2.1两个正态总体均值差的假设检验(1)已知两样本方差条件下,假设检验H 0:μ1=μ2),(~2221212121n n N x x σσμμ+-- 1)提出假设; 2)计算统计量:)1,0(~//)()(2221212121N n n x x u σσμμ+---=;3)依据显著水平得临界值; 4)判断。
正态总体参数假设检验
4.55。
3,由经验知某零件重量 X ~ N (15, 0.052 ) (单位:克),技术革新后,抽出 6 个零件,
测得重量为: 14.7 15.1 14.8 15.0 15.2 14.6
已知方差不变,问平均重量是否仍为 15 克?(取 α=005)
计算得, x = 928, u = 928 − 950 = −6.6 ,此处 u 值落入拒绝域内,故拒绝原假设,可以判 10 3
断这批枪弹的初速有显著降低。
关于本题说明一点:本题中的一对假设 H0 : µ = µ0 vs H1 : µ < µ0 的检验与另一对假设
H0 : µ ≥ µ0 vs H1 : µ < µ0 的检验有完全相同的拒绝域,这是因为二者的拒绝域形式相同,
解:本题归结为对方差已知时检验正态总体均值 µ = 15 的问题,而且这是一个双侧假
设检验问题,检验的拒绝域为{ | u |≥ u1−α / 2 }。由α=0.05,查表知 u0.975 =1.96。使用样本数
据可算得,
x = 14.9 , u = 6(14.9 −15) / 0.05 = −4.90 ,
|≥
2.5706} ,故应
接受原假设。
4
4,化肥厂用自动包装机包装化肥,每包的重量服从正态分布,其平均重量为 100 千克, 标准差为 1.2 千克.某日开工后,为了确定这天包装机工作是否正常,随机抽取 9 袋化肥, 称得重量如下:
99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5 设方差稳定不变,问这一天包装机的工作是否正常? (取 α=005)
概率论与数理统计假设检验正态总体参数的假设检验(2)
概率论与数理统计第7章假设检验第3讲正态总体参数的假设检验(2)01 两个正态总体参数的假设检验02单侧检验03 p 值检验法—简介本讲内容*21μμ-2221σσ检验目的本节将讨论两个相互独立的正态总体,211(,)X N μσ222(,)Y N μσ的参数检验问题.设是来自总体X 的简单随机样本;112,,,n X X X 是来自总体Y 的简单随机样本;212,,,n Y Y Y 样本均值.X Y 、为两为两样本方差. 显著性水平为α .2212S S 、(3) μ1 , μ2 未知,检验.2222012112::H H σσσσ=≠,(1)σ12,σ22已知,检验.012112::H H μμμμ=≠,这些假设检验可细分为许多种情形,这里只介绍3种最常见的类型:(2)σ12,σ22未知但σ12 =σ22,检验.012112::H H μμμμ=≠,两个正态总体的参数检验,主要有比较两个均值μ1与μ2的大小,比较两个方差σ12与σ22的大小.根据已知条件的不同,由样本观测值求出统计量的观测值u ,然后作判断.确定拒绝域2{}U u α>选取检验统计量221212~(0,1)X YU N n n σσ-=+U 检验法建立假设012112::.H H μμμμ=≠,借鉴上一章区间估计(1) 已知,检验.12μμ-2212,σσ1212~(2)11w X Y T t n n S n n -=+-+122{(2)}T t n n α>+-(2) 未知但σ12 =σ22,检验.2212,σσ12μμ-T 检验法建立假设012112::.H H μμμμ=≠,由样本观测值求出统计量的观测值t ,然后作判断.确定拒绝域选取检验统计量211222~(1,1)S F F n n S =--2212121{(1,1)(1,1) 或}F F n n F F n n αα-<-->--2222012112::H H σσσσ=≠,(3) μ1 , μ2 未知,检验.2212/σσF 检验法建立假设由样本观测值求出统计量的观测值,然后作判断.确定拒绝域选取检验统计量在某种制造过程中需要比较两种钢板的强度,一种是冷轧钢板,另一种双面镀锌钢板。
二项分布的有关假设测验
u
pˆ p0
~ N(0,1)
u
pˆ p0
0.5
n ~ N(0,1)
p0 (1 p0 ) n
p0 (1 p0 ) n
例:一批果树种子的平均发芽率为0.75.现随机取 100粒,用福尔马林浸种,得发芽种子86粒,问福尔 马林浸种对种子发芽有无效果 (α=0.05)?
H0 : p p0, H A : p p0
总计
丅
丅 丅 正 正正 正正正正 正正正正 正正正正 正正 正 丅 丅
f Fˆ 次数
i频率
pˆ i
fi n
累加频率
i
2
0.0167
0
0.0000
0
0.0000
2
0.0167
2
0.0167
8
0.667
13
0.1083
23
0.1917
24
0.2000
21
0.1570
14
0.1167
6
0.0500
2
0.0167
(Xi )2 2 2 (n)
,
(Xi )2
2 1
2 (n)
n
(Xi )2
2 i1 2
~ 2 (n)
0 1 2
1 2
(a)
1
0 2
2
(b)
1
0
2
2 1
(c)
两个正态总体参数的区间估计—μ
u ( X1 X 2 ) (1 2 ) ~ N (0,1)
2 1
Hale Waihona Puke 22n1 n2或学说
分析两个 变数是相 互独立还 是彼此相
关
2×2表 2×c表 r×c表
正态分布的假设检验方法
正态分布的假设检验方法正态分布是一个重要的统计概念,经常用于解决各种实际问题。
不同于其它常见分布,正态分布具有非常特殊的性质,其中最突出的就是其反映了许多现实生活中的随机变量(例如人的身高、体重等)的分布类似于正态分布的情况。
随着科技与数据收集技术的不断进步,人们能够收集到越来越多的实际数据,并采用各种统计方法来分析这些数据。
在实际应用中,对于一些特定的问题,我们需要检验数据是否符合正态分布,并进而研究相关假设问题。
这需要运用到假设检验的方法,因此本文将对正态分布的假设检验方法进行详细阐述,包括其基础理论、假设设定方法、检验统计量的计算以及显著性检验的实现等。
一、基础理论正态分布是统计学中一个重要的概念,它是一个连续型概率分布,通常由两个参数μ和σ描述,其中μ是正态分布的均值,σ是正态分布的标准差。
对于一个正态分布的随机变量x ~N(μ,σ²),它的概率密度函数可以表示为:$$ f(x)=\frac{1}{\sigma\sqrt{2\pi}}\mathrme^{−(x−\mu)^2/2\sigma^2} $$在实际研究中,许多随机变量的分布都具有类似于正态分布的特性,在大样本情况下,它们的概率密度图常常能够像钟形曲线一样展示出来,因此我们可以通过正态分布模型,来描述某些随机变量的概率分布情况。
随着数据科学的不断进步,我们现在可以通过各种手段来收集数据,并利用统计工具对这些数据进行分析。
假设检验是其中一个最基础的分析方法,它通常用于判断某一假设是否成立。
正态分布的假设检验方法,就是一种基于正态分布模型的检验方法。
二、假设设定方法在进行正态分布的假设检验时,我们通常要设定两个假设,分别为原假设和备择假设。
原假设($H_0$)是我们想要检验的假设,而备择假设($H_1$)则是对原假设的拒绝。
在正态分布的假设检验中,常见的假设包括以下两种:1. 单样本均值检验对于单样本均值检验,我们设定以下的原假设和备择假设:$$ H_0:\mu=\mu_0 \ \ \ \ \ H_1:\mu\neq\mu_0 $$其中,$H_0$表示总体均值等于特定值$\mu_0$,$H_1$表示总体均值不等于$\mu_0$。
正态总体中参数的假设检验
正态总体中参数的假设检验正态总体参数的假设检验是统计推断中的一种方法,用于判断总体参数是否符合我们的假设。
下面将详细介绍正态总体参数的假设检验原理和步骤。
一、假设检验原理正态总体参数的假设检验是通过收集样本数据,计算样本统计量来推断总体参数的方法,其中包括均值和标准差。
在进行正态总体参数的假设检验时,我们首先假设总体参数的值,并设立一个零假设和一个备择假设。
其中零假设(H0)是我们希望证伪的假设,备择假设(H1)是我们希望证明的假设。
然后,我们根据样本数据计算得到样本统计量,比如样本均值和样本标准差,并将其与假设中的总体参数进行比较。
通过计算假设检验统计量的值,我们可以判断是否拒绝零假设,即总体参数是否符合我们的假设。
二、假设检验步骤1.确定假设:我们首先需要确定我们要研究的总体参数是均值还是标准差,并设立零假设和备择假设。
通常情况下,零假设是总体参数等于一些特定值,备择假设可以是总体参数大于、小于或者不等于该特定值。
2.收集样本数据:我们需要从总体中取得一个样本,并记录相应的观测值。
3.计算样本统计量:根据样本数据,我们可以计算得到样本均值和样本标准差。
4.计算假设检验统计量:根据样本数据和零假设中的总体参数值,我们可以计算得到假设检验统计量的值,该值用于判断是否拒绝零假设。
5.设定显著性水平:我们需要设定一个显著性水平,通常为0.05或0.01、显著性水平表示拒绝零假设的程度,如果得到的结果小于显著性水平,则可以拒绝零假设。
6.判断拒绝或接受零假设:根据计算得到的假设检验统计量的值与临界值进行比较,如果假设检验统计量的值小于临界值,则拒绝零假设;如果假设检验统计量的值大于等于临界值,则接受零假设。
7.得出结论:根据拒绝或接受零假设的结果,我们可以得出总体参数是否符合我们的假设。
三、举例说明假设我们要研究厂生产的产品的重量是否符合标准,假设标准重量为500克。
我们收集了一个包含30个产品的样本,并计算得到样本的平均重量为495克,标准差为10克。
大学生课件_数学统计学:假设检验课件:正态总体参数假设检验
假设检验
第10页
二、 未知时的t 检验
由于 未知,一个自然的想法是将(2.4)中未
知的 替换成样本标准差s,这就形成t 检验统
计量
t n x 0
(2.9)
s
三种假设的检验拒绝域分别为
t t1 n 1, t t n 1, | t | t1 /2 n 1 .
0
1 / 2
0
1 / 2
30 November 2019
安徽财经大学
假设检验
第7页
2.1(b)(c) g(的) 图形
30 November 2019
安徽财经大学
假设检验
第8页
例2.1 从甲地发送一个讯号到乙地。设乙地接
受到的讯号值服从正态分布 N (,0.22), 其中
为甲地发送的真实讯号值。现甲地重复发送同 一讯号5次,乙地接收到的讯号值为
{| t | t1 /2(n 1)}
30 November 2019
安徽财经大学
假设检验
第14页
三、假设检验与置信区间的关系
这里用的检验统计量与6.5.5节中置信区间所用 的枢轴量是相似的。这不是偶然的,两者之间 存在非常密切的关系。
设 x1, , xn 是来自正态总体 N (, 2 ) 的样本,现 在 未知场合讨论关于均值 的检验问题。
30 November 2019
安徽财经大学
假设检验
第13页
表2.1 单个正态总体的均值的检验问题
检验 法
条 件
原假 备择 检验统 设 H0 假设H1 计量
拒绝域
u检 验
t 检 {uuxu1}0 验 {u u/} n
{| u | u1 / 2}
7-2正态总体参数的假设检验
α 下 H 0 的拒绝域
1− 2
§7.2 正态总体参数的假设检验 一、单正态总体参数的假设检验 设总体 ξ ~ N ( µ , σ )
2
统计量
拒绝域
H 0 为真
σ 2 = σ 02
σ =σ
2
σ 2 ≠ σ 02 σ 2 > σ 02
σ 2 ≤ σ 02
σ =σ
2
或
2 0
χ2 =
H0
( n − 1) S
1−
( 2 ) H 0 : σ 22 = 162 ; H1 : σ 22 ≠ 162 H 为真 2 n − 1) Sn −1 选统计量 χ 2 = ( χ 2 ( n − 1)
σ 02
~
0
2 2 2 拒绝域为 χ 2 < χ α ( n − 1) 或 χ > χ 1− α ( n − 1 ) 2 2
H 0 为真
X −Y
T >t
1 1 + m n
1−
α
2
( m + n − 2)
【例1】为考察甲,乙两种安眠药的疗效,现独立地考察 20 个 病人,其中10人服甲药, 10人服乙药.以 ξ , η 分别表示病人服 甲药和乙药延长睡眠时数,具体数据如下表:
甲 x 乙 y
1.9 0.8 1.1 0.1 4.4 5.5 1.6 4.6 3.4 0.1 3.7 0.0 2.0 0.8
µ1 , µ2 未知. 2 2 对 H 0 : σ 12 = σ 2 ; H 1 : σ 12 ≠ σ 2 2 2 2 2 2 当 H 0 成立时,由于 σ 1 σ 2 = 1 ,而 S x , S y 分别为 σ 12 , σ 2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
d Sd / n
教材中使用矫正 t 值的方法, excel 中使用了公式对自由度进行了重新计算。 在 excel 中方差相不相等得出的 t 值不变,但是方差不同时,其自由度有计算公 式:
S S (S / n ) 2 (S / n2 ) 2 f ( 1 2 ) 2 /( 1 1 2 ) n1 n2 n1 1 n2 1
2
x −μ 0
0/ n
或u =
x −μ 0 S/ n
;
1)提出假设 H0,HA; 2)统计量 t 计算: t= H0 成立时,t~t(n-1) 3)依据所给显著水平α ,确定临界值 t0.5α 或 tα ; 4)比较所得统计量 t 与临界值,判断 H0 或 HA 成立。 TINV()返回 tα ,给出的为双尾概率。即显著水平为α ,单尾检验时应使用双 倍所给显著水平概率 2α 为参数。metlab 中给出为单尾概率。 1.1.2 单正态总体方差的假设检验 1)提出假设 H0,HA;
2
x1 x 2 ~ N (1 2 ,
1)提出假设; 2)计算统计量: u
( x1 x 2 ) ( 1 2 )
12
n1
22
n2
)
12 / n1 2 2 / n2
~ N (0,1) ;
3)依据显著水平得临界值; 4)判断。 Excel 中使用数据分析工具中的“Z-检验:双样本平均差检验” 。 (2)两样本方差未知且为小样本时,H0:μ 1=μ a、方差未知但可确定其相等 1 2 2 时
计算公式为: S p ˆ1 p ˆ2
p (1 p )(
1 1 ) n1 n2
p 为合并样本百分数
p x1 x2 n1 n2
则统计量为:
u
ˆ1 p ˆ2 p Sp ˆ1 p ˆ2
当 np 或 nq 小于或等于 5 时,
uc
ˆ1 p ˆ 2 0.5 / n1 0.5 / n2 p Sp ˆ1 p ˆ2
ˆ 1 x1 / n1 ,p ˆ 2 x2 / n2 为两个样本百分数,S p 其中 p ˆ1 p ˆ 2 为样本百分数差异标准误,
Sp ˆ p0 (1 p0 ) n
2.2 两个样本 一般的假设为: H0 : p1 p2 , H A : p1 p2
p1 p2 ~ N[ p1 p2 , p1 (1 p1 ) / n1 p2 (1 p2 ) / n2 ] ,当零假设成立时
p1 p2 ~ N[0, p(1 p)(1/ n1 1/ n2 )],
x −μ 0 S/ n
2)H0 成立前提下统计量计算: χ2 =
(n −1)S 2 σ02
~χ2 (n − 1)
3)依据显著水平α 及(n-1)的自由度,取得χ2 的临界值; 4)判断 H0 或 HA 成立: 0 2 210.5 (n 1) 或 2 2 0.5 (n 1) 时,拒绝 H0;
2 2
2
检验统计量为
t
x1 x 2 S1 / n1 S 22)
Excel 中使用“t-检验:双样本等方差检验” 。 b、配对样本: 令 di x1i x2i
其平均数用μ d 来表示, 方差为 Sd , 样本方差 Sd 。 此时μ d=0 di 为新的差数总体, t= 进行 t 检验 t ~ t(n-1) 。 使用 excel 中的“t-检验:平均值的成对二样本分析” 。 c、方差未知但可确定 1 2
p ~ N ( p0 , p0 (1 p0 ) / n) ,因此 u 的计算公式为
u ˆ p0 p , Sp ˆ
当 np 或 nq<或=5 时,应采用矫正 u 值 uc:
uc
ˆ p0 0.5 / n p Sp ˆ
ˆ 为样本百分数, p0 为总体百分数, S p p ˆ 为样本百分数标准误,计算公式为:
2 2 (n 1) 时拒绝 H0; 2 21 (n 1) 时拒绝 H0。
Excel 中用 CHIINV()返回单尾概率,故双尾检验时概率应使用 0.5α ,另需使 用自由度 f 为第二参数。χ2 1.2 两个正态总体参数的假设检验 1.2.1 两个正态总体均值差的假设检验 (1)已知两样本方差条件下,假设检验 H0:μ 1=μ
1 正态总体参数的假设检验 1.1 单个正态总体参数的假设检验 1.1.1 单个正态总体均值的假设检验 (1)已知方差 0 或已知样本为大样本时,对均值 的检验。
2
样本为正态总体中抽取,方差已知; 样本从正态总体中抽取,方差未知,但样本容量大于 30。 1) 提出假设 H0,HA; 2) 统计量 u 计算: u=σ H0 成立时,u~N(0,1) 3) 依据所给显著水平α ,确定临界值 u0.5α 或 uα ; 4) 比较所得统计量 u 与临界值,判断 H0 或 HA 成立。 Excel 中用 NORMSINV()返回 uα , 双尾检验中该函数中所用概率应为 1-0.5α , 单尾检验所用概率为 1-α 。 (2)方差 0 未知且已知样本为小样本时对均值 的假设检验。
S1 ~ F (n1 1, n2 1) 。 S12
2
1 F10.5 (n1 1, n2 1) F F0.5 (n1 1, n2 1) 成立,则认为可 F0.5 (n2 1, n1 1)
接受 H 0 。 当 H0 : 1 2 , H A : 1 2 时:
2 2 2 2
F F (n1 1, n2 1) ,则拒绝 H 0 。
当 H0 : 1 2 , H A : 1 2 时:
2 2 2 2
F
1 F1 (n1 1, n2 1) 时,接受 H 0 。 F (n2 1, n1 1)
2 二项分布百分数的假设检验 2.1 单个样本 一般假设为: H 0 : p p0 , H A : p p0
得出,使用该自由度得到临界值。 1.2.2 两个正态总体方差比的假设检验 两个正态总体, x2 ~ N (2 , 2 ) ,x1 与 x2 相互独立,且 1 、 1 、 2 、 2 都
2
2
2
2
2
未知。 假设检验 H0 : 1 2 。
2 2
在 H 0 成立时,检验统计量 F 判断: