假设检验基础教材

合集下载

水文水资源教材-实用水文统计-假设检验

水文水资源教材-实用水文统计-假设检验

第五节 非参数的假设检验
一、分布的假设检验 提出原假设
H0 : F (x; ) F0 (x;0 );H1:F (x; ) F0 (x; )
式中θ为分布参数,可以已知,也可以未知。
检验统计假设:
1、
x1 x2 …
xk-2 xk-1
2、统计样本点落在各区间的数目mi;
3、根据分布函数F0(x;θ)计算在n次试验中,X 的值落在各个子区间中的理论频数νi:

r
2
n
2
t
2
r
2
则否定域为 r r 。临界值见附表10。
例 设(X,Y)为二维正态分布,试检验X与Y的 相关系数ρ=0。(α=0.05)
xi
10
62
32
34
49
54
yi
535.9 1085.5 848.9 789.4 991.6 1117.5
xi
34
27
57
36
41
50
yi
967.0 862.8 1161.3 695.8 890.1 1122.1
i1 j1
npi. p. j
服从自由度为rk-1的 2 分布。
一般 pi. 和
代替,则
p. j
未知,常用它们的极大似然估计
ni. n
r
2
k
(nij
ni.n. j )2 n
n(
r
k
ni2j 1)
i1 j1
ni.n. j
n n i1 j1 i. . j
统计量
2
n
服从自由度为( r-1)(
k-1)的
列联表
Y
X
1
2

第六讲假设检验基础优秀课件

第六讲假设检验基础优秀课件

7
42
70
28
784
8
45
45
0
0
9
25
50
25
625
10
55
80
25
625
11
51
60
9
81
12
59
60
1
1
合计
128
2740
H0:d=0,干预前后血红蛋白差值的总体均数为零 H1:d≠0, =0.05。
t d 10.670 3.305 sd n 11.18/ 12
按 = n-1=11,查t值表,则0.01<P<0.005,拒绝H0,
• (1)检验假设:又称无效假设、零假设、原假设,是从反证法
思想提出的。
H0 :0
• (2)备择假设:拒绝H0时而被接受的假设,与H0对立。有三种 情况: H1:0 双侧检验 H1:0 单侧检验
H1:0 单侧检验
2.单、双侧的选择:由专业知识来确定。
3.检验水准:α,又称显著性水准,是小概率事件的概率。通 常取0.05。
可认为健康干预前后该地区儿童血红蛋白量有变化。
三、两独立样本t检验
▲目的:由两个样本均数的差别推断两样本所代表 的总体均数间有无差别。
▲计算公式及意义:
t
s 自由X度1X:2 n1
X1 X2 s
+sc2Xn12 X–2n211
1 n2
sc2
(n11)s12(n21)s22 n1n22
▲ 适用条件:
例7-2 健康教育干预三个月前后血红蛋白(%)
表 6.1 用两种方法对 12 名妇女的最大呼气率检测结果(L/min)
序号

第五章假设检验

第五章假设检验
31
Hypothesis test
(二)P值假设检验的步骤 值假设检验的步骤
14
Hypothesis test
(一)假设检验中的两类错误 实际情况
决策结果 不拒绝H0 拒绝H0
H0为真 √ type I error
H0为伪 type II error √
•第Ⅰ类错误:指原假设为真,却拒绝原假设而犯的 类错误:指原假设为真,
错误, 错误,即弃真错误 发生概率为α 发生概率为α •第Ⅱ类错误:原假设为假时,未拒绝原假设而犯 第 类错误:原假设为假时, 的错误, 的错误,即取伪错误 发生概率为β 发生概率为β 15
27
Hypothesis test
3、利用P值决策的优点: 利用P 决策的优点: 直接给出了拒绝原假设犯第一类错误的真实概率; 直接给出了拒绝原假设犯第一类错误的真实概率; 避免了不同检验问题用同一个显著性水平; 避免了不同检验问题用同一个显著性水平; 当前计算机软件通常可以直接输出检验统计量的P值, 当前计算机软件通常可以直接输出检验统计量的P 免于查表, 免于查表,可直接判定
例如,针对特效药治愈率假定 例如,针对特效药治愈率假定H0 :θ≥97% 医疗周期假定H0 :t≤2个月 个月 服药后病情稳定情况H0 :d=2人 人
7
Hypothesis test
(2)备择假设(alternative hypothesis) 备择假设(alternative
★研究者收集证据想予以支持的假设 研究者收集证据想予以支持 予以支持的假设 ★表示为H1 ★表示形式:≠, >或<某一假定数值 表示形式:
Hypothesis test
4、决策规则 给定显著性水平α 给定显著性水平α,查统计量的对应分布表得出相 应的临界值。 应的临界值。 临界值通常取正值, 临界值通常取正值,应结合假设形式准确确定分布 中的临界值和拒绝域。 中的临界值和拒绝域。 将检验统计量的值与临界值进行比较 给出决策结果。 给出决策结果。 双侧检验: 统计量的值| 临界值, 双侧检验:|统计量的值|>临界值,则拒绝H0 左侧检验:统计量的值<临界值, 左侧检验:统计量的值<临界值,则拒绝H0 右侧检验:统计量的值>临界值, 右侧检验:统计量的值>临界值,则拒绝H0

概率论与数理统计教案第八章

概率论与数理统计教案第八章
其中, 是已知常数.试求拒绝域 .
例8为比较新老品种的肥料对作物的效用有无显著差别,选用了各方面条件差不多的10个地块种上此作物.随机选用其中5块施上新肥料,而剩下的5块施上老肥料.等到收获时观察到施新肥的地块,平均年产333(单位:千斤),样本方差为32,施老肥的地块平均年产330,样本方差为40.假设作物产量服从正态分布,检验新肥是否比老肥效用上有显著提高(显著性水平 ).
点面朝上
1
2
3
4
5
6
出现次数
23
26
21
20
15
15
在 水平下,请问,这颗骰子是否是均匀的
例2在某细纱机上进行断点率测定,测验锭子总数为440,测得断头次数记录如下表:
每锭断头数
0
1
2
34Βιβλιοθήκη 5678
锭数(实测)
269
112
38
19
3
1
0
0
3
试问在显著性水平 下能否认为锭子的断头数服从泊松分布
例3某高校研究在校学生的体重,现随机抽取了100位学生,测得他们的体重(单位:kg)为
检验参数
原假设与备择假设
检验统计量
拒绝域
方差
已知
;
当 时,

;
;
未知
;
当 时,

;
;
3、两个正态总体均值差的假设检验问题可汇总如下表
检验参数
抽样分布
检验统计量
拒绝域
均值差
已知
;
当 时,
;
;
未知
;
当 时,
;
;
4、两个正态总体方差比的假设检验问题可汇总如下表

假设检验PPT课件

假设检验PPT课件
假设检验
【学习目标】通过对本章的学习,掌握假设检验的概念和 类型、假设检验的两类错误和假设检验的一般步骤;重点掌握 单个总体均值的检验和比率的检验。
第一节 假设检验的基本问题 第二节 △ 假设检验的应用
假设检验
第一节 假设检验的基本问题
一、假设检验的概念 二、假设检验的两类错误 三、假设检验的类型 四、假设检验的类型一般步骤
假设检验
第一节 假设检验的基本问题
什么小概率?
1.在一次试验中,一个几乎不可能发生的事件发生的概率; 2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假 设; 3.小概率由研究者事先确定。
假设检验
第一节 假设检验的基本问题
二、假设检验的两类错误(决策风险)
(一) 第一类错误 第一类错误,亦称拒真(弃真)错误。是指当原假设为 真时,但由于样本的随机性使样本统计量的具体值落入 了拒绝区域,这时所作的判断是拒绝原假设。 犯第一类错误的概率亦称拒真概率,它实质上就是前面
t
986 1000 24
2.333>
t n 1 2.1315
16
2
所以接受 H1,即这天包装机工作不正常。
假设检验
第二节 假设检验的应用
二、单个总体比率(成数)的假设检验
比率P是平均数的一种特殊形式,因而前面讲的平均 数检验理论都适用于总体比率P的假设检验,只是估计量 的形式略有不同。
【例4】我国出口的参茸药酒畅销于某国市场。据以往调查, 购买此种酒的顾客中40岁以上的男子占50%。经营该药酒 的进出口公司经理关心这个比率是否发生了变化,于是, 委托一个咨询机构进行调查,这个咨询机构从众多购买该 药酒的顾客中随机抽取了400名进行调查,结果有210名为 40岁以上的男子。试问在0.05的显著水平上,能否认为购 买此种药酒的顾客中40岁以上男子所占比率变化了?

第七章 假设检验基础()精品PPT课件

第七章 假设检验基础()精品PPT课件

差值
1 1206.44
1678.44
472.00
2
921.69
1293.36
Hale Waihona Puke 371.673 1294.08
1711.66
417.58
4
945.36
1416.70
471.34
5
721.36
1204.55
483.19
6
692.32
1147.30
454.97
7
980.01
1379.59
399.58
➢ 买小米手机吗? 对手机评价:适合(买)、不适合(不买)
➢ 国庆节去八里沟怎样吗? 对景区的评价:好玩(去)、不好玩(不去)
所有的决策都遵循相同的基本模式
陈述多种可供选择的方案(假设) 收集支持这些方案的证据 根据证据的强弱做出决策 根据决定执行某种行为
统计学中的假设检验也是一种决策过程,同样遵循 这一基本模式。
研究结果可供选择的结论(目前的假设)有哪些?
1.该县儿童总体平均闭合月龄与一般儿童没有差异 2.该县儿童总体平均闭合月龄迟于一般儿童
两种假设在统计上的含义
抽样研究存在抽样误差!!
样本1
总体 均数=14.1
样本2
X1 14.3 X2 14.0
从总体1中抽样
样本1 X1 14.3
µ1=14.1
样本2 X2 14.0
s/ n 5.08/ 36
自由度:
n 1 3 6 1 35
3.确定P值
P值的定义 如果H0成立的条件下,出现统计量目
前值及更不利于H0的数值的概率。
直观地看:就是统计量对应分布曲线下 的尾部面积。
通过查表可以得到 对应统计量的尾部 面积,即P值

个和两个总体平均数的假设检验

个和两个总体平均数的假设检验
由该总体抽取量 了为 一 n1的个样含本, 样本平均X1数 ,为 样本方S1差 2;为
设第二个总体为 的 2, 平方 均差 数 22为 ,
由该总体抽取量 了为 n一 2的个 样含 本, 样本平均X2数 ,为 样本方S2差 2;为
1,X 1
2,X 2
1 2?
X1 X2 ?
5. 2 两个总体平均数的比较
1.配对实验设计:
指先将实验单位按配对的要求两两配对,然后 将每一个对子内的两个实验单位独立随机地分配到 两个处理组中。
配对的要求是,配成对子的两个实验单位的初 始条件应尽量一致,不同实验对子之间,实验单位 的初始条件可以有差异。
每一个对子就是实验的一次重复。
我们将实验单位分为两组的方式称为配对实验 设计。
3. 配对实验的检验步骤:
(1)无效假设H0 :μd=μ1-μ2 =0 备择假设HA :μd≠0,即μ1-μ2 ≠0
配对实验时,两组的实验单位数即两个样本的观 察值数目相等,n1=n2。但是反过来,两个样本 观察值相等的实验则不一定是配对实验。
判断配对实验的根据不是两个样本的观察值是否 相等,而是分组的方式。
在配对实验设计中,由于实验单位是两两配对的, 因此观察值也是两两配对的。
2.实验结果表示为:
处理
1 2
F
S12 S22
查F表,确定临界值,接 受或者拒绝H0
如果检验结果不显著,接受零假设σ12=σ22, 那么还按照前一种t检验进行检验。
如果检验结果显著,接受备择假设σ12 ≠ σ22,
那么按照下面的t检验方法进行检验。
tX1X2 X1X2 X1X2
s x1x2
s2 s2
x1
x2
s12/n1s22/n2

第六章--假设检验基础课件

第六章--假设检验基础课件
两样本所属总体方差相等且两总体均为正态分布
H 0 : 1 2H 1 :1 2 ( 单 1 2 或 侧 1 2 )
当H0成立时,检验统计量:
t X1X2 ~t, n1n22
Sc2n 11n12
第六章 假设检验基础
Sc2
n1
1S12 n2 1S22
n1 n2 2
X1 X1 2 X2 X2 2 n1 n2 2
第六章 假设检验基础
55、作出推断结论:当P≤时,结论为 按所取检验水准α拒绝H0,接受H1,差异有 统计学显著性意义。如果P> ,结论为按 所取检验水准α不拒绝H0,差异无统计学显 著性意义。其间的差异是由抽样误差引起
的。
第六章 假设检验基础
1.建立检验假设
原 假 设 H0:0 14.1 备 择 假H设1 :0(单 侧 ) 检 验 水 准: 0.05
第六章 假设检验基础
检验假设为:
H 0 : d 0H 1 :d 0 ( 单 d 0 或 侧 d 0 )
当H0成立时,检验统计量:
td0 ~t, n1
Sd n
第六章 假设检验基础
表6第-1二用节药前t后检患儿验血清中免疫球蛋白IgG(mg/dl)含量
二、序号配对设计资用料药前的t 检验 用药后
n1 20, X1 17.15,S1 1.59,n1 34, X2 16.92,S2 1.42
Sc2
n1
1S12 n2 1S22
n1 n2 2
2011.592 3411.422
20342
2.2 0
t X1 X2 17.1516.92 0.550
Sc2
1 n1
1 n2
2.20 1 1 20 34
得治疗前后舒张压(mmHg)的差值(前–后)如下表。问新药和标准药的疗效

第八章 假设检验2010

第八章  假设检验2010

0.05>P>0.01

差异显著,应在0.05显著性水平接受零假设 结论:可以说随着年龄的增长和一年的教育,
儿童智商有了显著提高。
2.两总体正态,标准差未知

总体标准差未知条件下,平均数之差的
抽样分布服从t分布,以t作为检验统计量, 计算公式为:
t
X
1
X 2 1 2 SEDX
Z=-3.94
⑵.总体为正态,总体标准差σ 未


平均数的抽样分布服从t分布,以t为
检验统计量,计算公式为:
t X 0
X
X 0 S n 1
df n 1
表8-3
∣t∣与临界值比较 ∣t∣<t(df)0.05/2
双侧t检验统计决断规则
P值 P>0.05 显著性 不显著 检验结果 保留H0,拒绝H1

直接应用原始数据检验假设是有困难的,
必须借助于根据样本构造出来的统计量,而 且针对不同的条件,需要选择不同的检验统 计量。

各种检验统计量的计算公式都是针对特定
条件的,学习中一定要注意把条件与统计量 计算公式联系起来。
⑶.确定显著性水平

在假设检验中有可能会犯错误。如果零
假设是正确的,却把它当成错误的加以拒绝,
∣Z∣≥2.33
P≤0.01
极其显著**
拒绝H0,接受H1

例2:某市高中入学考试数学平均分数为
68分,标准差为8.6。其中某所中学参加此次
考试的46名学生的平均分数为63。过去的资
料表明,该校数学成绩低于全市平均水平, 问此次考试该校数学平均分数是否仍显著低 于全市的平均分数?
H0:μ≥μ0,H1:μ<μ0 (左侧检验)

第5章_假设检验

第5章_假设检验

面向21世纪 课程教材
第五章
假设检验
第二节
某研究者估计本市居民家庭电脑拥有率为30%。现随机调查了200个家庭,其 中68家拥有电脑。试问研究估计是否可信?( =10%) 提出假设:原假设:Ho:P=0.3; 备择假设:Ha:p≠0.3
样本比例 P=m/n=68/200=0.34 由于样本容量相当大,因此可近似采用Z检验法 p p0 0.34 0.3 z 1.194 p (1 p ) 0.34 0.66 n 200
面向21世纪 课程教材
第五章
假设检验
第二节
2.方差检验过程 (1)提出原假设Ho和备择假设Ha。
2 H0 : 2 0
2 Ha : 2 0
(2)构造检验统计量:
(n 1) s 2

2
~

2
(n-1)
2 2分布。 在Ho成立的条件下,统计量 服从自由度为n-1的
(3)确定显著性水平。 (4)规定决策规则。 在双侧检验的情况下,拒绝区域在两侧,如果检验统计量大于右侧临界 值,或小于左侧临界值,则拒绝原假设。若是单侧检验,拒绝区域分布 在一侧,具体左侧还是右侧,可根据备择假设Ha的情况而定。 (5)进行判断决策。
面向21世纪 课程教材
第五章
假设检验
第二节
某厂采用自动包装机分装产品,假定每包重量报从正态分 布,每包标准重量为1000克,某日随机抽查9包,测得样本 平均重量为986克,标准差为24克,试问在0.05的检验水平 上,能否认为这天自动包装机工作正常?
;H 根据题意,提出假设: H0 : 1000 1: 1000

面向21世纪 课程教材
第二节 总体均值、比例和 方差的假设检验

统计培训教材1.6-假设检验

统计培训教材1.6-假设检验

(0.5)18k
0.004
k 15
这看来又走到另一个极端了. 如果我们在选择一个方案时,只 敢冒 0.4% 的风险, 未免太胆小, 太怯懦了, 对某先生也未免 太苛刻了.
事实上, 虽然此时我们错误地相信该先生的可能性大大的减 少, 但我们冤枉他的可能性却大大地增加了!
假设检验-7
那么,临界值究竟应取多大合适呢?当然要具体问题具体分 析。事关重大,后果严重的,理应把风险控制的小一点;无 伤大雅,错了可以再来的决策则不妨大胆一点。
80.0 82.5 85.0 87.5 90.0 92.5
假设检验-18
假设检验的前提假设
– 如果数据是连续的,我们假设基本分布是正态。 • 您可能需要转换非正态数据(如周期)。
– 当比较不同总体的子群时,我们假设: • 独立样本。 • 通过随机抽样实现。 • 样本是总体的代表(没有偏差)。
– 当比较不同过程的子群时,我们假设: • 每个过程都是稳定的。 • 没有特殊原因或随时间的变化 (没有与时间相关的差异)。 • 样本是过程的代表(没有偏差)。
假设检验-8
假设检验概要
※工业案例的启示
在工业生产中,我们经常希望能够确定某个分布的参数是否就是某个具体 数值或是否与其有什么关系。也就是说,我们可能希望要检验这样一个假设, 即:某个分布的均值或标准差是否是某些数值,或者两个均值之差是否是零。 这些检验就需要使用假设检验方法。实际工作中的例子有:
假设检验-19
假设(Hypothesis)
一个假设通常是关于总体特性的一个陈述.
待检假设包括两部分:
1) 零假设(null hypothesis) (记为H0)是关于总体参数值的一 个陈述.
2) 备择假设(alternative hypothesis) (记为H1), 也叫对立假 设, 是关于总体参数值的一个与零假设相对立的陈述, 即 若零假设不成立, 则备择假设必定成立.

最新假设检验基础 卫生统计学 中山大学医学统计与流行病学教材PPT课件

最新假设检验基础 卫生统计学 中山大学医学统计与流行病学教材PPT课件

假定干预前后血色素差值服从正态分布
: d 0 H1 : d 0
2. 计算统计量
= 0.05
n=12, d =10.67, Sd 11.18
t
d 0 Sd / n
10.67 -0 = 11.18 / 12 =3.305 ,
n 112 1 11
3. 确定 P 值,作出推断
例如,把有病说成没病,把有效说成无效等
表 7-1 统计推断的两类错误及其概率
统计推断
实际情况
拒绝 H 0 , 有差异
不拒绝 H 0 , 无差异
H 0 成立,无差异
第 I 类错误(假阳性) 概率=
正确 概率=1-
H1 成立,有差异
正确
概率=1-
第 II 类错误(假阴性)
概率=
概率 1 1
第二节 t 检验
试验组:10.2 ,8.9, 10.1, 9.2,-0.8, 10.6, 6.5, 11.2, ,9.3, 8.0, 10.7, 9.5, 12.7, 14.4, 11.9
对照组:5.0, 6.7, 1.4, 4.0, 7.1, 0.6, 2.8, 4.3, 3.7, 5.8, 4.6, 6.0, 4.1, 5.1, 4.7
区贫血儿童血色素(%)总体平均水平有无变化?
序号
1 2 3 4 5 6 7 8 9 10 11 12
表 7-2 健康教育三个月前后血色素(%)
教育前
教育后
差值 d
36
45
9
46
64
8
53
66
13
57
57
0
65
70
5
60
55
-5
42

统计 习题课件 CH07

统计 习题课件 CH07
第七章 假设检验基础
第一节 假设检验的概念与原理
一,假设检验的思维逻辑 基本推断原理: 基本推断原理:小概率事件在一次随机试验中不(大) 可能发生. 特点: 特点:从研究总体中抽取大小合适的随机样本,应用假 设检验理论和方法,依据样本提供的有限信息对总体做推 断. 二,假设检验的基本步骤 基本概念: 基本概念:假设检验就是首先根据设计和研究目的提 出某种假设,然后根据现有资料提供的信息,推断此假设 应当拒绝还是不拒绝. 假设检验的基本步骤: 假设检验的基本步骤: 分为三步: 1.建立检验假设,确定检验水准 2. 计算统计量 3. 确定值,做出推断
思考与练习
2. 为探讨习惯性流产与 为探讨习惯性流产与ACA(抗心磷抗体)的lgG的关 (抗心磷抗体) 的关 研究人员检测了33例不育症 流产史>2次 妇女ACA 例不育症( 系,研究人员检测了 例不育症(流产史 次)妇女 单位, 单位; 的lgG,得样本均数为 ,得样本均数为1.36单位,标准差为 单位 标准差为0.25单位;同时 单位 检测了40例正常 例正常( 胎正常足月产史) 检测了 例正常(有1胎正常足月产史)育龄妇女 胎正常足月产史 育龄妇女ACA的 的 lgG,相应样本均数为 单位, 单位. ,相应样本均数为0.73单位,标准差为 单位 标准差为0.06单位.习惯 单位 性流产者与正常妇女lgG水平是否不同? 水平是否不同? 性流产者与正常妇女 水平是否不同 解答:本研究为通过不同群体的小样本数据比较定量指 标lgG的平均水平,故本题属于两独立样本设计资料的t检验. 首先检验两样本方差是否具有齐性(参见教材例7-6方法), 求得F=17.36,P<0.05,方差不齐;选用t'检验(参见教材 ν 例7-5方法)求得t'=14.14, =35,P<0.05,有统计学意义. 说明习惯性流产者与正常妇女lgG水平是不同的.

《假设检验基础》课件

《假设检验基础》课件

2
通过选择适当的显著性水平,我们可以
控制犯错误的概率,确定接受或拒绝原
假设的标准。
3
4. 计算统计量
4
根据样本数据和假设检验方法,计算出
相应的统计量。
5
6. 分析检验结果
6
通过分析检验结果,我们可以对总体进
行推断,了解样本数据是否支持或拒绝
原假设。
7
1. 确定假设
我们首先需要明确研究问题并建立相应 的假设,包括原假设和备择假设。
课程总结
在本课程中,我们学习了假设检验的基础知识和常见方法。掌握假设检验可 以提升我们在数据分析领域的能力,帮助我们做出准确的统计推断。
问答环节
如果您对假设检验还有任何疑问,请在问答环节向我们提问。我们将尽力解 答您的问题。
《假设检验基础》课件
本课程将介绍假设检验的基础知识。掌握假设检验的作用、步骤和常见方法, 提升在数据分析中的能力。让我们一起开始这个精彩的学习之旅吧!
பைடு நூலகம்
什么是假设检验
假设检验是一种统计推断方法,用于验证关于总体特征或参数的假设。通过 收集样本数据进行分析,我们可以得出对总体的合理推断。
假设检验的作用
卡方检验
用于检验分类变量之间的关联性和独立性。
双样本t检验
用于比较两个独立样本的均值是否有显著差异。
方差分析
用于比较多个样本的均值是否有显著差异。
实战演练
让我们通过一个实际案例来应用假设检验的方法:
1. 确定问题和目标 2. 收集数据 3. 建立假设和设置显著性水平 4. 进行假设检验 5. 分析检验结果 6. 得出结论和建议
3. 收集样本数据
根据研究设计,我们收集样本数据并进 行必要的数据处理。

spss学习第4章-假设检验

spss学习第4章-假设检验
4.1.1 假设检验概述
(1)假设检验含义
利用统计方法检验一个事先所作出的假设的真伪, 这一假设称为统计假设,对这一假设所作出的检验就 是假设检验
(2)假设检验基本思路
ⅰ. 对总体参数作出某种假设,并假定它是成立的。 ⅱ.根据样本得到的信息(统计量),考虑接受这个 假设后是否会导致不合理的结果,如果合理就接受这个 假设,不合理就拒绝这个假设。 所谓合理性,就是看是否在一次的观察中出现了小 概率事件。
[Ⅰ.提出原假设] [Ⅱ.选择检验统计量]
[Ⅲ.计算检验统计量的观测值和概率P-值]
[Ⅳ.给定显著性水平α,并作出决策]
举例2
利用住房状况问卷调查数据,推断家庭人均住房面积的平均 值是否为20平方米。 [Ⅰ.提出原假设]
[Ⅱ.选择检验统计量]
[Ⅲ.计算检验统计量的观测值和概率P-值]
SPSS软件计算结果
课堂体验 调查内容1:学生视力
抽取22名学生调查他们的视力,假设全校学生的视
力服从于正态分布,是否可以认为学生的视力均值 为0.8?(取显著性水平α=0.05)
调查内容2:每月消费支出(分男、女)
抽取22名学生调查他们的每月消费支出,假设全校学生的消费 支出服从正态分布,比较不同性别同学的消费支出平均值和方 差?是否可以认为该校学生的消费支出均值为 500元 (取显著性水平α=0.05) 男、女同学的月消费支出是否存在显著差异?
[Ⅲ.计算检验统计量的观测值和概率P-值] [Ⅳ.给定显著性水平α,并作出决策]
第二问
[Ⅰ.提出原假设] [Ⅱ.选择检验统计量]
[Ⅲ.计算检验统计量的观测值和概率P-值]
[Ⅳ.给定显著性水平α,并作出决策]
课堂习题
知识点:一个总体参数比例检验 检验量:Z检验

第七章假设检验

第七章假设检验

第七章 假设检验一、教材说明本章主要讲假设检验的基本思想与概念、正态总体参数的假设检验这2节的内容. 1、本章的教学目的与要求(1)使学生了解假设检验的基本概念; (2)使学生了解假设检验的基本思想; (3)使学生掌握假设检验的基本步骤;(4)使学生会计算检验的两类错误,搞清楚两类错误的关系;(5)使学生掌握正态总体参数的假设检验,主要是检验统计量及其分布,检验拒绝域的确定;(6)使学生灵活运用所学知识解决实际问题. 2、本章的重点与难点本章的重点是正态总体参数的各种假设检验中的检验统计量及其分布,难点是假设检验拒绝域的确定.二、教学内容下面主要分2节来讲解本章的主要内容.§7.1 假设检验的基本思想与概念教学目的:要求学生了解假设检验的基本思想,理解假设检验的基本概念,认识假设检验问题,熟悉假设检验的基本步骤.教学重点:基本概念,假设检验的基本步骤. 教学难点:基本概念的理解.教学内容:本节内容包括假设检验的基本概念,假设检验的基本步骤. 7.1.1 假设检验的基本概念1.统计假设、原假设、备择假设把任意一个有关未知分布的假设统称为统计假设,简称假设.例7.1.1 某厂生产的合金强度服从正态分布)16,(θN ,其中θ的设计值为不低于110(Pa ),为保证质量,该厂每天都要对生产情况做例行检查,以判断生产是否正常进行,即该合金的平均强度不低于110(Pa ),某天从生产中随机抽取25块合金,测得强度值为2521,,,x x x ,其均值为)(108Pa x =,问当时生产是否正常?如果生产是正常进行的,则合金平均强度不低于110(Pa ),而合金强度服从)16,(θN ,故平均强度110≥θ,如果生产不正常,则110<θ.现在的问题是据样本得到的信息来判断110≥θ还是110<θ,此问题不是参数估计问题,而是一假设检验问题.这样对未知参数,提出两个对立的假设:称110:0≥θH 为原假设,110:1<θH 为备择假设.通常将不应轻易加以否定的假设做为原假设,以0H 记,当0H 被拒绝时而接受的假设称为备择假设,用1H 表示.2.参数假设、非参数假设参数假设:总体分布类型已知,对分布中的未知参数的假设. 非参数假设:不同于参数假设的其他假设(包括对母体分布函数的类型及分布的某些特征的假设).我们的任务就是根据样本得到的信息,在原假设0H 与备择假设1H 两者中做出一个判断:拒绝还是接受0H .7.1.2 假设检验的基本步骤1、建立假设依据实际问题建立一对假设,例7.1.1的假设为110:110:10<≥θθH vsH2、选择检验统计量,给出拒绝域形式在0H 与1H 两者中做出一个选择,也即完成一次判断,必须建立一个检验法则,而由样本对原假设进行判断总是通过一个统计量完成的,该统计量称为检验统计量.一般而言,检验统计量的选择应该使在0H 、1H 分别成立时,统计量的值有较大差异,从而能够做出判断.在例7.1.1中,样本均值x 就是一个很好的检验统计量,它是总体参数θ的无偏估计.样本均值x 愈大,意味着总体均值θ也大;样本均值愈小,意味着总体均值θ也小.由于样本的随机性,只有当x 小到一定程度,则应认为原假设0H 不正确.故在样本均值x 的取值中有一个临界值C (待定),使得当C x ≤时,认为0H 不正确,也即拒绝0H ,此时称}:{C x x W ≤=为该检验的拒绝域,当C x >时,认为0H 正确,则接受0H ,对应的}:{C x x W >=为该检验的接受域.一般地,使原假设0H 被拒绝的样本观测值所在区域称为拒绝域,记为W ,从而规定:当W x x n ∈),,(1 时,拒绝0H ;当W x x n ∈),,(1 时 ,接受0H .从而一个拒绝域W 唯一确定一个法则.3、选择显著性水平 α 通常=α0.05,0.01,0.1.4、给出拒绝域W利用统计量),,(1n x x T ,使得01),,((H W x x T P n ∈ 为真)α=5、做判断将样本观测值代入检验统计量,看该统计量的值是否落入拒绝域W ,当W x x T n ∈),,(1 时,拒绝0H ,当W x x T n ∉),,(1 时,接受0H .三、假设检验的两类错误与势函数 1、两类错误对给出的拒绝域W ,由于样本的随机性,我们做出的判断不可能100%正确,它可能会犯两类错误:第一:0H 为真时,W x x n ∈),,(1 ,从而拒绝0H .这种错误称为第一类错误,其发生的概率称为犯第一类错误的概率或拒真概率,通常记为α,即α=P (拒绝0H 0H 为真)=01),,((H W x x T P n ∈ 为真)=01],),,[(Θ∈∈θθW x x P n第二:在0H 不真时,W x x n ∈),,(1 ,从而接受0H .这种错误称为第二类错误,其发生的概率称为犯第二类错误的概率或受伪概率,通常记为β,即β=P (接受0H 0H 不真)=01),,((H W x x T P n ∈ 不真)=111],),,[(1]),,[(Θ∈∈-=∈θθθW x x P W x x P n n2、势函数定义7.1.1 设检验问题1100::Θ∈Θ∈θθH vs H 的拒绝域为W ,则样本观测值),,(1n x x 落入拒绝域W 内的概率称为该检验的势函数,即101],),,[()(Θ⋃Θ=Θ∈∈=θθθW x x P g n其中10,ΘΘ是参数空间两个互不相交的子集. 注 由以上α、β及势函数的定义知⎩⎨⎧Θ∈-Θ∈=10),(1),()(θθβθθαθg3、两类错误的关系对例7.1.1,}:{c x x W ≤=,故)4()44(][)(θθθθθ-Φ=-≤-=≤=c c c x P c x P g ,从而犯两类错误的概率)(θα,)(θβ分别为:0),54()(Θ∈-Φ=θθθαc1),54(1)(Θ∈-Φ-=θθθβc从而当α减少时,c 也减少,而c 的减少必导致β的增大;当β减少时,c 会增大,而c 的增大必导致α的增大,故得到两类错误的关系:(1)在样本容量n 一定时,α、β不能同时小,α的增大必导致β的减少;α的减少必导致β的增大;(2)要使α、β同时小,则必须n 充分大,但这又是不现实的.为此,采用折中的方法:控制α,使β尽量小,但有时这样的检验也不存在,从而我们只控制α,而不管β,此时求拒绝域W 只涉及原假设0H ,而不管备择假设1H .4、水平为α的显著性检验 定义7.1.2 对检验问题1100::Θ∈Θ∈θθH vs H ,如果一个检验满足对任意的0Θ∈θ,都有αθ≤)(g则称该检验是显著性水平为α的显著性检验,简称水平为α的检验. 在例7.1.1 取=α0.05,则110≥∀θ有05.0)54()(≤-Φ=θθc g ,由于)(θg 是θ的减函数,故只须05.0)54110()110(=-Φ=c g ,即05.0)]110(45[=-Φc从而684.108645.18.0110645.1)110(4595.0)]110(45[=⨯-=⇒=-⇒=-Φc c c 拒绝域为}684.108:{≤=x x W ,又因为684.108108<=x ,所以拒绝0H ,认为该日生产不正常.§7.2 正态总体参数假设检验教学目的:理解和掌握单个以及两个正态总体均值的假设检验的方法与思想,掌握正态总体方差检验的方法.教学重点:检验方法的掌握,检验方法思想的理解. 教学难点:检验方法的掌握.教学内容:本节内容包括单个正态总体均值的假设检验,两个正态总体均值差的检验,正态总体方差的检验.参数假设检验常见的有三种基本形式 (1)0010::H vs H θθθθ≤>(2)0010::<H vs H θθθθ≥ (3)0010:=:H vs H θθθθ≠一般来说,对这三种假设采取的检验统计量是相同的,差别在拒绝域上.当备择假设1H 在原假设0H 一侧时的检验称为单侧检验,当备择假设1H 分散在原假设0H 两侧时的检验称为双侧检验.(1),(2)是单侧检验,(3)是双侧检验.7.2.1 单个正态总体均值的假设检验设n x x x ,,,21 是来自正态总体),(2σμN 的样本,对均值μ考虑如下的检验: 0100::μμμμ>≤H vs H (1) 0100::μμμμ<≥H vs H (2) 0100::μμμμ≠=H vs H (3)一 2σ已知时的u 检验对单侧检验(1),由于x 是μ的无偏估计,选取统计量u=故当样本均值x 不超过设定均值0μ时,应接受0H ,而当样本均值x 超过设定均值0μ时,应拒绝0H ,但由于样本的随机性,x 比0μ大一点就拒绝0H 似乎不当,只有当x 比0μ大到一定程度时拒绝0H 才是恰当的.故存在临界值c ,拒绝域12{(,,,);}n W x x x u c =≥ ,常简记为{}u c ≥.若要求水平为α,则c 应满足0()=P u c μα≥,因为21~(,)x N nμσ,故0μμ=时~(0,1)x u N =知1c u α-=,所以拒绝域1{;}W u u u α-=≥.该检验用的检验统计量是u 统计量,一般称为u 检验. 易验证1{;}W u u u α-=≥是检验0100::μμμμ>≤H vs H 的显著性水平为α的检验.类似地对0100::μμμμ<≥H vs H 的显著性水平为α的拒绝域{;}W u u u α=<;0100::μμμμ≠=H vs H 的显著性水平为α的拒绝域12{;}W u u u α-=≥.例7.2.1 从甲地发送一个讯号到乙地,设乙地接受到的讯号值是一个服从正态分布)2.0,(2μN 的随机变量,其中μ为甲地发送的真实讯号值.现甲地重复发送同一讯号5次,乙地接受到的讯号值为8.05 8.15 8.2 8.1 8.25设接受方有理由猜测甲地发送的讯号值为8,问能否接受该猜测?=α0.05 分析 此时正态分布的方差已知,对均值进行检验,利用U —检验. 解 总体2~(,0.2)X N μ ,待检验的原假设0H 与备择假设分别为1H :01:8:8H vs H μμ=≠.这是一个双侧检验问题,检验的拒绝域为12{;}u u uα-≥,取0.975=0.05,=1.96u α,计算得=8.15,15-8)/0.2=1.68x u ,u 值未落入拒绝域内,故不能拒绝原假设,及接受原假设,可认为猜测成立.2、σ未知时的t 检验若2σ未知,则上述的随机变量x u =不再是统计量,自然我们要用2σ的无偏估计2211()1n ii s x x n ==--∑代替2σ,此时有0()x t s μ-=,且0μμ=时~(1)t t n =-,类似于2σ已知时均值μ的检验问题的讨论得到:0100::μμμμ>≤H vs H 的水平为α的拒绝域为1{;(1)}W t t t n α-=≥- 0100::μμμμ<≥H vs H 的水平为α的拒绝域为{;(1)}W t t t n α=≤-0100::μμμμ≠=H vs H 的水平为α的拒绝域为12{;(1)}W t t tn α-=≥-例7.2.2 某厂生产的某种铝材的长度服从正态分布,其均值设定为240cm ,现从该厂抽取5件产品,测得其长度为(单位:cm )239.7 239.6 239 240 239.2试判断该厂此类铝材的长度是否满足设定要求?=α0.05分析 此时正态分布的方差未知,对均值进行检验,利用T —检验. 解 略.综上,关于单个正态总体均值的假设检验问题可汇总成如下的表:7.2.2 两个正态总体均值差的检验设m x x x ,,,21 是来自总体X 服从),(211σμN 的样本,n y y y ,,,21 是来自总体Y 服从),(222σμN 的样本,且两样本相互独立,考虑如下的三种检验:0:0:211210>-≤-μμμμH vs H (1)0:0:211210<-≥-μμμμH vs H (2)0:0:211210≠-=-μμμμH vs H (3)主要分两种情况讨论.12,σσ已知时的两样本u 检验此时21μμ-的估计y x -的分布完全已知,),(~222121nmN y x σσμμ+--,由此可采用u 检验法,检验统计量为x yu =在21μμ=时,~(0,1)x yu N =.检验的拒绝域取决于备择假设的形式.上述三对假设检验的拒绝域分布为:1{;}W u u u α-=≥ {;}W u u u α=<12{;}W u u uα-=≥σσσ==21但未知时的两样本t 检验在22221σσσ==未知时,类似于单个正态总体方差未知时均值的检验,我们仍用2σ的无偏估计代替2σ,而此时可以证明2σ的无偏估计为:2222211(1)(1)1[()()]22m n x y wi i i i m s n s s x x y y m n m n ==-+-=-+-=+-+-∑∑ 于是有~(2)x y t t m n =+-从而检验统计量为x yt =在021=-μμ时,)2(~11-++-=n m t nm S y x T w.上述三对假设检验的拒绝域分布为:1{;(2)}W t t t m n α-=≥+-{;(2)}W t t t m n α=≤+-12{;(2)}W t t tm n α-=≥+-例7.2.3 某厂铸造车间为提高铸件的耐磨性而试制了一种镍合金铸件以取代铜合金铸件,从两种铸件中各抽取一个容量分别为8和9的样本,测得其硬度(一种耐磨性指标)为:镍合金 76.43 76.21 73.58 69.69 65.29 70.83 82.75 72.34铜合金 73.66 64.27 69.34 71.37 69.77 68.12 67.27 68.07 62.61 根据专业经验,硬度服从正态分布,且方差保持不变,试在显著性水平=α0.05下判断镍合金的硬度是否有明显提高? 解 略.一、 单个正态总体方差的2χ检验设总体),(~2σμN X ,n x x x ,,,21 是来自该总体的样本,对方差2σ考虑如下的三种检验:221220::σσσσ>≤H vs H (1) 221220::σσσσ<≥H vs H (2)2212020::σσσσ≠=H vs H (3)1、均值μ未知时方差的检验由于μ未知,2211()1n ii s x x n ==--∑是2σ的无偏估计,且202σσ=有)1(~)1(22022--=n S n χσχ对于显著性水平α,对应上述三种假设检验的拒绝域分布为:2221{;(1)}W n αχχχ-=≥- 222{;(1)}W n αχχχ=≤-22212{;(1)W n αχχχ-=≥-或222(1)}n αχχ≤-例7.2.4 某类钢板每块的重量X 服从正态分布,其一项质量指标是钢板重量的方差不得超过0.0162kg .现从某天生产的钢板中随机抽取25块,得其样本方差2S =0.0252kg .问该天生产的钢板重量的方差是否满足要求?=α0.05.解 略.2、均值μ已知时方差的检验此时,检验统计量取为20212)(σμχ∑=-=ni ix,且220σσ=时)(~)(220212n xni iχσμχ∑=-=故对均值μ已知时方差的三种检验,我们只需将均值μ未知时方差的三种检验中2χ—分布的自由度变一下就可得到检验的拒绝域.)二 两个正态总体方差比的F 检验设m x x x ,,,21 是来自总体X 服从),(211σμN 的样本,n y y y ,,,21 是来自总体Y 服从),(222σμN 的样本,且两样本相互独立,考虑如下的三种检验:2221122210::σσσσ>≤H vs H (1) 2221122210::σσσσ<≥H vs H (2) 2221122210::σσσσ≠=H vs H (3) 此处21,μμ均未知,22,x y s s 分别表示总体X 、Y 的样本方差,易知221()x E s σ=,222()yE s σ= 从而建立检验统计量22xys F s =当2212σσ=时,22~(1,1)xys F F m n s =--,此时,上述三个检验的拒绝域分别为:)}1,1(;{1--≥=-n m F F F W α )}1,1(:{--≤=n m F F F W α)1,1(:{21--≥=-n m FF F W α或)}1,1(2--≤n m F F α例7.2.5 甲、乙两台机床加工零件,零件的直径服从正态分布,总体方差反映了加工的精度,为比较两台机床的加工精度有无区别,现从各自加工的零件中分别抽取7件产品和8件产品,测得直径为:X (机床甲) 16.2 16.4 15.8 15.5 16.7 15.6 15.8Y (机床乙) 15.9 16.0 16.4 16.1 16.5 15.8 15.7 15.0 取 =α0.05. 解 略.)1)1§7.3 其他分布参数的假设检验教学目的:了解指数分布参数的假设检验,比例的检验,大样本检验,会解决简单的实际问题.教学重点:对于检验方法的理解. 教学难点:解决简单的实际问题.教学内容:本节内容包括指数分布参数的假设检验,比例p 的检验,大样本检验,检验的p 值.7.3.1 指数分布参数的假设检验设n x x x ,,,21 是来自指数分布1()Exp θ的样本,现考虑关于θ的如下检验问题:0010::H vs H θθθθ≤>,拒绝域的自然形式是={}W x c ≥,下面讨论x 的分布.考虑θ的充分统计量x ,在0=θθ时,0=1=~(,1)ni i nx x Ga n θ∑,由咖玛分布的性质可知2202=~(2)nxn χχθ,于是可用2χ作为检验统计量并利用2(2)n χ的分位数建立检验的拒绝域221-={(2n)}W αχχ≥.类似可得,对关于θ的另两种检验问题:0010::<H vs H θθθθ≥, 0010:=:H vs H θθθθ≠检验统计量仍是2χ,拒绝域分别是22={(2n)}W αχχ≤,22221-22={(2n)(2n)}W ααχχχχ≤≥或.例7.3.1 设我们要检验某种元件的平均寿命不小于6000h ,假定元件寿命为指数分布,现取5个元件投入试验,观测到如下5个失效时间(h ) 395 4094 119 11572 6133 解:这是一个假设检验问题,检验的假设为 01:6000:<6000H vs H θθ≥经计算=4462.6x ,故检验的统计量为201044626===7.43776000xχθ, 若取=0.05α,查表得20.05(10)=3.94χ,由于220.05>(10)χχ,故接受原假设,可以认为平均寿命不低于6000h.7.3.2 比例p 的检验比例p 可看做某时间发生的概率,即看作二点分布(1,)b p 中的参数.作n 次独立重复试验,以x 记该事件发生的次数,则~(n,)x b p . 现考虑如下单边假设检验问题 0010::H p p vs H p p ≤>,找一个0c ,使得00--0000==+1(1-)>>(1-)nni n ii n i i c i c n n p p p p i i α⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭∑∑,0=+1c c 可得水平为α的检验.对检验问题0010::<H p p vs H p p ≥,检验的拒绝域为={x }W c ≤,c 为满足-00=0(1-)ci n ii n p p i α⎛⎫≤ ⎪⎝⎭∑的最大正整数. 对检验问题0010:=:H p p vs H p p ≠,检验的拒绝域为12={x x c }W c ≤≥或,1c 为满足1-00=0(1-)2c i n i i n p p i α⎛⎫≤ ⎪⎝⎭∑的最大正整数,2c 为满足2-00=c (1-)2ni n i i n p p i α⎛⎫≤ ⎪⎝⎭∑的最小正整数.例7.3.2 某厂生产的产品优质品率一直保持在40%,近期对该厂生产的该类产品抽检20件,其中优质品7件,在=0.05α下能否认为优质品率仍保持在40%?解:这是一个假设检验问题,以p 表示优质品率,以x 表示20件产品中的优质品数,则~(20,)x b p ,待检验的原假设为01:=0.4:0.4H p vs H p ≠,拒绝域为12={x x c }W c ≤≥或,下求1c ,2c .由于(3)=0.0160<0.P x P x ≤≤,故取1=3c ,又由于(11)=0.0565>0.025>(12)=0.0210P x P x ≥≥,故取2=12c ,拒绝域为={x 3x 12}W ≤≥或由于观测值没有落入拒绝域,故接受原假设.7.3.2 大样本检验设12,,,n x x x 是来自某总体的样本,该总体均值为θ,方差为θ的函数,记为2σθ(),则对下列三类假设检验问题:(1)0010::H vs H θθθθ≤>; (2)0010::<H vs H θθθθ≥, (3)0010:=:H vs H θθθθ≠.在样本容量n 充分大时,利用中心极限定理2~(,()/n)x N θσθ故在0=θθ时.可采用检验统计量(0,1)u N,对应上述三类假设检验问题的拒绝域分别为1-={u}W uα≥,={u}W uα≤,1-2={}W u uα≥.例7.3.3例7.3.47.3.4 检验的p值例7.3.5 略从例7.3.5可以看到,对同一个假设检验问题,若取不同的显著水平α,会得到不同的结论,0.0179是能用观测值2.10做出“拒绝H”的最小的显著性水平,这就是p值.定义7.3.1 在一个假设检验问题中,利用观测值能够做出拒绝原假设的最小显著性水平称为检验的p值.引进检验的p值的概念有如下好处:(1)它比较客观,避免了事先确定显著水平.(2)由检验的p知与人们心目中的显著性水平α进行比较可以很容易做出检验的结论:如果pα≥,则在显著性水平α下拒绝H;如果<pα,则在显著性水平α下应接受H.例7.3.6 设nxxx,,,21是来自(1,)bθ的样本,要检验如下假设0010::H vs Hθθθθ≤>设检验的显著性水平为α,则检验的拒绝域为={}iW x c≥∑,在得到观测值0=i x t∑后,计算={}ip P x tθ≥∑,就是检验的p值.例如,00=40,=0.1,=8n tθ,则40397334040=1-0.9-0.10.9--0.10.9=0.0419 17p⎛⎫⎛⎫⨯⨯⎪ ⎪⎝⎭⎝⎭,若取=0.05α,则>pα,应拒绝原假设.例7.3.7 略§7.4 分布拟合检验教学目的:了解有限离散总体分布的拟合检验、列联表的独立性检验和正态性检验.教学重点:列联表的独立性检验和正态性检验.教学难点:解决简单的实际问题.教学内容:本节内容包括总体分布只取有限个值的情况,列联表的独立性检验.正态性检验.前面讨论的检验问题都是在总体分布形式已知的前提下对分布的参数建立假设并进行检验,它们都属于参数假设检验问题.这一节我们对总体分布的形式建立假设并进行检验,这一类检验问题统称为分布的拟合检验,属于非参数假设检验.7.4.1 总体分布只取有限个值的情况设总体X 可以分成k 类,记为12,,,k A A A ,现对该总体做了n 次观测,k 个类出现的频数分别为12,n ,,n k n ,且=1=ki i n n ∑,要检验的假设为0:P(A )=,=1,2,,.i i H p i k (7.4.1)=1=1,p0.ki ii p ≥∑其备择假设是(7.4.1)诸等式不全成立.下面我们分两种情况讨论7.4.1的检验问题. 一 诸i p 均已知如果0H 成立,则对每一类i A ,其频率in n与概率i p 应较接近.据此,选用检验统计量22=1(-)=ni i i i n np np χ∑,可证明在0H 成立时,对充分大的n ,2χ近似服从自由度为-1n 的2χ分布.因此,对给定的显著性水平0<<1)αα(,该检验的拒绝域为221-={(-1)}W k αχχ≥. 例7.4.1 二 诸i p 不完全已知诸i p =1,2,,.i k 可由(<)r r k 个未知参数1,,r θθ 确定,即1=),i=1,k.i i r p p θθ (,, 为对假设(7.4.1)做检验,由样本给出诸i θ,=1,2,,r.i 的最大似然估计^^1,,r θθ ,再给出诸i p ,=1,2,,.i k 的最大似然估计^^^1=),r i i p p θθ (,,取检验统计量 ^22^=1(-)=ki i i in n p n p χ∑,可证明2χ近似服从自由度为k-r-1的2χ分布.因此,对给定的显著性水平0<<1)αα(,该检验的拒绝域为221-={(--1)}W k r αχχ≥.例7.4.27.4.2 列联表的独立性列联表是将观测数据按两个或更多属性(定性变量)分类时所列出的频数表. 一般,若总体中的个体可按两个属性,A B 分类, A 有r 个类1,,r A A , B 有c 个类1,,B c B ,从总体中抽取大小为n 的样本,设其中有ij n 个个体既属于A 类,又属于B 类,ij n 称为频数,将r c ⨯个ij n 排列为一个r 行c 列的二维列联表,简称r c ⨯表.对二维列联表,提出假设“,A B 两属性独立”,即0:=p p ,=1,2,,r,j=1,2, c.ij i j H p i 取检验统计量^22^=1=1(-)=rcij ij i j ijn n p n p χ∑∑,则在原假设成立时,2χ近似服从自由度为-(+-2)-1=(-1)(-1)rc r c r c 的2χ分布,其中^ij p 是ij p 的最大似然估计.因此,对给定的显著性水平0<<1)αα(,该检验的拒绝域为221-={((-1)(c-1))}W r αχχ≥. 例7.4.37.4.3 正态性检验用来判断总体分布是否为正态分布的检验方法称为正态性检验. 一正态概率纸概率纸是一种具有特殊刻度的坐标纸.使用这种坐标纸即可以很快判断总体分布的类型又能粗略地估计总体的参数,是检验总体分布的一种简单工具.正态概率纸是一张刻有直角坐标的图纸,它的横坐标轴的刻度是均匀的,表示观察值,纵坐标轴的刻度是不均匀的,表示概率,具体的刻度是按标准正态分布换算出来的,即在普通的直角坐标xot 的纵坐标轴(t 轴)上原坐标为t 的点刻度为du et u t2221)(-∞-⎰=Φπ,例如纵轴上,原坐标为1处的刻度为8413.0)1(=Φ,原坐标为2处的刻度为9772.0)2(=Φ,原坐标为-1处的刻度为1587.0)1(=-Φ,但习惯上,在正态概率纸上的纵坐标轴上标明的数字是换算出的刻度的100倍,又由于x 是在+∞∞-~取值,概率不可能为0,也不可能为1,故一般概率纸的纵轴的刻度都是从99.99~01.0.例7.4.4 随机选取10个零件,测得其直径与标准尺寸的偏差如下: 9.4 8.8 9.6 10.2 10.1 7.2 11.1 8.2 8.6 9.6 利用正态概率纸作正态性检验的步骤如下:1. 首先把样本观察值按从小到大的次序排列:(n)(2)(1)x x x ≤≤≤ 9.6 9.810.1 10.2 11.1具体数据为 7.2 8.2 8.6 8.8 9.42. 对每一个i ,计算修正的频率n ,,2,1i ),25.0n /()375.0i (F i=+-=结果为12345F =0.061F =0.159F =0.256F =0.354F =0.451 ,,,,,678910F =0.549F =0.646F =0.743F =0.841F =0.939 ,,,,3. 将点n ,,2,1i ),F ,x (i (i)=逐一点在正态概率纸上 4. 判断若诸点在一条直线附近,则认为该样本来自正态总体;若诸点明显不在一条直线附近,则认为该样本不是来自正态分布总体.如果从正态概率纸上确认总体是非正态分布时,可对原始数据进行变换后再在正态概率纸上描点,若变换后的点在正态概率纸上近似在一条直线附近,则可认为变换后的数据来自正态分布,这样的变换称为正态性变换.常用的正态性变换有:对数变换,倒数变换和根号变换.例7.4.5 利用对数变换二 夏皮洛-威尔克检验夏皮洛-威尔克检验也简称W 检验,这个检验当850n ≤≤时可以使用,过小样本对偏离正态分布的检验不太有效.W 检验是建立在次序统计量的基础上,将n 个独立观测值按非降次序排列,记为(1)(2)(n)x ,x ,,x ,检验统计量为2=1=122=1=1[(-)(-)]=(-)(-)n ni i i i n niii i a a x x W a a x x ∑∑∑∑,系数12,,,n a a a 在样本容量为n 时有特定的值,可查附表.系数12,,,n a a a 还具有性质:+1-=-,=1,2,,[]2i n i n a a i2=1=1=0,=1n ni ii i a a∑∑故可将统计量简化为[]22(+1-)()=12()=1[(-)]=(-)n i n i i i ni i a x x W xx ∑∑,可以证明,在原假设成立,即总体分布为正态分布时,W 的值应该接近1,因此在显著性水平α下,如果统计量W 的值小于其α分位数,则拒绝原假设,即拒绝域为{}W W α≤. 例7.4.6 略。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

AA
BB
2.从两个总体中随机抽取两个样本,两样本信息不同,推
断两总体信息是否不同。 A



2020/4/15
38
完全随机设计类型(两种形式)
例8.3 例8.4 例8.6
例 某医院用某新药与常规药治疗婴幼儿贫血,将20名贫
血患儿随机等分两组,分别接受两种药物治疗,测得血
红蛋白增加量(g/L)如下,问新药与常规药的疗效有无
②检验水准α=0.05
③ t 4 3 4.7140 50 1 49
1.5 / 50 ④⑤查拒界绝值零表假,设自,由接度受近备似择取假设50,,可可以得认到为“P新疗0法.0使0患1者锻炼持续时间的平均增加
量不等于常规疗法的3分钟”
2020/4/15
13
建立假设,确定单双侧检验 确定检验水准
2020/4/15
34
配对设计t检验可解决的问题
d 0
d ? 0
2020/4/15
35
配对设计t检验的假设检验步骤
H0:μd=0 H1: μd≠0 α=0.05
t d 0 : t( ), n 1
Sd / n
查ν=n-1的t界值表,确定P值
P≤α
拒绝H0,接受H1
2020/4/15
作出推断结论
2020/4/15
5
? 0
0 X 0是由抽样误差所致
0 X 0是由两总体异质性所致
2020/4/15
6
假设检验的基本步骤
1. 建立假设(H0和H1) ,确定单双侧检验 2. 确定检验水准α 3. 选择检验方法,计算检验统计量 4. 确定 P 值 5. 作出推断结论
2020/4/15
2020/4/15
24
例3 测得25例女性患者的血红蛋白(Hb),其均数为 150 (g/L),,标准差为16.5 (g/L)。而当地正常成年女性 的Hb均数为132 (g/L),问该病女性患者的Hb含量是否 与正常女性Hb含量不同?
2020/4/15
25
单样本设计t检验可解决问题
X 0
? 0
体重配成7对,一组为对照组,一组为脑缺氧模型组。试比较两
乳猪组编号动物脑1 组织钙2泵的含量3 有无差4别? 5
6
7
对照组
0.3550 0.2000 0.3130 0.3630 0.3544 0.3450 0.3050
试验组
0.2755 0.2545 0.1800 0.3230 0.3113 0.2955 0.2870
2020设检验步骤
H0:μ=μ0 H1: μ≠μ0
(双侧)
μ>μ0或μ<μ0 (单侧)
α=0.05
t X 0 : t( ), n 1
S/ n
查ν=n-1的t界值表,确定P值
P≤α
拒绝H0,接受H1
2020/4/15
作出推断结论
P>α
不能拒绝H0
27
单样本设计t检验的适用条件
编号
1
2
3
4
5
6
7
8
9
10
11
12
Wright 490 397 512 401 470 415 431 429 420 275 165 421 法
Mini法 525 415 508 444 500 460 390 432 420 227 268 443
差值d
35 18 -4
43 30 45
-41 3
2020/4/15
4
例7.2 某医生研究一种新的治疗充血性心力衰竭的方法。 对50位心功能在2~3级之间的成年男性患者进行4周的 治疗,考察其疗效。评价疗效的一个指标是锻炼持续时 间的增加量(分钟)。以前常规的治疗方法能使患者的锻 炼持续时间平均增加3分钟。该医生通过50位接受新方 法治疗的患者的数据算得锻炼持续时间平均增加4分钟, 标准差为1.5分钟。该新疗法使患者锻炼持续时间的平均 增加量是否多于常规疗法的3分钟?
假设检验基础
流行病与卫生统计学教研室
2020/4/15
1
假设检验的概念和基本原理
生活实例
某商家宣称:他的一大批鸡蛋“坏蛋率为1%”。 为了对这批鸡蛋的质量作出判断,某质量监督员从 中随机抽取5个作检查,结果4个为好蛋,1个为变 质蛋。 根据此结果,作为质量监督员如何评价鸡蛋的质量? 为什么?
2020/4/15
P>α
不能拒绝H0
36
配对设计t检验的适用条件
➢独立性 ➢正态性
2020/4/15
37
(三) 完全随机设计t检验(两独立样本t检验)
(two independent samples t-test)
完全随机设计类型(两种形式)
1.从同一个同体中随机抽取两个样本,分别采用两种不同
的处理,比较不同处理结果是否有差异。
单样本设计的t检验 配对设计的t检验 完全随机设计(成组设计)的t检验
2020/4/15
22
每种不同设计类型的t检验均主要从以下四个方面介绍:
1. 设计类型 2. 可解决的问题 3. 假设检验步骤 4. 适用条件
2020/4/15
23
(一)单样本设计的t检验one-sample t-test
单样本设计
及大于现有样本统计量值的概率。 怎样确定P值:构造的检验统计量服从相应的分布,查 相应分布界值表确定P值。 一般双侧检验查双侧界值,单侧检验查单侧界值。
2020/4/15
11
5.作出推断结论
P与检验水准α相比作出推断结论
P≤ α,拒绝H0,接收H1
(在H0成立的前提下,一次随机抽样发生了小概率事件)
7
1. 建立假设(H0和H1) ,确定单双侧检验
建立假设(H0和H1)
H0 零假设或原假设(null hypothesis)
通常为两总体参数相等或服从某分布;
H1 备择假设(alternative hypothesis)
通常为两总体参数不相等或不服从某分布;
确定单双侧检验
由研究目的及专业知识所决定 从备择假设H1 看: H1:μ≠μ0(μ>μ0和μ< μ0)
9
3.选择检验方法,计算检验统计量
应根据研究目的、资料类型、设计类型及样本含量大小 等因素选择合适的假设检验方法; 在H0成立的前提下,由样本已知信息构造检验统计量; 通常根据构造的检验统计量来命名假设检验方法。
2020/4/15
10
4.确定 P 值
P值的含义:由H0所规定的总体作随机抽样,获得等于
例8.1 例2 已知中学一般男生的心率平均值为74次/分钟,为了
研究经常参加体育锻炼的中学生心脏功能是否与一般 的中学生相同,在某地区中学随机抽取常年参加体育 锻炼的男生16名,测量他们的心率,结果分别为55、 72、58、57、70、75、72、69、61、67、69、73、59、 71、53、69。请作统计推断。
2020/4/15
16
一 、假设检验的两类错误
第Ⅰ类错误与第Ⅱ类错误的概念 将假设检验的结果与实际情况相比: 第Ⅰ类错误(typeⅠerror):H0为真时,拒绝H0 第Ⅱ类错误(type Ⅱ error) : H0不真时,不拒绝H0
2020/4/15
17
实际情况
推断结论和两类错误 检验结果
拒绝H0
P> α,不能拒绝H0
(在H0成立的前提下,一次随机抽样没有发生小概率事件,没有充 足的理由拒绝H0 )
2020/4/15
12
例7-2的假设检验的基本步骤
①H0:μ=3
(新疗法使患者锻炼持续时间的平均增加量等于常规疗法的3分钟 )
H1:μ≠3
(新疗法使患者锻炼持续时间的平均增加量不等于常规疗法的3分钟 )
差值d
0.0795 -0.0545 0.1330 0.0400 0.0431 0.0495 0.0180
2020/4/15
30
配对设计的设计形式
例2 为了研究孪生兄弟的出生体重是否与其出生顺序有关,共收 集了15对孪生兄弟的出生顺序和出生体重,数据如下:
编号 1
23
4
5
6
7
8
9
10 11 12 13 14 15
先出生 2.79 3.06 2.34 3.41 3.48 3.23 2.27 2.48 3.03 3.07 3.61 2.69 3.09 2.98 2.65
后出生 2.69 2.89 2.24 3.37 3.50 2.93 2.24 2.55 2.82 3.05 3.58 2.66 3.20 2.92 2.60
H1 : 0 (双侧检验 two-sides test) H1 : 0或 0 (单侧检验 one-sided test)
2020/4/15
8
2.确定检验水准α(size of a test)
检验水准α:为预先规定的小概率事件的标准 通常取值0.05或0.01 可根据研究目的进行调整
2020/4/15
选定检验方法,计算检验统计量
确定P值
P≤α
作出推断结论
P>α
拒绝H0,接受H1
2020/4/15
不能拒绝H0
14
第三节 两类错误及检验效能
假设检验的两类错误 假设检验的功效
2020/4/15
15
一 、假设检验的两类错误
假设检验是根据有限的样本信息对总体作 推断,不论做出那种推断结论,都有可能发生 错误。
配对设计常见的设计形式 异体配对 同一样品,采用两种不同处理 同体配对 自身前后或左右配对
2020/4/15
29
配对设计的设计形式
1. 异体配对:将两个不同的受试对象(按主要非处理因素)配成 特征相近的对子,同对的两个受试对象随机接受两种不同的处 理。
相关文档
最新文档