卫生统计学假设检验PPT课件
合集下载
第7章 假设检验基础PPT课件
S d 2 (d)2 / n 84.2747
d
n 1
t | d | 475.66 19.532, n 1 12 1 11
S / n 84.2747 / 12 d 3.查相应界值表,确定 P 值。
查表 t0.05/ 2,11
2.201,tt ,P 0.05/ 2,11
<0.05,拒绝 H0,差别有统计学意
第一节 假设检验的概念与原理
一、假设检验的思维逻辑 二、假设检验的基本步骤
2020/11/15
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
一、假设检验的思维逻辑
样本统计量与总体参数间(或统计量与统计 量间的)的差异产生的原因:
1. 个体变异所导致的抽样误差所引起; 2. 总体间确实有差异
1728.03
622.51
12
757.43
1398.86
641.44
2020/11/15
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
1.建立假设、确定检验水准α
H0: d 0 H1: d 0 (双侧检验)α=0.05
2.计算检验统计量
d 5707.95 12 475.66 , d 5707.95, d 2 2793182.166,
2020/11/15
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
实例
用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量
序号
用药前
用药后 差值(后-前)
1
1206.44
1678.44
472.00
2
921.69
1293.36
371.67
3
1294.08
医学统计学课件:假设检验
数据展示
不同职业人群的身高和体重数据。
统计方法
方差分析,推断不同职业人群的身 高和体重是否具有统计学差异。
06
总结与展望
医学统计学在假设检验中的重要性
数据驱动决策
医学统计学在假设检验中扮演着核心角色,其原理和方法为数 据驱动的决策提供了基础框架。
提高诊断准确性
通过假设检验,医学统计学可以帮助医生做出更准确的诊断, 从而更好地制定治疗方案。
详细描述
方差分析的步骤包括提出假设、计算统计 量F值、确定临界值和作出结论。该方法可 以分析多个样本数据之间的差异,推断出 各样本所代表的总体的平均值之间是否存 在显著差异。
04
假设检验的注意事项
假设检验的前提条件
ห้องสมุดไป่ตู้样本与总体
样本是总体的代表,总体是样本的来源。在进行假设检验时,必须清楚定义总体和样本, 并考虑样本的代表性、样本大小和效应大小等因素。
研究目的
探讨该地区高血压与年龄的关系。
研究设计
收集该地区各年龄组人群的高血压患病率 数据,进行分析。
数据展示
各年龄组高血压患病率数据。
统计方法
卡方检验,探索不同年龄组之间高血压患 病率是否存在差异。
实例三
研究目的
探讨该地区不同职业人群的身高与 体重是否存在差异。
研究设计
收集不同职业人群的身高和体重数 据,进行对比分析。
02
假设检验的统计学原理
概率论与统计学关系
1
概率论是数学的一个分支,主要研究随机事件 发生的可能性。
2
统计学是利用概率论研究随机数据的方法和原 理的一门学科。
3
假设检验是统计学中利用概率论原理对未知的 总体参数进行推断的方法。
医学统计学课件:假设检验
统计推断基础
参数估计
用样本数据估计总体参数的方法。
显著性检验
理解显著性检验的基本原理和方法。
假设检验
根据样本数据对总体参数进行检验的方法。
置信区间
掌握置信区间的概念和计算方法。
03
参数假设检验
单参数假设检验
定义
单参数假设检验是当我们只有一个总 体参数需要检验时的假设检验。例如 ,我们可能需要确定一个药物是否对 一组患者的平均血压有降低作用。
应用场景:例如,检验某种新药的疗效是否显著优于安 慰剂。
案例二:两样本t检验
总结词:两样本t检验是一种常用的假设检验方 法,适用于比较两个独立样本的平均数是否存在 显著差异。
详细描述
1. 定义假设:通常包括零假设(H0,即两个样本的 平均数无差异)和对立假设(H1,即两个样本的平 均数存在差异)。
02
假设检验的数学基础
概率基础
概率定义
表示随机事件发生的可能性程度。
概率运算
掌握加法、乘法和条件概率等运算方法。
独立性和互斥性
理解事件之间的独立性和互斥性。
分布基础
分布定义
描述随机变量取值的概率规律。
连续型和离散型分布
理解连续型和离散型分布的概念和特点。
常用分布
掌握常用的分布及其性质,如正态分布、二项分布等。
假设检验步骤
根据符号分布,计算临界值和p值,判断假设是 否成立。
05
假设检验的注意事项与误用
假设检验的注意事项
明确研究目的和背 景
在假设检验前,需要明确研究目 的和背景,以便确定合适的假设 和检验方法。
合理选择样本量和 样本类型
样本量和样本类型的选择对假设 检验的结果具有重要影响。在确 定样本量时,需要考虑研究目的 、研究设计、误差概率等因素。
卫生统计学课件_第六章_假设检验
2020/10/7
1
统计推断
用样本信息推论总体特征的过程。
包括: 参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节 假设检验
▲显著性检验;
▲科研数据处理的重要工具;
与正常人血清 ß脂旦白均数不同; 两样 本均数差别有显著性。
2020/10/7
▲计算公式: t 统计量: 自由度:n - 1
2020/10/7
11
▲ 适用条件:
(1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准误; (3) 样本量小于100; (4) 样本来自正态或近似正态总体。
2020/10/7
12
例:已知一般婴儿平均出生体重为3.20kg,某医生 调查了25个难产婴儿出生体重,并计算其平均出生 体重为3.42kg ,标准差为0.42kg,试分析难产儿出 生体重与一般婴儿出生体重有假设 • 拒绝检验假设 正确理解结论的概率性(都隐含着犯错误的
可能性)。
2020/10/7
8
第二节 t 检验
▲ t 值表
横标目:自由度, υ
纵标目:概率, p, 即曲线下阴影部分的面积;
表中的数字:相应的 |t | 界值
▲ t 值表规律:
(1) 自由度(υ)一定时,p 越小, t 越大;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
2020/10/7
3
假设检验的主要内容
1、原因 2、目的 3、原理 4、过程(步骤) 5、结果
1
统计推断
用样本信息推论总体特征的过程。
包括: 参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节 假设检验
▲显著性检验;
▲科研数据处理的重要工具;
与正常人血清 ß脂旦白均数不同; 两样 本均数差别有显著性。
2020/10/7
▲计算公式: t 统计量: 自由度:n - 1
2020/10/7
11
▲ 适用条件:
(1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准误; (3) 样本量小于100; (4) 样本来自正态或近似正态总体。
2020/10/7
12
例:已知一般婴儿平均出生体重为3.20kg,某医生 调查了25个难产婴儿出生体重,并计算其平均出生 体重为3.42kg ,标准差为0.42kg,试分析难产儿出 生体重与一般婴儿出生体重有假设 • 拒绝检验假设 正确理解结论的概率性(都隐含着犯错误的
可能性)。
2020/10/7
8
第二节 t 检验
▲ t 值表
横标目:自由度, υ
纵标目:概率, p, 即曲线下阴影部分的面积;
表中的数字:相应的 |t | 界值
▲ t 值表规律:
(1) 自由度(υ)一定时,p 越小, t 越大;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
2020/10/7
3
假设检验的主要内容
1、原因 2、目的 3、原理 4、过程(步骤) 5、结果
《假设检验》PPT课件-(2)(1)
H0 :1=2,正常人与病毒性肝炎患者的转铁蛋白含量相等; H1 :1≠2 ,正常人与病毒性肝炎患者的转铁蛋白含量不等。 双侧 =0.05。 =n1+n2-2=12+15-2=25 按自由度25查附表2,t界值表得t0.001,25=3.725,t>t0.001,25,P<0.001,差别有统计学意义,可以认为病毒性肝炎患者的转铁蛋白含量较低。
例6.2 现用两种测量肺活量的仪器对12名妇女测得最大呼气率(PEER)(L/min),资料如表6.1,问两种方法的检测结果有无差别?
H0:d=0,两仪器检验结果相同; H1:d≠0,两仪器检验结果不同。 双侧 =0.05。 按 = n-1=12-1=11查t值表,得t0.20,11=1.363,t0.10,11=1.796,t0.10,11>t>t0.20,11,则0.20>P>0.10,差别无统计学意义,尚不能认为两种仪器检查的结果不同。
5
6
8
9
10
11
4
与间关系:大,小;大,小。增加n可同时,缩小。
检验的功效
实际应用假设检验时,当P ≤ 而拒绝H0接受H1,要注意第一类错误出现;当P > 而不拒绝H0,要注意第二类错误的出现。尤其是,第二类错误率 表示失去对真实的H1作出肯定结论之概率,故1- 就是对真实的H1作出肯定结论之概率,常被用来表达某假设检验方法的检验的功效(power of a test),国内学者称它为把握度:假设检验对真实的H1作肯定结论之把握程度。 `
判断水准 必须事先确定,一般取0.05。 P值 P值是决策的依据 P≤0.05 及其意义:首先P不指H0成立之可能,而是指从H0假设总体中随机抽到差别至少等于现有差别的机会。
假设检验中需注意的几个问题
第一类错误与第二类错误 拒绝H0,接受H1 不拒绝H0 H0真实 第一类错误( ) 正确推断(1-) H0不真实 正确推断(1-) 第二类错误() 统计学上规定:H0真实时被拒绝为第一类错误(又称Ⅰ型错误,type Ⅰerror),H0不真实时不拒绝为第二类错误(又称Ⅱ型错误,type Ⅱ error)。
例6.2 现用两种测量肺活量的仪器对12名妇女测得最大呼气率(PEER)(L/min),资料如表6.1,问两种方法的检测结果有无差别?
H0:d=0,两仪器检验结果相同; H1:d≠0,两仪器检验结果不同。 双侧 =0.05。 按 = n-1=12-1=11查t值表,得t0.20,11=1.363,t0.10,11=1.796,t0.10,11>t>t0.20,11,则0.20>P>0.10,差别无统计学意义,尚不能认为两种仪器检查的结果不同。
5
6
8
9
10
11
4
与间关系:大,小;大,小。增加n可同时,缩小。
检验的功效
实际应用假设检验时,当P ≤ 而拒绝H0接受H1,要注意第一类错误出现;当P > 而不拒绝H0,要注意第二类错误的出现。尤其是,第二类错误率 表示失去对真实的H1作出肯定结论之概率,故1- 就是对真实的H1作出肯定结论之概率,常被用来表达某假设检验方法的检验的功效(power of a test),国内学者称它为把握度:假设检验对真实的H1作肯定结论之把握程度。 `
判断水准 必须事先确定,一般取0.05。 P值 P值是决策的依据 P≤0.05 及其意义:首先P不指H0成立之可能,而是指从H0假设总体中随机抽到差别至少等于现有差别的机会。
假设检验中需注意的几个问题
第一类错误与第二类错误 拒绝H0,接受H1 不拒绝H0 H0真实 第一类错误( ) 正确推断(1-) H0不真实 正确推断(1-) 第二类错误() 统计学上规定:H0真实时被拒绝为第一类错误(又称Ⅰ型错误,type Ⅰerror),H0不真实时不拒绝为第二类错误(又称Ⅱ型错误,type Ⅱ error)。
最新假设检验基础 卫生统计学 中山大学医学统计与流行病学教材PPT课件
假定干预前后血色素差值服从正态分布
: d 0 H1 : d 0
2. 计算统计量
= 0.05
n=12, d =10.67, Sd 11.18
t
d 0 Sd / n
10.67 -0 = 11.18 / 12 =3.305 ,
n 112 1 11
3. 确定 P 值,作出推断
例如,把有病说成没病,把有效说成无效等
表 7-1 统计推断的两类错误及其概率
统计推断
实际情况
拒绝 H 0 , 有差异
不拒绝 H 0 , 无差异
H 0 成立,无差异
第 I 类错误(假阳性) 概率=
正确 概率=1-
H1 成立,有差异
正确
概率=1-
第 II 类错误(假阴性)
概率=
概率 1 1
第二节 t 检验
试验组:10.2 ,8.9, 10.1, 9.2,-0.8, 10.6, 6.5, 11.2, ,9.3, 8.0, 10.7, 9.5, 12.7, 14.4, 11.9
对照组:5.0, 6.7, 1.4, 4.0, 7.1, 0.6, 2.8, 4.3, 3.7, 5.8, 4.6, 6.0, 4.1, 5.1, 4.7
区贫血儿童血色素(%)总体平均水平有无变化?
序号
1 2 3 4 5 6 7 8 9 10 11 12
表 7-2 健康教育三个月前后血色素(%)
教育前
教育后
差值 d
36
45
9
46
64
8
53
66
13
57
57
0
65
70
5
60
55
-5
42
《假设检验》PPT课件
2 已知:z
x 0 n
~ N (0,1)
2008-2009
2 未知: z
x 0
s
n
~ N (0,1)
总体均值的检验( 2 已知)
【例】 一种罐装饮料采用自动生 产线生产,每罐的容量是 255ml,标准差为5ml。为检验 每罐容量是否符合要求,质检 人员在某天生产的饮料中随机 抽取了 40 罐进行检验,测得每 罐 平 均 容 量 为 255.8ml 。 取 显 著性水平=0.05 ,检验该天生 产的饮料容量是否符合标准要 求?
对总体参数的具体数值所作 的陈述
总体参数包括总体均值、
我认为这种新药的疗效 比原有的药物更有效!
比例、方差等
分析之前必需陈述
2008-2009
什么是假设检验?(hypothesis test)
1. 2. 3.
先对总体的参数 ( 或分布形式 ) 提出某种假设, 然后利用样本信息判断假设是否成立的过程 有参数检验和非参数检验 逻辑上运用反证法,统计上依据小概率原理
统计量的值落在拒绝域,拒绝H0,否则不拒绝H0 也可以直接利用P值作出决策
2008-2009
6.2 总体均值的检验
大样本的检验方法 小样本的检验方法
2008-2009
一个总体参数的检验
一个总体 均值
z 检验 t 检验
比例
z 检验
方差
2 检验
(单尾和双尾)
(单尾和双尾)
(单尾和双尾)
(单尾和双尾)
解: 研究者想收集证据予以证明 的假设应该是“生产过程不正常 ”。建立的原假设和备择假设为
H0 : 10cm H1 : 10cm
雷静《卫生统计学》第七章 假设检验基础一PPT课件
4
假设检验的基本步骤
☆建立检验假设和确定检验水准 ☆选定检验方法和计算检验统计量 ☆确定P值和做出统计推断结论
13.08.2020
西安医学院公共卫生系
5
建立假设
假设: H0(零假设) μ1=μ2 H1(备择假设)μ1≠μ2或μ1>μ2
(根据研究目的、设计类型及资料特点将需要推断的问题 表述为关于总体特征的一对假设)
13.08.2020
西安医学院公共卫生系
8
统计推断结论应包括统计结论和专业结论两 部分。统计结论只说明有无统计学意义,而不 能说明专业上的差异大小,专业结论须结合专 业知识才能得出。
***注意:假设检验的结论是具有概率性的,
不论是拒绝H0或不拒绝H0,都有可能发生错 误,即第一类错误或二类系
9
第一类错误与第二类错误
指假设检验中作出的推断结论可能发生两类错误 ☆I类错误:拒绝了真实的H0 。 (拒绝了实际上成立的H0),概率用α表示。 ☆II类错误:接受了实际上不成立的H0 。 (拒绝了真实的H1),概率用β表示,
β值的大小很难确切估计。 一般,样本例数确定时,α愈大,β愈小;
sx1x2 (n11 n)1s1 2 n2(n 221)s2 2n 11n12
• 如果样本含量足够大n1 n2 均大于 50或100时,可将t检验简化为u检验
• 计算检验统计量Ζ :
Ζu
x1 x2
s
2 1
s
2 2
n1 n2
13.08.2020
西安医学院公共卫生系
16
4.两独立样本资料的方差齐性检验
课程或者工作有什么建议和意见,也请写在上边
19
感谢观看
The user can demonstrate on a projector or computer, or print the presentation and make it into a film
卫生统计学:总体均数估计和假设检验课件
选取一个实际研究问题,如某地区儿童身高调查。首先,收集相关数据,并计算样本均数。然后,根据研究目的提出假设,并选择合适的统计方法进行假设检验,如t检验或Z检验。最后,根据检验结果得出结论,并解释其对实际研究的意义。
总结词
详细描述
总结词
介绍如何使用卫生统计学方法对配对设计的样本数据进行处理,并进行假设检验。
点估计是直接从样本数据出发,计算出样本均数,并将其作为总体均数的估计值。点估计是一种确定的数值,用于表示总体均数的估计结果。在统计学中,点估计的准确性取决于样本量和样本的代表性。
区间估计是通过给出一个置信区间来估计总体均数的范围,而非一个具体的数值。
区间估计考虑了抽样误差,并给出总体均数可能存在的范围。通常,区间估计是以一定的置信水平(如95%)来确定的,这意味着我们有95%的把握认为总体均数落在这个范围内。区间估计的准确性取决于样本量和样本的代表性,样本量越大,置信区间越窄,估计的准确性越高。
掌握总体均数估计的基本方法和步骤,包括样本均数的计算、总体均数的点估计和区间估计等。
掌握常用的统计分析方法和软件,如Excel、SPSS等,能够运用这些工具进行实际的数据分析。
理解假设检验的基本原理和方法,包括假设的提出、检验统计量的计算、P值的解读等。
提高学生对数据分析和解读的能力,培养其独立思考和解决问题的能力。
03
CHAPTER
假设检验基础
假设检验是一种统计推断方法,通过提出假设并对其进行验证,判断假设是否成立。
假设检验基于样本数据,通过统计量计算得出结论。
假设检验的结论具有概率性质,存在犯错误的可能性。
提出假设
选择合适的统计量
计算P值
解读结果
01
02
03
总结词
详细描述
总结词
介绍如何使用卫生统计学方法对配对设计的样本数据进行处理,并进行假设检验。
点估计是直接从样本数据出发,计算出样本均数,并将其作为总体均数的估计值。点估计是一种确定的数值,用于表示总体均数的估计结果。在统计学中,点估计的准确性取决于样本量和样本的代表性。
区间估计是通过给出一个置信区间来估计总体均数的范围,而非一个具体的数值。
区间估计考虑了抽样误差,并给出总体均数可能存在的范围。通常,区间估计是以一定的置信水平(如95%)来确定的,这意味着我们有95%的把握认为总体均数落在这个范围内。区间估计的准确性取决于样本量和样本的代表性,样本量越大,置信区间越窄,估计的准确性越高。
掌握总体均数估计的基本方法和步骤,包括样本均数的计算、总体均数的点估计和区间估计等。
掌握常用的统计分析方法和软件,如Excel、SPSS等,能够运用这些工具进行实际的数据分析。
理解假设检验的基本原理和方法,包括假设的提出、检验统计量的计算、P值的解读等。
提高学生对数据分析和解读的能力,培养其独立思考和解决问题的能力。
03
CHAPTER
假设检验基础
假设检验是一种统计推断方法,通过提出假设并对其进行验证,判断假设是否成立。
假设检验基于样本数据,通过统计量计算得出结论。
假设检验的结论具有概率性质,存在犯错误的可能性。
提出假设
选择合适的统计量
计算P值
解读结果
01
02
03
医学统计学课件:假设检验
拒絕H0 2) 有可能得到現在的結果(不是小概率)
沒有理由拒絕H0
例4.4
大規模調查表明健康成年男子血清總膽固醇的 均數為4.6mmol/L,今隨機調查某單位食堂成 年男性炊事員25名,測得血清總膽固醇均數為 5.1mmol/L,標準差為0.88mmol/L,試問該單 位食堂成年男性炊事員血清總膽固醇的均數與 健康成年男子血清總膽固醇的均數有無差別?
0.10
0.05
0.02
6.314 12.706 31.821
2.920 2.353 2.132 2.015
4.303 3.182 2.776 2.571
6.965 4.541 3.747 3.365
1.943 1.895 1.860 1.833 1.812
2.447 2.365 2.306 2.262 2.228
乳猪号 1 2 3 4 5 6 7
合计
表 4.3 两组乳猪脑组织钙泵含量( g/g)
对照组
实验组
差值 d
0.3550
0.2755
0.0795
0.2000
0.2545
-0.0545
0.3130
0.1800
0.1330
0.3630
0.3230
0.0400
0.3544
0.3113
0.0431
0.3450
0.2955
t X 0 5.1 4.6 2.841
s n 0.88 25
計算概率P(與統計量t值對應的概率)
在H0成立的前提下,獲得現有這麼大的 標準t離差以及更大離差 的可能性。
P=P(|t|≥2.841) ?
按 =25-1=24查附表2的t界值表
-t
0
沒有理由拒絕H0
例4.4
大規模調查表明健康成年男子血清總膽固醇的 均數為4.6mmol/L,今隨機調查某單位食堂成 年男性炊事員25名,測得血清總膽固醇均數為 5.1mmol/L,標準差為0.88mmol/L,試問該單 位食堂成年男性炊事員血清總膽固醇的均數與 健康成年男子血清總膽固醇的均數有無差別?
0.10
0.05
0.02
6.314 12.706 31.821
2.920 2.353 2.132 2.015
4.303 3.182 2.776 2.571
6.965 4.541 3.747 3.365
1.943 1.895 1.860 1.833 1.812
2.447 2.365 2.306 2.262 2.228
乳猪号 1 2 3 4 5 6 7
合计
表 4.3 两组乳猪脑组织钙泵含量( g/g)
对照组
实验组
差值 d
0.3550
0.2755
0.0795
0.2000
0.2545
-0.0545
0.3130
0.1800
0.1330
0.3630
0.3230
0.0400
0.3544
0.3113
0.0431
0.3450
0.2955
t X 0 5.1 4.6 2.841
s n 0.88 25
計算概率P(與統計量t值對應的概率)
在H0成立的前提下,獲得現有這麼大的 標準t離差以及更大離差 的可能性。
P=P(|t|≥2.841) ?
按 =25-1=24查附表2的t界值表
-t
0
假设检验与t检验-卫生统计学_PPT幻灯片
S/ n 5.08/ 36
n136135
第二节 t检验
• 单样本设计的t检验 • 配对设计的t检验 • 完全随机设计(成组设计)的t检验
第二节 t检验
每种不同设计类型的t检验均主要从以下四个方面介绍:
1. 设计类型 2. 可解决的问题 3. 假设检验步骤 4. 适用条件
一.单样本设计t检验(one-sample t-test)
2.080 2.074 2.069 2.064 2.060
2.518 2.508 2.500 2.492 2.485
2.831 2.819 2.807 2.797 2.787
3.135 3.119 3.104 3.091 3.078
3.527 3.505 3.485 3.467 3.450
3.819 3.792 3.768 3.745 3.725
– P> α,不能拒绝H0 (在H0成立的前提下,一次随机抽样没有发生小概率事件,没有
充足的理由拒绝H0 )
第一节 假设检验的原理与步骤
二、假设检验的基本步骤
1. 建立假设(H0和H1) ,确定检验水准α 2. 选择检验方法,计算检验统计量 3. 确定 P 值,作出推断结论
第一节 假设检验的原理与步骤
6
0.718
7
0.711
8
0.706
9
0.703
10
0.700
21
0.686
22
0.686
23
0.685
24
0.685
25
0.684
0.20 0.40
1.376 1.061 0.978 0.941 0.920
0.906 0.896 0.889 0.883 0.879
n136135
第二节 t检验
• 单样本设计的t检验 • 配对设计的t检验 • 完全随机设计(成组设计)的t检验
第二节 t检验
每种不同设计类型的t检验均主要从以下四个方面介绍:
1. 设计类型 2. 可解决的问题 3. 假设检验步骤 4. 适用条件
一.单样本设计t检验(one-sample t-test)
2.080 2.074 2.069 2.064 2.060
2.518 2.508 2.500 2.492 2.485
2.831 2.819 2.807 2.797 2.787
3.135 3.119 3.104 3.091 3.078
3.527 3.505 3.485 3.467 3.450
3.819 3.792 3.768 3.745 3.725
– P> α,不能拒绝H0 (在H0成立的前提下,一次随机抽样没有发生小概率事件,没有
充足的理由拒绝H0 )
第一节 假设检验的原理与步骤
二、假设检验的基本步骤
1. 建立假设(H0和H1) ,确定检验水准α 2. 选择检验方法,计算检验统计量 3. 确定 P 值,作出推断结论
第一节 假设检验的原理与步骤
6
0.718
7
0.711
8
0.706
9
0.703
10
0.700
21
0.686
22
0.686
23
0.685
24
0.685
25
0.684
0.20 0.40
1.376 1.061 0.978 0.941 0.920
0.906 0.896 0.889 0.883 0.879
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
21
➢ 若将该样本与总体Α比较,则得
t 2.1835 P0.0569
按 0.05水准,不拒绝 H 0,差别无统计学意 义,尚不能认为总体A与总体B的红细胞均数 不同。
22
Ⅰ型错误(type Ⅰ error) :拒绝了实 际上成立的 H 0 ,犯“弃真”的错误。
其概率大小用 表示, 可取单侧亦可
取双侧。
7
123.5与125不同的原因何在?
25名1岁婴儿 血红蛋白浓度
X
8
来自于总体均数为125g/L 的总体,差别由抽样误差
0 125 导致。
0 125
来自另一总体,这个 总体的血红蛋白均数 未知,差别不仅是抽 样误差,主要是本质 的不同。
先假设 0 125,原当前的 X 与 0 的差异
是抽样误差——提出原假设 接下来验证假设,如何验证? 根据 X 0 的大小,如果 X 0 较小可以认为 当前的差异是抽样误差,反之如果 X 0 较大 就怀疑当前的差异不仅仅是抽样误差(反证法)
➢ 在该假设成立时计算相应的检验统计量
如t、F等 ➢ 根据相应的分布确定P值,作出统计推断
13
2.假设检验的一般步骤
2.1建立检验假设,确定检验水准
H 0 :无效假设或零假设(null hypothesis) H 1 :备择假设(alternative hypothesis)
α 检验水准(significance level) 通常取 α=0.05 根据专业知识和研究目的确定单双侧检验(见 第三节)
14
【例7-1】
建立检验假设,确定检验水准
H 0 :该地1岁婴儿的HB浓度总体均数与一般正常
小儿的HB浓度总体均数相等,即 0
H 1 :该地1岁婴儿的HB浓度总体均数 与一般正 常小儿的HB浓度总体均数不等,即 0 α=0.05
15
2.2 选定检验方法计算检验统计量
根据研究目的、资料类型、分布类型、设计 类型、样本含量及适用条件等,选择合适的统 计方法,计算相应的检验统计量。
Chapter 7
假设检验
Hypothesis test
1
整体概述
概述一
点击此处输入
相关文本内容
概述二
点击此处输入
相关文本内容
概述三
点击此处输入
相关文本内容
2
主要内容
假设检验的基本原理和步骤 Ⅰ型错误与Ⅱ型错误 单侧检验与双侧检验 假设检验应注意的事项 假设检验与区间估计的联系 (自学单侧检验与双侧检验
29
例7-1中,该医生无法事先判断该地的环境因 素如何影响1岁婴儿的血红蛋白浓度,建立的 检验假设:
H0 :0 H1 :0
4
案例讨论
【例7-1】为了解某地1岁婴儿的血红蛋白浓度,某 医生从该地随机抽取了1岁婴儿25名,测得其血红 蛋白浓度的平均数为123.5g/L,标准差为11.6 g/L, 而一般正常小儿的平均血红蛋白浓度为125g/L, 故认为该地1岁婴儿的平均血红蛋白浓度低于一般 正常小儿的平均血红蛋白浓度。
5
23
Ⅱ型错误(type Ⅱ error) :不拒绝实际
上不成立的H0,犯“存伪”的错误。其概率
大小用β表示。 只取单侧,其大小一般未知 ,只有在已知两总体差值, 及 n 时,才
能估算出来。
24
推断结论与两类错误
实际情况
H 0 成立
H 0 不成立
检验结果
拒绝H0
不拒绝H0
第一类错误(α) 结论正确(1-β)
9
现在问题的关键是 X 与 0 相差多大可以
认为差异是抽样误差? 根据现有的条件,选择一个标准——检验
统计量t,根据t值大小进行判断 确定获得大于等于当前统计量t值的累积
概率P值,与事先规定的小概率比较进行推断
10
✓ 若P值小于或等于预先规定的小概率水准
(如0.05),则拒绝原假设。(小概率原理)
结论正确(1-α) 第二类错误(β)
25
图7-2 Ⅰ型错误与Ⅱ型错误示意图
检验效能(power of a test) : 若两总体确有差别,按照α水准能
够发现这种差别的能力。 它的大小用
(1-β)表示。 (计算详见第十七章)
27
检验效能的影响因素
✓ 容许误差
✓ 总体标准差
✓ Ⅰ型错误
✓ 样本含量 n
问题
(1)该结论是否正确? (2)应该如何解决诸如此类的问题?
采用假设检验的方法予以解决
6
1.假设检验(hypothesis testing)的 基本思想
应用反证法和小概率原理,先对总体的参 数或分布作出某种假设,再用适当的方法根 据样本对总体提供的信息,推断此假设应当 拒绝或不拒绝。这个过程即为假设检验。
17
图7-1 由t 分布确定 P值的示意图
18
本例中 t0.052,24 2.064 ,t t0.05 2,24 ,P0.05,故按 0.05的水准,不拒绝 H 0 ,差异无统计学意义 (统计结论),尚不能认为该地1岁婴儿的血红 蛋白浓度平均水平与一般正常小儿的血红蛋白 浓度平均水平有差别(专业结论)。
✓ 若P值大于预先规定的小概率水准,则尚无充 分的理由拒绝原假设。
小概率事件在一次试 验中发生的可能性很 小,认为不可能发生
11
均数的抽样分布
拒绝域 /2
1 - 接受域
置信水平
拒绝域 /2
临界值
H0值
样本统计量 临界值
12
假设检验的基本思想可归纳为
假设某两个或多个总体参数相等、总体分布 相同或总体服从某种分布(称为原假设)
tx0123.51250.6466
Sx 11.6 25
n124
16
2.3 确定 P值,作出推断结论
若 P ,则按
水准,拒绝 H
0,接受 H
,差异有统计
1
学意义(statistical significance),可认为……不同或不等
若 P,则按 水准,不拒绝 H 0,差异无统计学意义(
no statistical significance),尚不能认为……不同或不等
19
§2 Ⅰ型错误与Ⅱ型错误
20
【例7-2】 ➢ 总体Α是100例平原地区正常成年男子的红细胞数,其总体
参数 5.00 11 02/, L 0.4 31102 /L ;
➢ 总体B是100例高原地区正常成年男子的红细胞数,其总体
参数 5.50 11 02/L, 0.4 51102 /L。
➢ 现从总体B中随机抽取的样本,其统计量为: x5.291012/L S0.421012/L
➢ 若将该样本与总体Α比较,则得
t 2.1835 P0.0569
按 0.05水准,不拒绝 H 0,差别无统计学意 义,尚不能认为总体A与总体B的红细胞均数 不同。
22
Ⅰ型错误(type Ⅰ error) :拒绝了实 际上成立的 H 0 ,犯“弃真”的错误。
其概率大小用 表示, 可取单侧亦可
取双侧。
7
123.5与125不同的原因何在?
25名1岁婴儿 血红蛋白浓度
X
8
来自于总体均数为125g/L 的总体,差别由抽样误差
0 125 导致。
0 125
来自另一总体,这个 总体的血红蛋白均数 未知,差别不仅是抽 样误差,主要是本质 的不同。
先假设 0 125,原当前的 X 与 0 的差异
是抽样误差——提出原假设 接下来验证假设,如何验证? 根据 X 0 的大小,如果 X 0 较小可以认为 当前的差异是抽样误差,反之如果 X 0 较大 就怀疑当前的差异不仅仅是抽样误差(反证法)
➢ 在该假设成立时计算相应的检验统计量
如t、F等 ➢ 根据相应的分布确定P值,作出统计推断
13
2.假设检验的一般步骤
2.1建立检验假设,确定检验水准
H 0 :无效假设或零假设(null hypothesis) H 1 :备择假设(alternative hypothesis)
α 检验水准(significance level) 通常取 α=0.05 根据专业知识和研究目的确定单双侧检验(见 第三节)
14
【例7-1】
建立检验假设,确定检验水准
H 0 :该地1岁婴儿的HB浓度总体均数与一般正常
小儿的HB浓度总体均数相等,即 0
H 1 :该地1岁婴儿的HB浓度总体均数 与一般正 常小儿的HB浓度总体均数不等,即 0 α=0.05
15
2.2 选定检验方法计算检验统计量
根据研究目的、资料类型、分布类型、设计 类型、样本含量及适用条件等,选择合适的统 计方法,计算相应的检验统计量。
Chapter 7
假设检验
Hypothesis test
1
整体概述
概述一
点击此处输入
相关文本内容
概述二
点击此处输入
相关文本内容
概述三
点击此处输入
相关文本内容
2
主要内容
假设检验的基本原理和步骤 Ⅰ型错误与Ⅱ型错误 单侧检验与双侧检验 假设检验应注意的事项 假设检验与区间估计的联系 (自学单侧检验与双侧检验
29
例7-1中,该医生无法事先判断该地的环境因 素如何影响1岁婴儿的血红蛋白浓度,建立的 检验假设:
H0 :0 H1 :0
4
案例讨论
【例7-1】为了解某地1岁婴儿的血红蛋白浓度,某 医生从该地随机抽取了1岁婴儿25名,测得其血红 蛋白浓度的平均数为123.5g/L,标准差为11.6 g/L, 而一般正常小儿的平均血红蛋白浓度为125g/L, 故认为该地1岁婴儿的平均血红蛋白浓度低于一般 正常小儿的平均血红蛋白浓度。
5
23
Ⅱ型错误(type Ⅱ error) :不拒绝实际
上不成立的H0,犯“存伪”的错误。其概率
大小用β表示。 只取单侧,其大小一般未知 ,只有在已知两总体差值, 及 n 时,才
能估算出来。
24
推断结论与两类错误
实际情况
H 0 成立
H 0 不成立
检验结果
拒绝H0
不拒绝H0
第一类错误(α) 结论正确(1-β)
9
现在问题的关键是 X 与 0 相差多大可以
认为差异是抽样误差? 根据现有的条件,选择一个标准——检验
统计量t,根据t值大小进行判断 确定获得大于等于当前统计量t值的累积
概率P值,与事先规定的小概率比较进行推断
10
✓ 若P值小于或等于预先规定的小概率水准
(如0.05),则拒绝原假设。(小概率原理)
结论正确(1-α) 第二类错误(β)
25
图7-2 Ⅰ型错误与Ⅱ型错误示意图
检验效能(power of a test) : 若两总体确有差别,按照α水准能
够发现这种差别的能力。 它的大小用
(1-β)表示。 (计算详见第十七章)
27
检验效能的影响因素
✓ 容许误差
✓ 总体标准差
✓ Ⅰ型错误
✓ 样本含量 n
问题
(1)该结论是否正确? (2)应该如何解决诸如此类的问题?
采用假设检验的方法予以解决
6
1.假设检验(hypothesis testing)的 基本思想
应用反证法和小概率原理,先对总体的参 数或分布作出某种假设,再用适当的方法根 据样本对总体提供的信息,推断此假设应当 拒绝或不拒绝。这个过程即为假设检验。
17
图7-1 由t 分布确定 P值的示意图
18
本例中 t0.052,24 2.064 ,t t0.05 2,24 ,P0.05,故按 0.05的水准,不拒绝 H 0 ,差异无统计学意义 (统计结论),尚不能认为该地1岁婴儿的血红 蛋白浓度平均水平与一般正常小儿的血红蛋白 浓度平均水平有差别(专业结论)。
✓ 若P值大于预先规定的小概率水准,则尚无充 分的理由拒绝原假设。
小概率事件在一次试 验中发生的可能性很 小,认为不可能发生
11
均数的抽样分布
拒绝域 /2
1 - 接受域
置信水平
拒绝域 /2
临界值
H0值
样本统计量 临界值
12
假设检验的基本思想可归纳为
假设某两个或多个总体参数相等、总体分布 相同或总体服从某种分布(称为原假设)
tx0123.51250.6466
Sx 11.6 25
n124
16
2.3 确定 P值,作出推断结论
若 P ,则按
水准,拒绝 H
0,接受 H
,差异有统计
1
学意义(statistical significance),可认为……不同或不等
若 P,则按 水准,不拒绝 H 0,差异无统计学意义(
no statistical significance),尚不能认为……不同或不等
19
§2 Ⅰ型错误与Ⅱ型错误
20
【例7-2】 ➢ 总体Α是100例平原地区正常成年男子的红细胞数,其总体
参数 5.00 11 02/, L 0.4 31102 /L ;
➢ 总体B是100例高原地区正常成年男子的红细胞数,其总体
参数 5.50 11 02/L, 0.4 51102 /L。
➢ 现从总体B中随机抽取的样本,其统计量为: x5.291012/L S0.421012/L