07《卫生统计学》第七章_假设检验基础(6版) (1)
卫生统计学-假设检验
H 0 : 0
0
显然包括
H1 : 0
0.05
0 0
故称双侧检验(two-sided test)
若检验假设如下:
H 0: 0 H1: 0
或
H 0: 0 H1: 0
称单侧检验(one-sided test)
123.5与125不同的原因何在?
来自于总体均数为125g/L 的总体,差别由抽样误 差导致。
25名1岁婴儿 血红蛋白浓度 X
0 125
0 125
来自另一总体,这个 总体的血红蛋白均数 未知,差别不仅是抽 样误差,主要是本质 的不同。
先假设 0 125,原当前的 X 与0 的差异ห้องสมุดไป่ตู้是抽样误差——提出原假设 接下来验证假设,如何验证? 根据 X 0 的大小,如果 X 0 较小可以认为 当前的差异是抽样误差,反之如果 X 0 较大 就怀疑当前的差异不仅仅是抽样误差(反证法)
问题
(1)该结论是否正确? (2)应该如何解决诸如此类的问题?
采用假设检验的方法予以解决
1.假设检验(hypothesis testing)的
基本思想
应用反证法和小概率原理,先对总体的参
数或分布作出某种假设,再用适当的方法根
据样本对总体提供的信息,推断此假设应当
拒绝或不拒绝。这个过程即为假设检验。
Chapter 7
假设检验
Hypothesis test
主要内容
假设检验的基本原理和步骤 Ⅰ型错误与Ⅱ型错误
单侧检验与双侧检验
假设检验应注意的事项 假设检验与区间估计的联系 (自学)
§1 假设检验的基本思想 和步骤
卫生统计学-第七章 假设检验基础
一:单样本t检验(one sample t-test) 即样本均数代表的未知总体均数与已知总体 均数差异的比较
样本均数与总体均数比较,其分析目的是推断
样本所代表的未知总体均数与已知总体均数 0有无差别。
例1据大量调查知,健康成年男子脉搏的均数 为72次/分,某医生在山区随机调查了25名健 康成年男子,其脉搏均数为74.2次/分,标准 差为6.5次/分,能否认为该山区成年男子的脉 搏高于一般人群?
1- :检验效能(power):当两总体确有差别,
按检验水准 所能发现这种差别的能力。
减少I型错误的主要方法:假设检验时设定 值。
减少II型错误的主要方法:提高检验效能。
提高检验效能的最有效方法:增加样本量。 如何选择合适的样本量:实验设计。
与 间的关系
减少(增加)I型错误,将会 增加(减少)II型错误
理解二: 单次试验(抽样)观测到的事件不应该 是小概率事件。
假设检验的思路
根据背景建立假设 根据样本得到某些特征 推断该样本特征在假设下的概率 根据‘否定小概率事件’思想做出推断
假设检验的思路分析 数学上的反证法原理进行分析
先假设要比较的事物是相同的 再在这种假设成立的情况下,进行逻辑推理 如果推理出发生的事是一个小概率事件,一般
第七章 假设检验基础
吴立娟 流行病与卫生统计学系
假设检验的概念和原理
同一总体
样本1 样本2
差异 抽样误差引起 P>0.05
无统计学意义
总体甲
样本1
(本质不同)
总体乙
样本2
差异 本质不同引起 P<0.05
有统计学意义 不能用抽样误差来解释
假设检验的原理/思想
《卫生统计学》课后思考题答案
《卫生统计学》课后思考题答案第一章绪论答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
(4)整群抽样:优点是易于组织和操作大规模抽样调查;缺点是抽样误差大。
3、调查设计包括那些基本内容?答:(1)明确调查目的和指标(2)确定调查对象和观察单位(3)选择调查方法和技术(4)估计样本大小(5)编制调查表答:(1)分析项目直接整理计算的必须的内容;(2)备查项目保证分析项目填写得完整和准确的内容;(3)其他项目大型调查表的前言和表底附注。
第三章实验设计1、简述实验设计的特点。
答:(1)研究者能人为设置处理因素(2)受试对象可以接受何种处理因素或水平是由随机分配而定的。
2、简述一般选择受试对象的原则。
答:(1)受试对象能从临床试验中受益(2)受试对象具有代表性(3)受试对象具有依从性(4)受试对象可以是志愿者。
3、什么是混杂因素?设计时怎样控制混杂因素?答:混杂因素是指影响实验效应并与处理因素同时存在的非处理因素。
可以通过采取排除、平衡、或标准化的办法来控制混杂因素的影响。
4、什么是随机化?怎样实现随机抽样和随机分组?答:随机化就是使样本具有较好的代表性,使各组受试对象在重要的非处理因素方面具有较好的均衡性,提高实验结果的可比性。
一般用随机数字表、随机排列表或统计软件包来实现随机抽样和随机分组。
答:(1)有算术均数、几何均数和中位数、众数、调和数等。
卫生统计学:第7-8章 假设检验与t检验
反证法
当一件事情的发生只有A、B两种可能的时候,为了肯 定其中的一种情况A,但又不能直接证实A,这时否定 了另一种情况B,则间接肯定了A。 证明A还是证明B? 抗氧化剂 • 在H0成立的条件下,均数之间的差异是由抽样误差
引起的,有规律可循; • 在H1成立的条件下,均数间的不同包含种种未知情
形,无规律可循。 • 故从H0成立的角度出发,寻求其成立的概率。
分布。
数理统计的中心极限定理表明:从正态总体N ( , ) 中抽取例数均为n 的样 本,样本均 数也服从正态分布N( , X )。
Gosset 将此时的 u 转换:
X
定义为t 转换: t sX
u X X
并将t 值的分布命名为t 分布。
t 分布的图形及特征
• 单峰分布,以0为中心,左右对称 • t分布是一簇曲线,其形状与自由度υ(υ=n-1)
基本原则——小概率事件在一次试验中是不可能发生的。
建立检验假设,确定检验水准
假 设 检 验 步 骤
P≤α
计算检验统计量
确定P值
作推断结论
P>α
拒绝H0,接受H1
不拒绝H0
为了解某地1岁婴儿的血红蛋白浓度,某医 生从该地随机抽取了1岁婴儿25名,测得其血红 蛋白浓度的平均数为123.5g/L,标准差为11.6 g/L, 而一般正常小儿的平均血红蛋白浓度为125 g/L, 故认为该地1岁婴儿的平均血红蛋白浓度低于一 般正常小儿的平均血红蛋白浓度。
│t│值越大,则 P 值越小;反之,│t│值 越小,P 值越大。根据上述的意义,在同 一自由度下,│t│≥ tα ,则P≤ α ; 反之, │t│<tα,则P>α。
t 检验的应用条件:
单样本t 检验中,σ未知且样本含量较小 (n<50)时,要求样本来自正态分布总体;
名解问答重点-卫生统计学6-(1)
第一章绪论一,名词解释1.参数:能统计计算出来描述总体的特征量,即总体的统计指标。
2.总体:根据研究目确实定的同质研究对象的全体集合。
3.同质:除了实验因素外,影响被研究指标的非试验因素相同被称为同质。
4.变异:在同质的基础上被观察个体或单位之间的差异被称为变异。
5.样本:从总体中随机抽取的部分研究对象。
6.统计量:由观察资料计算出来的量,即样本的统计指标。
7.概率:表示一个事件发生的可能性大小的数。
〔概率的统计定义:在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p 称为事件A在该条件下发生的概率。
〕8.抽样误差:由抽样造成的样本均数与总体均数或各样本均数之间的差异。
二,问答题。
1.统计学的基本步骤有哪些?答:统计学是一门处理数据中变异性的科学与艺术,它包括收集数据、分析数据、解释数据,以及表达数据。
2.总体与样本的区别与关系?答:区别:样本是总体的一部分,联系:如果样本的均衡性较好,就能够代表总体的特征。
3.抽样误差产生的原因有哪些?可以防止抽样误差吗?答:一,个体差异引起;二,抽样方法引起。
抽样误差不能防止,但可以随着样本含量的增大而减小。
4.何为概率及小概率事件?答:概率是指在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。
小概率事件是指习惯上将P《=0.05或P《=0.01称为小概率事件,表示某事件发生的可能性很小。
第二章定量资料的统计描述一,名词解释1.频数:对一个随机事件进行反复观察,其中某变量值出现的次数被称为频数。
2.方差:用来度量随机变量和数学期望〔即均值〕之间的偏离程度。
3.标准差:也称均方差,是各数据偏离平均数的距离的平均数。
4.中位数:是指将原始观察值从小到大或从大到小排序后,位次局中的那个数。
医学统计学第七、八章 假设检验的基本概念和t检验
S x 1 − x 2 为两样本均数差值的标准误
Sx −x
1
2
⎛1 1⎞ ⎟ = S ⎜ + ⎜n n ⎟ 2 ⎠ ⎝ 1
2 c
在两总体方差相等的条件下,可将两方差合并, 求合并方差(pooled variance) S c2
2 ⎡ ( Σ x1 ) ⎤ 2 ⎢ Σ x1 − ⎥ + n1 ⎦ ⎣ = n1 − 1 + 2 ⎡ ( Σx2 ) ⎤ 2 ⎢Σ x2 − ⎥ n2 ⎦ ⎣ n2 − 1
t 检验的应用条件:
① 单样本t检验中,σ 未知且n 较小,样本取自 正态总体; ② 两小样本均数比较时,两样本均来自正态分 布总体,两样本的总体方差相等;若两总体 方差不齐可用t’检验; ③ 两大样本均数比较时,可用Z检验。
1、样本均数与总体均数比较的 t 检验
• 使用范围:用于样本均数与已知总体均数(一 般为理论值、标准值或经过大量观察所得的稳 定值等)的比较。 • 分析目的:推断样本所代表的未知总体均数 μ 与已知总体均数 μ0有无差别。 • 若 n 较大,则 tα .ν ≈ tα .∞ , 可按算得的 t 值用 v = ∞ 查 t 界值表( t 即为 Z )得P值。
回到例子:
2.计算统计量
已知μ0= 3min,n=50, X=4min
4−3 t= = 4 .7140 1 .5 / 50
υ = 50 − 1 = 49
3、确定 P 值,作出统计推断 根据算出的检验统计量如 t、z 值,查 相应的界值表,即可得到概率 P。 P值是在H0成立前提下,抽得比现有样 本统计量更极端的统计量值的概率。 P值越小只能说明:作出拒绝H0 ,接受 H1的统计学证据越充分。
X −μ X −μ 用公式:t = 或z = σX SX
卫生统计学7PPT课件
4
从统计学角度考虑东北某县与北 方儿童前囟门闭合月龄有差别有两种 可能:1)差别是由于抽样误差引起 的,统计学上称为差异无显著性。2) 差异是本质上的差异,即二者来自不 同总体。统计学上称为差异有显著性。
5
已0 知 1 .1 4 X : 1 .3 4 s 5 .0n 8 36
13
原假设H0: 0 14.1 备择假设 H1 : 0(单侧) 检验水准: 0.0 5
14
是随机样本的函数,它不 包含任何未知参数。
2. 计算统计量:不同的检验方法和类型选用相应的统 计量。
t X0 14.314.10.236
s n 5.08 36
n136135
15
3. 确定P值
指从H0规定的总体中随机抽得等于及 大于(或等于及小于)现有样本获得 的检验统计量值的概率。
出的对总体特征的假设。应当注意检验假设是
针对总体而言,而不是针对样本。H0是从反 证法的思想提出的,H1和H0是相联系的但又 是相对立的假设。
7
H0一般设为某两个或多个总体参数 相等,即认为他们之间的差别是由 于抽样误差引起的。H1的假设和H0 的假设相互对立,即认为他们之间 存在着本质的差异。H1的内容反映 出检验的单双侧。
19
检验假设为:
H 0 : d 0H 1 :d 0 ( 单 d 0 或 侧 d 0 )
当H0成立时,检验统计量:
t d0 ~t, n1
Sd n
20
表6第-1二用节药前t后检患儿验血清中免疫球蛋白IgG(mg/dl)含量
2
点击输入简要文字内容,文字内容需概括精炼,不用多余 的文字修饰,言简意赅的说明分项内容……
第6版卫生统计学考试复习题参考答案
中南大学现代远程教育课程考试复习题及参考答案《卫生统计学》一、名词解释1.计量资料2.计数资料3.等级资料4.总体5.样本6.抽样误差7.频数表8.算术均数9.中位数10.极差11.方差12.标准差13.变异系数14.正态分布15.标准正态分布16.统计推断17.抽样误差18.标准误19.可信区间20.参数估计21.假设检验中P的含义22.I型和II型错误23.检验效能24.检验水准25.方差分析26.随机区组设计27.相对数28.标准化法29.二项分布30.Yates校正31.非参数统计32.直线回归33.直线相关34.相关系数35.回归系数36.人口总数37.老年人口系数38.围产儿死亡率39.新生儿死亡率40.婴儿死亡率41.孕产妇死亡率42.死因顺位43.人口金字塔二、单项选择题1.观察单位为研究中的( )。
A.样本B.全部对象C.影响因素D.个体2.总体是由()。
A.个体组成B.研究对象组成C.同质个体组成D.研究指标组成3.抽样的目的是()。
A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量4.参数是指()。
A.参与个体数B.总体的统计指标C .样本的统计指标D . 样本的总和 5.关于随机抽样,下列那一项说法是正确的( )。
A .抽样时应使得总体中的每一个个体都有同等的机会被抽取 B .研究者在抽样时应精心挑选个体,以使样本更能代表总体 C .随机抽样即随意抽取个体D .为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( )。
A .均数不变,标准差改变B .均数改变,标准差不变C .两者均不变D .两者均改变 7.比较身高和体重两组数据变异度大小宜采用( )。
A .变异系数 B .方差 C .极差 D .标准差8.以下指标中( )可用来描述计量资料的离散程度。
A .算术均数 B .几何均数 C .中位数 D .标准差9.血清学滴度资料最常用来表示其平均水平的指标是( )。
统计学 第7章 假设检验ppt课件
(1)贝努利定理(Bernoulli Theorem)
ln i mPnnA
PA
1
(6.1)
贝努利定理表明事件发生的频率依概率收敛于事件发生的概率。从而 以严格的数学形式表述了频率的稳定性特征,即n当很大时,事件发生 的频率与概率之间出现较大的偏差的可能性很小。由此,在n充分大的 场合,可以用事件发生的频率来替代事件的概率。
抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
完整版PPT课件
《统计学教程》
第6章 抽样分布与参数估计
6.1 抽样分布
3.抽样分布
抽样分布(Sampling Distribution)是指从同分布总体中,独立抽 取的相同样本容量的样本统计量的概率分布。所以,抽样分布是样本分 布的概率分布,抽样分布是抽样理论的研究对象。
抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
★ 讨论题 为什么说抽样分布是抽样理论研究的对象,解释三种分布之 间的联系。
完整版PPT课件
《统计学教程》
独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机
变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,
则
ln i m Fn
x
n lim k1Xk
nx
x
n n
1
t2
e 2dt
(6.3)
2பைடு நூலகம்
雷静《卫生统计学》第七章 假设检验基础一PPT课件
4
假设检验的基本步骤
☆建立检验假设和确定检验水准 ☆选定检验方法和计算检验统计量 ☆确定P值和做出统计推断结论
13.08.2020
西安医学院公共卫生系
5
建立假设
假设: H0(零假设) μ1=μ2 H1(备择假设)μ1≠μ2或μ1>μ2
(根据研究目的、设计类型及资料特点将需要推断的问题 表述为关于总体特征的一对假设)
13.08.2020
西安医学院公共卫生系
8
统计推断结论应包括统计结论和专业结论两 部分。统计结论只说明有无统计学意义,而不 能说明专业上的差异大小,专业结论须结合专 业知识才能得出。
***注意:假设检验的结论是具有概率性的,
不论是拒绝H0或不拒绝H0,都有可能发生错 误,即第一类错误或二类系
9
第一类错误与第二类错误
指假设检验中作出的推断结论可能发生两类错误 ☆I类错误:拒绝了真实的H0 。 (拒绝了实际上成立的H0),概率用α表示。 ☆II类错误:接受了实际上不成立的H0 。 (拒绝了真实的H1),概率用β表示,
β值的大小很难确切估计。 一般,样本例数确定时,α愈大,β愈小;
sx1x2 (n11 n)1s1 2 n2(n 221)s2 2n 11n12
• 如果样本含量足够大n1 n2 均大于 50或100时,可将t检验简化为u检验
• 计算检验统计量Ζ :
Ζu
x1 x2
s
2 1
s
2 2
n1 n2
13.08.2020
西安医学院公共卫生系
16
4.两独立样本资料的方差齐性检验
课程或者工作有什么建议和意见,也请写在上边
19
感谢观看
The user can demonstrate on a projector or computer, or print the presentation and make it into a film
7假设检验基础
当H0成立时,检验统计量为:
例6-9 某市计划2005年接种吸附百白破联合疫苗后无菌化 脓率控制在25/10万人次以内。免疫接种的统计报告数据显示 2005年接种吸附百白破联合疫苗125538人次,其中发生无菌化 脓例数为38例,试问2005年该市无菌化脓发生率能否达到要求?
按ν =∞查t临界值表:(单侧) Z0.05, ∞ =1.645 Z<Z0.05,得P>0.05,按α =0.05水准不拒绝H0,故可认为 该市无菌化脓发生率能达到要求。
欲考察某药物A预防孕妇早产的效果,某医院妇 科进行一项临床试验,入选30例孕妇,随机分配到 处理组(服用A药)和对照组(服用安慰剂),每组 15例,处理组出生婴儿体重(Kg)测量值: 6.9,7.6„,8.6;对照组出生婴儿体重(Kg)测量 值:6.4,6.7,„,6.8。处理组均数位7.1 (Kg), 对照组为6.3 (Kg)。
其中
为差值的均数,
为差值的样本标准
差,n是对子数。
例6-2 为了研究孪生兄弟的出生体重是否与其出生顺序有关, 共收集了15对孪生兄弟的出生顺序和出生体重,见表6-2.试 问孪生兄弟中先出生者的出生体重与后出生者的出生体重是 否相同?
表6-2
编号 1 2
15对孪生兄弟的出生体重(Kg)
先出生者体重 2.79 3.06 后出生者体重 2.69 2.89 差值 0.10 0.17
3
4 … 15
2.34
3.41 … 2.65
2.24
3.37 … 2.60
0.10
0.04 … 0.05
例6-3
用两种方法测定12份血清样品中Mg2+(mmol/L)的
表6-3 两种方法测定血清Mg2+(mmol/L)的结果 甲基百里酚蓝法 0.94 1.02 1.14 葡萄糖激酶两点法 0.92 1.01 1.11 差值 0.02 0.01 0.03
卫生统计 假设检验基础
试验设计
配对设计
将受试对象按照某些重要特征(主要是非处理因素) 将受试对象按照某些重要特征(主要是非处理因素) 配成对子, 配成对子,每对中的两个受试对象随机分配到两处理 组.
特点
控制较多的个体变异,可比性好, 控制较多的个体变异,可比性好, 常用于个体变 异较大的资料. 异较大的资料.
类型
1. 2. 3. 将受试对象配成特征相近的对子,随机接受两种处理; 将受试对象配成特征相近的对子,随机接受两种处理; 同一受试对象或同一份样品分成两份, 同一受试对象或同一份样品分成两份,随机分别接受不同 处理; 处理; 同一受试对象处理前后的结果比较. 同一受试对象处理前后的结果比较.
假设检验的基本步骤: 假设检验的基本步骤:
建立检验假设,确定检验水准; 1. 建立检验假设,确定检验水准;
零假设,无效假设.是与研究假设有关的, H0:零假设,无效假设.是与研究假设有关的,被推断特 征某种确定的关系; 征某种确定的关系; 备择假设,对立假设. H1:备择假设,对立假设.是被推断总体特征的另一种关 系或状况, H0既有联系又互相对立 既有联系又互相对立. 系或状况,与H0既有联系又互相对立. 检验水准,将小概率事件具体化, 检验水准,将小概率事件具体化,即规定概率不超过 就是小概率. 就是小概率.
查附表2, 界值为 界值为2.045,统计量小于界值,则P>0.05,接受 查附表 ,t界值为 ,统计量小于界值, , H0,差异无统计学意义.尚不能认为该山区成年男子脉搏数与 ,差异无统计学意义. 一般男子相同. 一般男子相同.
配对样本t检验 配对样本 检验
Paired design t-test
12名儿童分别用两种结核菌素的皮肤浸润反应结果 名儿童分别用两种结核菌素的皮肤浸润反应结果(mm) 名儿童分别用两种结核菌素的皮肤浸润反应结果
医学统计学:第七章 分类资料的假设检验
1.建立假设,确定检验水准
H0 : 0 0.2 H1 : 0
单侧 0.05
2.计算累统计量 u 值
0 0.20, n 304, p 0.3158
u p 0 0.3158 0.2 5.05
0 (1 0 )
H0(λ =3)成立时, 每毫升水中大肠杆菌数的概率分布 26
1.建立假设,确定检验水准 H0: 0 3 H1: 0 单侧 α=0.05 2. 计算累计概率 P 值,做出推断结论 需求 1ml 水样中至少有 5 个大肠杆菌的概率
P( X 5) 1 P(0) P(1) P(2) P(3) P(4) 0.1847
P( X 2) 1 e0.15 0.150 e0.15 0.151 1 P(0) P(1) 0.0102
0!
1!
P<0.05,按 α=0.05 检验水准拒绝 H0,接受 H1,可以认为该批疫苗的严重反应率高于一般。
25
例8 卫生标准规定, 生活饮用水大肠杆菌数不 得超过3个/ml。现对某饮用水进行抽检,抽取 1ml水样培养得到5个大肠杆菌。问该水样中 的大肠杆菌是否超标?
接受 H1,故可认为双亲中只有一方患高血压与双亲均患
高血压的子代中高血压患病率不同。
18
例6 某研究者在某地区随机抽取10岁儿 童100人,20岁青年120人,检查发现10岁 儿童中有70人患龋齿,20岁青年中有60人 患龋齿,问该地区10岁儿童与20岁青年患 龋齿率是否相等?
p1=70/100=0.70 p2=60/120=0.50 pc =(70+60)/(100+120)=0.5909
u
X1 X2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
sd t
n 1
n
2 7950 8832500
10 1
10
528.336IU / g
d d d 795.0 4.785 sd s d n 528.336 10
确定概率P:按ν =9查t 界值表,得P<0.01 判断结果:在α=0.05的水准上,拒绝H0,接受H1,可以认为 维生素E缺乏组大鼠肝脏维生素A含量低于正常饲料组。
二、 假设检验的基本步骤
• 确定检验水准: 检验水准(size of a test),亦称为 显著性水准(significance level),符号 为α,即拒绝或不拒绝H0所要冒出错的风 险大小。一般取α=0.05或α= 0.01。
二、 假设检验的基本步骤
• 确定单侧检验(one sided test)还是双侧检验(two sided test): 如果根据现有的专业知识无法预先判断该病 病人的脉搏是高于还是低于一般健康成年男,两 种可能性都存在,研究者对这两种可能性同等关 心,那么,就是要推断两总体均数有无差别,应 当采用双侧检验;如果根据专业知识,已知病人 的脉搏不会低于一般人,或是研究者只关心病人 的脉搏是否高于一般,而不关心是否低于一般, 则应当采用单侧检验(one sided test)。
二、 假设检验的基本步骤
本例的资料符合t 检验的应用条件,已知 μ=72次/min , x =75.572次/min ,s=5.0次/min , n=25,代入公式计算t 值,结果:
x x 75.5 72.0 t 3.50 sx s n 5.0 25
3. 确定P值
第二节 t 检验
1. 一组样本资料的 t 检验
(样本均数与总体均数的比较)
例4.1 已知健康成年男子脉搏均数为72次/分。今测 得某单位26名男性汽车司机的脉搏均数为73.7次 /min,标准差为8.8次/ min 。能否据此认为男性汽 车司机的脉搏数高于一般健康成年男子的脉搏数?
这里两个均数不等有两种可能:
假设检验就是要借助于一定的检验统计 量(如t值、u值、 F值等)推算出这个可能 性(概率)的大小,如果这种情况发生的概 率很小,譬如P ≤0.05(或0.01),那么我们 可以认为这种情况基本不会发生,因此拒绝 该假设,即所观察到的差别不能仅用抽样误 差来解释,换句话说,这种差别很可能是由 于疾病所致;如果P >0.05,那么我们没有充 分的理由认为这种情况不会发生,因此就不 能拒绝该假设,即所观察到的差别可能只是 由于抽样误差所造成的。
二、 假设检验的基本步骤
4. 做出推断结论
将确定的P值与检验水准(α)比较,从而判 断是否拒绝H0。
如果P>α,则按所定检验水准不拒绝H0,称差异不显著或 差异无统计学显著性意义; 如果P≤α,则按所定检验水准拒绝H0,接受H1,称差异显 著或差异有统计学显著性意义。 经常使用的显著性水准有α=0.05和α=0.01,如果P≤0.05, 称有统计学显著性意义,如果P≤0.01,则称差异极显著或 差异有高度统计学显著性意义。
• 结论:在α=0.05水准,拒绝H0,接受H1,可以认为该病病 人与一般健康成年男子的脉搏数的均数有差别。
第二节 t 检验
t 检验的应用于样本例数较小时两个均数的比较, 如样本均数与总体均数的比较、配对资料的比较、 两个样本均数的比较等。 应用条件:
• 样本是来自于正态总体的随机样本;
• 作两样本均数比较时,要求两样本的总体方差齐同。 • 但实际应用时,若与上述条件略有偏离,对结果影响亦不 大。
例4.4 H0: μd=0 H1: μd≠0 α=0.05
d 16 d 1.33(kg) n 12 sd t
2 d d 2
n 1
n
2 16 710
12 12 1
7.91kg
d d d 0 1.33 0.58 sd s d n 7.91 12
第I类错误,假阳性错误(弃真), α 即拒绝正确的H0 第II 类错误,假阴性错误(存伪),β 即不拒绝错误的H0
二、 假设检验的基本步骤
单侧检验和双侧检验的假设
单双侧类型
目的 是否μ≠μ0 是否μ>μ0 或是否μ<μ0
H0 μ=μ0 μ=μ0或μ≤μ0 μ=μ0或μ≥μ0
H1 μ≠μ0 μ>μ0 μ<μ0
双侧检验 单侧检验
二、 假设检验的基本步骤
2. 计算检验统计量
根据研究设计类型、数据资料类型、总体的 分布特征及统计推断的目的等不同,要选用不同 的假设检验方法。如样本均数与总体均数比较或 成组设计两样本均数的比较等要用t 检验或u检验, 两样本方差的比较用F检验,多个样本均数的比较 需用方差分析,两个率比较可以用u检验、χ2检验 等等。每种检验方法都有相应的检验统计量,如t 值、u 值、F 值、χ2值等等。
确定概率P:按ν =11查t 界值表,得P >0.5 判断结果:在α=0.05的水准上,不拒绝H0,尚不能认为该减 肥药有效。
三、两独立样本资料的t 检验
1. 两样本所属总体方差相等
s n1 1 s n2 1 s n1 n2 2
2 c 2 1 2 2
n1 n2 s x1 x2 s nn 1 2 x1 x2 t s x1 x2
2. 配对设计资料的t 检验
配对设计有两种情况:
①对同一对的两个受试对象分别给予两种处理,这
些实验的目的均是推断两种处理的效果有无差别。
②是对同一批受试对象处理前后的比较,其目的是
推断该处理有无作用。 • 解决这类问题,先要求出各对差值d 的均数。也可 将这类问题看成样本均数与总体均数0的比较。
二、配对设计资料的t 检验
第一节 假设检验的概念与原理
假设该病病人脉搏的总体均数也是72次/min ,
因总体标准差未知,可用样本标准差来估计,即
标准差为5.0次/min ,那么,从这样一个总体 (μ=72次/min,σ=5.0次/min )中抽取一个25人的 样本,有没有可能得到样本均数75.5次/min ?
第一节 假设检验的概念与原理
第六章 假设检验基础
第一节 第二节 第三节 检验 第四节 第五节 第六节 假设检验的概念与原理 t 检验 二项分布与Poisson分布资料的 Z
假设检验与区间估计的关系 假设检验的功效 Ⅰ型错误和Ⅱ型错误正态性检验
第一节 假设检验的概念与原理
一、 假设检验的原理
假设检验(hypothesis testing)亦称为显著性检 验(significance test)。下面通过一个实例说明假设 检验的基本思想和方法步骤。
二、 假设检验的基本步骤
P值(概率)是指根据检验假设(H0),对规定的总 体作随机抽样,获得等于及大于(或等于及小于)通 过样本数据计算得到的检验统计量的概率。 P 值的大小是根据检验统计量的大小来确定的, 有两种方法:
• 通过数学方法求得确切的P值,但计算过程较为繁琐。 • 计算出检验统计量查相应的假设检验工具表,如t界值表、 F界值表、χ2界值表等,但由于界值表中不可能把检验统 计量所有的值都列出来,所以通常只能确定P值的大致范 围。
例4.3 20只按体重、月龄及性别配对的大白鼠随机分人甲、乙2组,甲组 饲喂正常饲料,乙组的饲料缺乏维生素E。10d后测定各鼠肝脏的维生 素A含量,结果如下。问2组大白鼠肝脏维生素A含量是否有差别?
例4.3 H0: μd=0 H1: μd≠0 α=0.05
d d 7950 795.0IU / g n 10 d
第一节 假设检验的基本思想
二、 假设检验的基本步骤
1. 选择检验方法,建立假设和确定检验水准 2. 计算统计量 3. 确定P 值 4. 做出推断结论
二、 假设检验的基本步骤
1. 建立假设和确定检验水准
• 建立假设:检验假设(hypothesis to be tested)又称无
效假设(null hypothesis),符号为H0;与无效假设对应 的是备选假设(alternative hypothesis)符号为H1。H0与 H1都是根据统计推断的目的而提出的对总体特征的假 设。前例的检验假设应为: H0:该病病人脉搏的总体均数(μ)一般健康成年男子脉搏 的总体均数(μ0)相同,即μ=μ0=72次/min 。 H1:该病病人与一般健康成年男子脉搏的总体均数不同, 即μ≠μ0。
例 已知健康成年男子脉搏均数为72次/min 。某医 生随机抽查了 25 名某病成年男性病人,求得脉搏 的均数为75.5次/min ,标准差为5.0次/min ,能否据 此认为该病病人的脉搏均数与一般健康成年男子 的脉搏均数有差别?
第一节 假设检验的概念与原理
这里样本均数与总体均数的差异有两种可能:
①差异仅仅是由抽样误差引起的。
②差异不仅仅是由抽样误差引起的,还有疾病的影 响。 假设检验就是要回答“差别是否仅仅由于抽样误差 所引起”这样一个问题。
第一节 假设检验的概念与原理
首先,假设所观察到的某病病人与一般健康 成年男子脉搏均数的差异仅仅是由于抽样误差引 起。这一假设的基本含义是:某病病人与一般健 康成年男子脉搏的总体均数相同,即该病对脉搏 没有影响。 假如我们随机抽取25名一般健康成年男子, 测定其脉搏并计算脉搏的均数,所得到的样本均 数是否一定是72次/min ?由于抽样误差的存在,样 本均数恰好等于总体均数的概率是较小的。2 c n1 n2 2
三、两独立样本资料的t 检验
2. 两样本所属总体方差不等 (Satterthwaite近似法)
t' X1 X 2
2 S12 S 2 n1 n2
s
2 x1
s
4 sx 1