卫生统计学-第七章 假设检验基础
卫生统计学-假设检验
H 0 : 0
0
显然包括
H1 : 0
0.05
0 0
故称双侧检验(two-sided test)
若检验假设如下:
H 0: 0 H1: 0
或
H 0: 0 H1: 0
称单侧检验(one-sided test)
123.5与125不同的原因何在?
来自于总体均数为125g/L 的总体,差别由抽样误 差导致。
25名1岁婴儿 血红蛋白浓度 X
0 125
0 125
来自另一总体,这个 总体的血红蛋白均数 未知,差别不仅是抽 样误差,主要是本质 的不同。
先假设 0 125,原当前的 X 与0 的差异ห้องสมุดไป่ตู้是抽样误差——提出原假设 接下来验证假设,如何验证? 根据 X 0 的大小,如果 X 0 较小可以认为 当前的差异是抽样误差,反之如果 X 0 较大 就怀疑当前的差异不仅仅是抽样误差(反证法)
问题
(1)该结论是否正确? (2)应该如何解决诸如此类的问题?
采用假设检验的方法予以解决
1.假设检验(hypothesis testing)的
基本思想
应用反证法和小概率原理,先对总体的参
数或分布作出某种假设,再用适当的方法根
据样本对总体提供的信息,推断此假设应当
拒绝或不拒绝。这个过程即为假设检验。
Chapter 7
假设检验
Hypothesis test
主要内容
假设检验的基本原理和步骤 Ⅰ型错误与Ⅱ型错误
单侧检验与双侧检验
假设检验应注意的事项 假设检验与区间估计的联系 (自学)
§1 假设检验的基本思想 和步骤
07《卫生统计学》第七章_假设检验基础(6版) (1)
sd t
n 1
n
2 7950 8832500
10 1
10
528.336IU / g
d d d 795.0 4.785 sd s d n 528.336 10
确定概率P:按ν =9查t 界值表,得P<0.01 判断结果:在α=0.05的水准上,拒绝H0,接受H1,可以认为 维生素E缺乏组大鼠肝脏维生素A含量低于正常饲料组。
二、 假设检验的基本步骤
• 确定检验水准: 检验水准(size of a test),亦称为 显著性水准(significance level),符号 为α,即拒绝或不拒绝H0所要冒出错的风 险大小。一般取α=0.05或α= 0.01。
二、 假设检验的基本步骤
• 确定单侧检验(one sided test)还是双侧检验(two sided test): 如果根据现有的专业知识无法预先判断该病 病人的脉搏是高于还是低于一般健康成年男,两 种可能性都存在,研究者对这两种可能性同等关 心,那么,就是要推断两总体均数有无差别,应 当采用双侧检验;如果根据专业知识,已知病人 的脉搏不会低于一般人,或是研究者只关心病人 的脉搏是否高于一般,而不关心是否低于一般, 则应当采用单侧检验(one sided test)。
二、 假设检验的基本步骤
本例的资料符合t 检验的应用条件,已知 μ=72次/min , x =75.572次/min ,s=5.0次/min , n=25,代入公式计算t 值,结果:
x x 75.5 72.0 t 3.50 sx s n 5.0 25
3. 确定P值
第二节 t 检验
1. 一组样本资料的 t 检验
卫生统计 假设检验基础
试验设计
配对设计
将受试对象按照某些重要特征(主要是非处理因素) 将受试对象按照某些重要特征(主要是非处理因素) 配成对子, 配成对子,每对中的两个受试对象随机分配到两处理 组.
特点
控制较多的个体变异,可比性好, 控制较多的个体变异,可比性好, 常用于个体变 异较大的资料. 异较大的资料.
类型
1. 2. 3. 将受试对象配成特征相近的对子,随机接受两种处理; 将受试对象配成特征相近的对子,随机接受两种处理; 同一受试对象或同一份样品分成两份, 同一受试对象或同一份样品分成两份,随机分别接受不同 处理; 处理; 同一受试对象处理前后的结果比较. 同一受试对象处理前后的结果比较.
假设检验的基本步骤: 假设检验的基本步骤:
建立检验假设,确定检验水准; 1. 建立检验假设,确定检验水准;
零假设,无效假设.是与研究假设有关的, H0:零假设,无效假设.是与研究假设有关的,被推断特 征某种确定的关系; 征某种确定的关系; 备择假设,对立假设. H1:备择假设,对立假设.是被推断总体特征的另一种关 系或状况, H0既有联系又互相对立 既有联系又互相对立. 系或状况,与H0既有联系又互相对立. 检验水准,将小概率事件具体化, 检验水准,将小概率事件具体化,即规定概率不超过 就是小概率. 就是小概率.
查附表2, 界值为 界值为2.045,统计量小于界值,则P>0.05,接受 查附表 ,t界值为 ,统计量小于界值, , H0,差异无统计学意义.尚不能认为该山区成年男子脉搏数与 ,差异无统计学意义. 一般男子相同. 一般男子相同.
配对样本t检验 配对样本 检验
Paired design t-test
12名儿童分别用两种结核菌素的皮肤浸润反应结果 名儿童分别用两种结核菌素的皮肤浸润反应结果(mm) 名儿童分别用两种结核菌素的皮肤浸润反应结果
卫生统计学:第7-8章 假设检验与t检验
反证法
当一件事情的发生只有A、B两种可能的时候,为了肯 定其中的一种情况A,但又不能直接证实A,这时否定 了另一种情况B,则间接肯定了A。 证明A还是证明B? 抗氧化剂 • 在H0成立的条件下,均数之间的差异是由抽样误差
引起的,有规律可循; • 在H1成立的条件下,均数间的不同包含种种未知情
形,无规律可循。 • 故从H0成立的角度出发,寻求其成立的概率。
分布。
数理统计的中心极限定理表明:从正态总体N ( , ) 中抽取例数均为n 的样 本,样本均 数也服从正态分布N( , X )。
Gosset 将此时的 u 转换:
X
定义为t 转换: t sX
u X X
并将t 值的分布命名为t 分布。
t 分布的图形及特征
• 单峰分布,以0为中心,左右对称 • t分布是一簇曲线,其形状与自由度υ(υ=n-1)
基本原则——小概率事件在一次试验中是不可能发生的。
建立检验假设,确定检验水准
假 设 检 验 步 骤
P≤α
计算检验统计量
确定P值
作推断结论
P>α
拒绝H0,接受H1
不拒绝H0
为了解某地1岁婴儿的血红蛋白浓度,某医 生从该地随机抽取了1岁婴儿25名,测得其血红 蛋白浓度的平均数为123.5g/L,标准差为11.6 g/L, 而一般正常小儿的平均血红蛋白浓度为125 g/L, 故认为该地1岁婴儿的平均血红蛋白浓度低于一 般正常小儿的平均血红蛋白浓度。
│t│值越大,则 P 值越小;反之,│t│值 越小,P 值越大。根据上述的意义,在同 一自由度下,│t│≥ tα ,则P≤ α ; 反之, │t│<tα,则P>α。
t 检验的应用条件:
单样本t 检验中,σ未知且样本含量较小 (n<50)时,要求样本来自正态分布总体;
《卫生统计学》考试重点复习资料
②权衡两类错误的危害以确定α的大小。 ③正确理解 P 值的意义,如果 P<α,宜说差异“有统计学意义”。
第八章 方差分析
名词解释
总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表 示。 组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其 大小可用组间均方表示。 组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象 的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对 象随机地分配到各处理组,这种设计叫做随机区组设计。
构成比
某一组成部分的观察单 位数 同一事物各组成部分的 观察单位总数
100 %
③比又称相对比,是 A、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表
示,其公式为:相对比=甲指标 / 乙指标(或 100%)
甲乙两个指标可以是绝对数、相对数或平均数等。
应用相对数时应注意哪些问题?
答:应用相对数时应注意的问题有:
相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、
构成比、比等。
标准化法:是常用于内部构成不同的两个或多个率比较的一种方法。标准化法的基本思想就
是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使
之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
料间的相对水平。 3) 报告比较结果时必须说明所选用的“标准”和理由。 4) 两样本标准化率是样本值,存在抽样误差。当样本含量较小时,还应作假设检验。
医学统计学第七、八章 假设检验的基本概念和t检验
S x 1 − x 2 为两样本均数差值的标准误
Sx −x
1
2
⎛1 1⎞ ⎟ = S ⎜ + ⎜n n ⎟ 2 ⎠ ⎝ 1
2 c
在两总体方差相等的条件下,可将两方差合并, 求合并方差(pooled variance) S c2
2 ⎡ ( Σ x1 ) ⎤ 2 ⎢ Σ x1 − ⎥ + n1 ⎦ ⎣ = n1 − 1 + 2 ⎡ ( Σx2 ) ⎤ 2 ⎢Σ x2 − ⎥ n2 ⎦ ⎣ n2 − 1
t 检验的应用条件:
① 单样本t检验中,σ 未知且n 较小,样本取自 正态总体; ② 两小样本均数比较时,两样本均来自正态分 布总体,两样本的总体方差相等;若两总体 方差不齐可用t’检验; ③ 两大样本均数比较时,可用Z检验。
1、样本均数与总体均数比较的 t 检验
• 使用范围:用于样本均数与已知总体均数(一 般为理论值、标准值或经过大量观察所得的稳 定值等)的比较。 • 分析目的:推断样本所代表的未知总体均数 μ 与已知总体均数 μ0有无差别。 • 若 n 较大,则 tα .ν ≈ tα .∞ , 可按算得的 t 值用 v = ∞ 查 t 界值表( t 即为 Z )得P值。
回到例子:
2.计算统计量
已知μ0= 3min,n=50, X=4min
4−3 t= = 4 .7140 1 .5 / 50
υ = 50 − 1 = 49
3、确定 P 值,作出统计推断 根据算出的检验统计量如 t、z 值,查 相应的界值表,即可得到概率 P。 P值是在H0成立前提下,抽得比现有样 本统计量更极端的统计量值的概率。 P值越小只能说明:作出拒绝H0 ,接受 H1的统计学证据越充分。
X −μ X −μ 用公式:t = 或z = σX SX
卫生统计学基础流行病学数据的假设检验与置信区间计算
卫生统计学基础流行病学数据的假设检验与置信区间计算在卫生统计学中,流行病学数据的假设检验与置信区间计算是常见的分析方法。
通过这些方法,我们可以对流行病学数据进行有效的推断和判断。
本文将介绍基本的假设检验和置信区间计算的原理和应用。
一、假设检验假设检验是指通过收集样本数据,对总体的某个参数提出假设,并利用样本统计量对该假设进行验证的统计方法。
常见的假设检验有单样本均值检验、两样本均值检验和相关性检验等。
1. 单样本均值检验假设我们有一组样本数据,想要判断该样本的均值是否等于某个给定的值。
首先我们提出原假设(H0)和备择假设(H1),然后计算样本均值和标准误差,接着利用标准正态分布或t分布进行判断。
2. 两样本均值检验在两个独立的样本群体中,我们想要判断两个群体均值是否存在显著差异。
同样,我们提出原假设(H0)和备择假设(H1),计算两个样本的均值和标准误差,并利用t分布进行判断。
3. 相关性检验当我们需要了解两个变量之间是否存在相关性时,可以进行相关性检验。
常见的方法有Pearson相关系数和Spearman等级相关系数。
通过计算相关系数的置信区间,我们可以判断两个变量之间的相关程度。
二、置信区间计算置信区间是指对总体参数的一个区间估计,通常用一个上限值和一个下限值表示。
置信区间计算可以帮助我们确定总体参数的范围。
在流行病学数据分析中,我们常用置信区间来估计疾病的患病率、死亡率等指标。
置信区间的计算方法与假设检验类似,根据所需的置信水平和样本数据,计算样本均值和标准误差,再利用正态分布或t分布确定置信区间。
除了单个参数的置信区间计算外,对于两个参数之间的差异,也可以计算置信区间。
例如,在两组样本数据中,我们希望确定两个样本均值之间的差异是否显著。
通过计算差异的置信区间,可以得出结论。
三、数据分析示例为了更好地理解假设检验和置信区间计算的应用,我们以某疾病的发病率为例进行说明。
假设我们有两组样本数据,分别为疫苗接种组和非接种组的患病人数。
医学统计学假设检验基础
(三)选择检验(jiǎnyàn)方法,计算检验(jiǎnyàn)统计量
• 应根据研究目的、资料类型、设计类型及样 本含量大小等因素选择合适(héshì)的假设检验方 法;
• 在H0成立的前提下,由样本已知信息构造检 验统计量;
• 通常根据构造的检验统计量来命名假设检验 方法。
• 不同的统计量涉及的统计分布不同
S / n 6.5 / 25
4、按 =25-1=24查附表2 t界值表
P=P(|t|≥1.69) ?
共八十七页
自由度
单侧 双侧
1
2 3 4 5
6 7 8 9 10
21 22 23 24 25
0.25 0.50
1.000 0.816 0.765 0.741 0.727
0.718 0.711 0.706 0.703 0.700
族足月正常产男性新生儿临产前双顶径(BPD)是否大于一般新生 儿?
共八十七页
• 例3 已知北方农村(nóngcūn)儿童前囱门闭合月龄为14.1
月。某研究人员从东北某县抽取36名儿童,得前囱门闭 合月龄均值为14. 3月,标准差为5.08月。问该县儿童前 囟门闭合月龄的均数是否大于一般儿童?
共八十七页
共八十七页
单样本 t检验 (yàngběn)
• 设计类型 : (lèixíng)
例2 大量研究表明汉族足月正常产男性新生儿临产前双顶径(BPD)
均数为9.3cm,某医生记录了某山区12名汉族足月正常产男性新 生儿临产前双顶径(BPD)资料如下:9.95、9.33、9.49、9.00、 10.09、9.15、9.52、9.33、9.16、9.37、9.11、9.27。试问该地区汉
0.686 0.686 0.685 0.685 0.684
卫生统计学7——假设检验
8
9 10 11 12
1.61
1.72 1.81 1.93 2.02
1.61
1.72 1.82 1.93 2.04
(1)建立检验假设,确定检验水准
H0:d=0,两种方法测定结果之差总体均数为0 H1:d≠0,
=0.05
(2)计算检验统计量
本例n=12,
29
d 0 0.0033 0 t 0.771 sd / n 0.01497 / 12
平均数为14.1
Population
SAMPLE
μ0
μ1
平均数为14.3 标准差为5.08 N=36
6
(二)假设检验的基本原理(基本思想): 1、为什么要进行假设检验? 因为样本均数存在差别的原因有: ①完全由抽样误差造成 ②研究因素造成(本质上的差别) 统计上就是推断样本均数的差别,由①造成的 概率大小。
23
V=35
计算统计量 / z t
0.236
P
0.682
0.05
●●
24
二、配对资料的比较
1.配对的形式:
☻自身比较,处理前后比较; ☻同一样品接受两种不同处理; ☻成对的两个对象给予两种不同的处理;
25
2.推断的目的及条件:
目的:差值d的总体均数是否为0。
条件:理论上要求差值来自正态分布总体。
n 1 12 1 11
(3)确定P值,作出推断结论 查 附 表 2 的 t 界 值 表 得 ,0.4<P<0.5 。 按 =0.05水准,不拒绝H0 ,有统计学意义。尚 不能认为两种方法测定结果有差异。
30
表2 3组肥胖患者治疗前后体重、BMI、体脂百分率比较 ( x s )
医学统计学第3版 第7章 假设检验
=0 =0 =0
0 >0 <0
建立检验假设,确定检验水准
检验水准(significance level),以表示
习惯上取 =0.05或0.01 是小概率事件在本次假设检验中发生的界值标 准 应在设计时根据专业知识和研究目的,在进行 假设检验前设定
选定适当的检验方法,计算相应统计量。 依据:
分析目的 设计方法 变量类型 已知条件
选定检验方法,计算检验统计量
本例:
分析目的:高原地区成年男子平均Hb量高于一 般人群,即 >0 设计方法:调查设计 变量类型:定量资料 已知条件: 0=140g/L;n=25,x=155g/L, s=24g/L;未知
P=P(t≥t*)
确定P值,作出统计推断
X- 155-140 =4.8412 = t = s x 24/ 60
=59
P =P(t 4.8412)<0.0005
●
●
1.6714.841
确定P值,作出统计推断
若P,表示在H0成立的条件下,出现等 于及大于现有统计量的概率是小概率,按 小概率事件原理现有样本信息不支持H0, 因而拒绝H0。
不拒绝H0 II 型错误
未知
1. ,
2. , 3. , 4. n ,
的影响因素
假设检验需要注意的问题
数据应来自设计科学的实验或调查
样本的代表性 可比性/均衡性:比较的基础
数据应该满足假设检验方法的前提条件 正确理解假设检验中概率值的含义
差异有统计学意义与差异大小的区别
假设检验的分类
根据假设的对象
参数检验—对总体参数提出假设 非参数检验—对总体分布提出假设
雷静《卫生统计学》第七章 假设检验基础一PPT课件
4
假设检验的基本步骤
☆建立检验假设和确定检验水准 ☆选定检验方法和计算检验统计量 ☆确定P值和做出统计推断结论
13.08.2020
西安医学院公共卫生系
5
建立假设
假设: H0(零假设) μ1=μ2 H1(备择假设)μ1≠μ2或μ1>μ2
(根据研究目的、设计类型及资料特点将需要推断的问题 表述为关于总体特征的一对假设)
13.08.2020
西安医学院公共卫生系
8
统计推断结论应包括统计结论和专业结论两 部分。统计结论只说明有无统计学意义,而不 能说明专业上的差异大小,专业结论须结合专 业知识才能得出。
***注意:假设检验的结论是具有概率性的,
不论是拒绝H0或不拒绝H0,都有可能发生错 误,即第一类错误或二类系
9
第一类错误与第二类错误
指假设检验中作出的推断结论可能发生两类错误 ☆I类错误:拒绝了真实的H0 。 (拒绝了实际上成立的H0),概率用α表示。 ☆II类错误:接受了实际上不成立的H0 。 (拒绝了真实的H1),概率用β表示,
β值的大小很难确切估计。 一般,样本例数确定时,α愈大,β愈小;
sx1x2 (n11 n)1s1 2 n2(n 221)s2 2n 11n12
• 如果样本含量足够大n1 n2 均大于 50或100时,可将t检验简化为u检验
• 计算检验统计量Ζ :
Ζu
x1 x2
s
2 1
s
2 2
n1 n2
13.08.2020
西安医学院公共卫生系
16
4.两独立样本资料的方差齐性检验
课程或者工作有什么建议和意见,也请写在上边
19
感谢观看
The user can demonstrate on a projector or computer, or print the presentation and make it into a film
7假设检验基础
当H0成立时,检验统计量为:
例6-9 某市计划2005年接种吸附百白破联合疫苗后无菌化 脓率控制在25/10万人次以内。免疫接种的统计报告数据显示 2005年接种吸附百白破联合疫苗125538人次,其中发生无菌化 脓例数为38例,试问2005年该市无菌化脓发生率能否达到要求?
按ν =∞查t临界值表:(单侧) Z0.05, ∞ =1.645 Z<Z0.05,得P>0.05,按α =0.05水准不拒绝H0,故可认为 该市无菌化脓发生率能达到要求。
欲考察某药物A预防孕妇早产的效果,某医院妇 科进行一项临床试验,入选30例孕妇,随机分配到 处理组(服用A药)和对照组(服用安慰剂),每组 15例,处理组出生婴儿体重(Kg)测量值: 6.9,7.6„,8.6;对照组出生婴儿体重(Kg)测量 值:6.4,6.7,„,6.8。处理组均数位7.1 (Kg), 对照组为6.3 (Kg)。
其中
为差值的均数,
为差值的样本标准
差,n是对子数。
例6-2 为了研究孪生兄弟的出生体重是否与其出生顺序有关, 共收集了15对孪生兄弟的出生顺序和出生体重,见表6-2.试 问孪生兄弟中先出生者的出生体重与后出生者的出生体重是 否相同?
表6-2
编号 1 2
15对孪生兄弟的出生体重(Kg)
先出生者体重 2.79 3.06 后出生者体重 2.69 2.89 差值 0.10 0.17
3
4 … 15
2.34
3.41 … 2.65
2.24
3.37 … 2.60
0.10
0.04 … 0.05
例6-3
用两种方法测定12份血清样品中Mg2+(mmol/L)的
表6-3 两种方法测定血清Mg2+(mmol/L)的结果 甲基百里酚蓝法 0.94 1.02 1.14 葡萄糖激酶两点法 0.92 1.01 1.11 差值 0.02 0.01 0.03
7.假设检验基础
单侧检验和双侧检验
研究者可能有两种目的: ①推断两总体均数有无差别。不管是山区高于一 般,还是山区低于一般,两种可能性都有,研究 者都同样关心,应当用双侧检验。 ②根据专业知识,已知山区不会低于一般,或者
研究者只关心山区是否高于一般,不关心山区是
否低于一般,应当用单侧检验。
一般双侧检验较常用,如比较两种药物 的疗效时,研究者可能有一定理由认为新药 不会比旧药差,但不能绝对排除相反的可能 性,不宜用单侧检验,而应用双侧检验。再 如:预实验,有探索性质,对结果的考虑以 思路宽些为好,多用双侧检验。
t0.05,7=2.365 t0.01,7 =3.499 P<0.01
d
=546.25
今P<0.01, 在=0.05的水准上,拒绝H0,接受H1,差异有 高度显著性,认为不同饲料组的大白鼠肝中维生素A含量有差 别,即维生素E缺乏对大白鼠肝中维生素A含量有影响。
用两总体均数差的可信区间的方法:
n=8,
解:H0:d =0
H1:d ≠0 =0.05
n=8,
d=6500, d2=7370000,d=812.50
d2-(d)2/n 2 737000-6500 /8 7
Sd= n-1 = Sd = Sd /n =546.25/8 =193.13
t= d - 0 = 812.5/193.13=4.207 S
选用不同的方法。
检验统计量是用于抉择是否拒绝H0的统
计量。
t=
x-0
Sx
= 74.2-72 =1.833
6.0/25
4.确定P值和作出结论
P值是指由H0规定的总体中作随机抽样,获
得等于及大于(和/或等于及小于)现有样本检验统计 量值的概率。 t(u)>t,(u) P<
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一:单样本t检验(one sample t-test) 即样本均数代表的未知总体均数与已知总体 均数差异的比较
样本均数与总体均数比较,其分析目的是推断
样本所代表的未知总体均数与已知总体均数 0有无差别。
例1据大量调查知,健康成年男子脉搏的均数 为72次/分,某医生在山区随机调查了25名健 康成年男子,其脉搏均数为74.2次/分,标准 差为6.5次/分,能否认为该山区成年男子的脉 搏高于一般人群?
1- :检验效能(power):当两总体确有差别,
按检验水准 所能发现这种差别的能力。
减少I型错误的主要方法:假设检验时设定 值。
减少II型错误的主要方法:提高检验效能。
提高检验效能的最有效方法:增加样本量。 如何选择合适的样本量:实验设计。
与 间的关系
减少(增加)I型错误,将会 增加(减少)II型错误
理解二: 单次试验(抽样)观测到的事件不应该 是小概率事件。
假设检验的思路
根据背景建立假设 根据样本得到某些特征 推断该样本特征在假设下的概率 根据‘否定小概率事件’思想做出推断
假设检验的思路分析 数学上的反证法原理进行分析
先假设要比较的事物是相同的 再在这种假设成立的情况下,进行逻辑推理 如果推理出发生的事是一个小概率事件,一般
第七章 假设检验基础
吴立娟 流行病与卫生统计学系
假设检验的概念和原理
同一总体
样本1 样本2
差异 抽样误差引起 P>0.05
无统计学意义
总体甲
样本1
(本质不同)
总体乙
样本2
差异 本质不同引起 P<0.05
有统计学意义 不能用抽样误差来解释
假设检验的原理/思想
反证法:反证法就是证明某个命题时,先假定它的 结论的否定成立,然后从这个假定出发,经过推理 ,得出与已知事实相矛盾的结果.这样,就证明了 结论的否定不成立,从而间接地肯定了原命题的结 论成立
确定检验水准 (size of teat α) 通常 取0.05 或 0.01。
(2)计算统计量
根据资料类型与分析目的选择适当 的公式计算出统计量.
(3)确定概率值(P)作出推断结论
通过查统计学用表0,差别无统计学意义; 如果p<=,则拒绝H0,接受H1,差别有统计意 义。
本质差异,还决定于抽样误差大小、检验水准
的高低以及单侧、双侧检验。
因此,当P与接近时,下结论要慎重, 不能绝对化,同时,检验水准和单侧、
双侧检验的确定要在设计时决定,而不
能受样本结果的影响。
5、注意各检验方法应用条件
选择题:
1. 按α=0.10水准做t检验,P>0.10,不能认为两总
两类错误
I型错误和II型错误
假设检验是利用小概率反证法思想,
从问题的对立面(H0)出发间接判断要解决 的问题(H1)是否成立,然后在假定H0成立 的条件下计算检验统计量,最后根据P值判
断结果,此推断结论具有概率性,因而无
论拒绝还是不拒绝H0,都可能犯错误。
I 型错误:“实际无差别,但下了有差别 的结论”,假阳性错误。犯这种错误的概率
2.假设检验有三个基本步骤:
① 建立假设和确定检验水准,通常选 α 0.05
② 计算检验统计量
③ 确定P 值和做出统计推断结论
所有的假设检验都按照这三个步骤进行,各 种检验方法的差别在于第②步计算的检验统计量 不同。
3、正确理解差别有无显著性的统计学意义
对假设检验结论中的“拒绝H0”称为“有统计 学 意 义 ” ; “ 不 拒 绝 H0” 称 为 “ 无 统 计 学 意
义”。
不应把“有统计学意义”误解为差别很大,甚 至在医学实践中有重要的价值;
同理,也不应把“无统计学意义”误解为差别 不大,或一定相等。
4、结论不能绝对化 假设检验的结论是根据P
值大小作出的,不是百分之百的正确。
拒绝H0,可能产生I型错误;不拒绝H0,可能产
生II型错误。
另外,是否拒绝H0不仅决定于被研究事物有无
单个样本的t 检验
(one sample t test)
t X 0
SX
自由度ν= n-1
概率论(小概率):如果一件事情发生的概率很小 ,那么在进行一次试验时,我们说这个事件是“不 会发生的”。从一般的常识可知,这句话在大多数 情况下是正确的,但是它一定有犯错误的时候,因
为概率再小也是有可能发生的。
‘否定小概率事件’思想
理解一: 当多个事件发生概率不同时,若只做一 次推测,则推测概率较大的事件将发生, 概率较小者不发生。
情况下,一次抽样中是不可能发生的,则反推 到假设有误,从而否定假设; 如果推理出的不是一个小概率事件,则在一次 抽样中是可能发生的,则证据不足,不能拒绝 原假设; 但这种拒绝或不拒绝是有可能出错的!!!? 出错的可能性性0.05或0.01
假设检验的步骤:
(1)建立假设 无效假设(null hypothesis),用H0表示; 备择假设(alternative hypothesis),用H1表示
体均数不相等,此时若推断有错,其错误的概率为
( )。
A.大于0.10
B.β,而β未知
C.小于0.10
D.1-β,而β未知
2.两个样本均数比较,经t检验,差异 有显著性,p越小,说明( )
A.两样本均数差别越大 B.两总体差别越大 C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同
t检验
是(其值等于检验水准)
II型错误:“实际有差别,但下了不拒绝H0
的结论”,假阴性错误。犯这种错误的概率
是(其值未知) 。
表2 可能发生的两类错误
客观实际
假设检验的结果
拒绝 H0
不拒绝 H0
H0 成立
H0 不成立 即 H1 成立
I型错误() 推断正确(1)
推断正确(1) II型错误()
增大n 同时降低 与
小结
1.假设检验的思想是,首先对所需要比较的总体提出 一个无差别的假设,然后通过样本数据去推断是否 拒绝这一假设。其实质是判断观察到的“差别”是 抽样误差引起还是总体上的不同,目的是评价两个 不同的参数或两种不同处理引起效应不同的证据有
多强,这种证据的强度用概率P 度量和表示。