《医学统计学》假设检验整理
合集下载
医学统计学假设检验
T检验
双边检验
构造T统计量 T
X 0 S n
~ t (n 1)
X 0 由 P t 2 (n 1) S n 确定拒绝域 T t 2 (n 1) x 0 如果统计量的观测值 T t 2 (n 1) S n
如果统计量的观测值
2 0
~ (n)
2
由
2 (n) 或
2 2 2
2 1 2
(n)
则拒绝原假设;否则接受原假设
一个正态总体均值未知的方差检验
问题:设总体 假设
2
2检验
X~N(,2),未知
2 0 2 2 0
H0 : ; H1 : ; 双边检验 (n 1) S 2 2统计量 2 构造 ~ 2 (n 1) 由 2 0 2 2 2 2 P (n 1) , P (n 1)
~ N (0,1)
则拒绝原假设;否则接受原假设
例1 由经验知某零件的重量X~N(,2),=15, =0.05;技术革新后,抽出6个零件,测得重量为 (单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已 知方差不变,试统计推断,平均重量是否仍为15克? (=0.05)
引
言
统计假设——通过实际观察或理论分析对总体分布形式 或对总体分布形式中的某些参数作出某种 假设。 假设检验——根据问题的要求提出假设,构造适当的统 计量,按照样本提供的信息,以及一定的 规则,对假设的正确性进行判断。
基本原则——小概率事件在一次试验中是不可能发生的。
基本概念
引例:已知某班《应用数学》的期末考试成绩服从 正态分布。根据平时的学习情况及试卷的难易程度,估 计平均成绩为75分,考试后随机抽样5位同学的试卷, 得平均成绩为72分,试问所估计的75分是否正确? “全班平均成绩是75分”,这就是一个假设 根据样本均值为72分,和已有的定理结论,对EX=75 是否正确作出判断,这就是检验,对总体均值的检验。
医药卫生医学统计学假设检验
均数不同,H1:μ≠μ0
=0.05
▲ 计算统计量:Z 统计量: Z= ▲ 确定概率值:
x 0 Sx
|Z|=9.58 Z = 1.96 |Z|> Z p < =0.05;
▲ 做出推论:
Z= 9.58> 1.96, p < 0.05 = , 小概率事件发生 了,原H0假设不成立;拒绝H0 , 接受H1, 可认为: 某校女大学生身高均数与一般女子身高均数不同; 某校女大学生身高均数与一般女子身高均数差别有 显著性。
α是在统计推断时,预先设定的一个小概率值,是当 H0为真时,允许错误地拒绝H0的概率,是检验水准。
P值是由实际样本决定的,是指从由H0所规定的总 体中随机抽样,获得大于及等于(或小于)现有样本检 验统计量值的概率。
5、两类错误(I型错误 与Ⅱ型错误 )
统计推断可能出现的4种结果
拒绝H0,接受H1
H0为真
α是在统计推断时,预先设定的一个小概率值,是当H0 为真时,允许错误地拒绝H0的概率。
双侧与单侧检验界值比较
(2) 选定适当的检验方法,计算检验
统计量值 t 检验 Z 检验
设计类型 资料的类型和分布 统计推断的目的 n的大小 如完全随机设计实验中,已知样本均数
与总体均数比较,n又不大,可用t检验, 计算统计量t值。
I型错误 (α)
(假阳性错误)
不拒绝H0
推断正确 (1-α)
(可信度)
H0为假 推断正确 (1-β) Ⅱ型错误 (β)
(检验效能、把握度) (假阴性错误)
无效假设(H型错误与Ⅱ型错误):
Ⅰ型错误:H0原本是正确的
假阳性错误 误诊
拒绝H0 弃真
用α 表示
=0.05
▲ 计算统计量:Z 统计量: Z= ▲ 确定概率值:
x 0 Sx
|Z|=9.58 Z = 1.96 |Z|> Z p < =0.05;
▲ 做出推论:
Z= 9.58> 1.96, p < 0.05 = , 小概率事件发生 了,原H0假设不成立;拒绝H0 , 接受H1, 可认为: 某校女大学生身高均数与一般女子身高均数不同; 某校女大学生身高均数与一般女子身高均数差别有 显著性。
α是在统计推断时,预先设定的一个小概率值,是当 H0为真时,允许错误地拒绝H0的概率,是检验水准。
P值是由实际样本决定的,是指从由H0所规定的总 体中随机抽样,获得大于及等于(或小于)现有样本检 验统计量值的概率。
5、两类错误(I型错误 与Ⅱ型错误 )
统计推断可能出现的4种结果
拒绝H0,接受H1
H0为真
α是在统计推断时,预先设定的一个小概率值,是当H0 为真时,允许错误地拒绝H0的概率。
双侧与单侧检验界值比较
(2) 选定适当的检验方法,计算检验
统计量值 t 检验 Z 检验
设计类型 资料的类型和分布 统计推断的目的 n的大小 如完全随机设计实验中,已知样本均数
与总体均数比较,n又不大,可用t检验, 计算统计量t值。
I型错误 (α)
(假阳性错误)
不拒绝H0
推断正确 (1-α)
(可信度)
H0为假 推断正确 (1-β) Ⅱ型错误 (β)
(检验效能、把握度) (假阴性错误)
无效假设(H型错误与Ⅱ型错误):
Ⅰ型错误:H0原本是正确的
假阳性错误 误诊
拒绝H0 弃真
用α 表示
医学统计学-假设检验
差别有统计学意义,可以认为病毒性肝炎患者的转 铁蛋白含量较低。
3.4 两组资料比较的u检验
➢当随机抽样的样本例数足够大时,t检验统计 量的自由度逐渐增大,t分布逐渐逼近于标准 正态分布,可以利用近似正态分布的原理进 行u检验。
u XA XB sX A X B
XA XB sA2 nA sB2 nB
1 假设检验的基本思想
➢提出一个假设 ➢如果假设成立,得到现有样本的可能性
➢可能性很小(小概率事件),在一次试验中本不 该得到,居然得到了,说明我们的假设有问题, 拒绝之。
➢有可能得到手头的结果,故根据现有的样本无法 拒绝事先的假设(没理由)
例1
样本:随机抽查25名男炊事员的血清总胆固 醇 , 求 得 其 均 数 为 5.1mmol/L , 标 准 差为0.88mmol/L。
假设检验的基本思想:女士和奶
➢ 女士说她可以辨认出加奶和水的顺序 ➢ 事先假设:她在耍我们,每次她都在瞎猜 ➢ 现在给她对十杯牛奶做出判断 ➢ 如果她是瞎猜的,却全部正确,几率为0.510≈0.001 ➢ 0.001是小概率,认为不会发生(即10次全猜对是
不可能的) ➢ 现在试验的结果是十杯全部说对了 ➢ 故断定假设不成立
布
F
s12 (大) s22 (小)
~ F( ,1 , 2 )
方差齐性检验
男性组
12=?
➢除抽样误差外,该单位食堂炊事员与健康男性存 在本质上的差异:偷东西吃?。(必然的、大于 随机误差)
➢两种情况只有一个是正确的,且二者必居其 一,需要我们作出推断。
假设检验的一般步骤
➢步骤1:建立假设 ➢在假设的前提下有规律可寻
➢零假设(null hypothesis),记为H0,表示目前的 差异是由于抽样误差引起的。
3.4 两组资料比较的u检验
➢当随机抽样的样本例数足够大时,t检验统计 量的自由度逐渐增大,t分布逐渐逼近于标准 正态分布,可以利用近似正态分布的原理进 行u检验。
u XA XB sX A X B
XA XB sA2 nA sB2 nB
1 假设检验的基本思想
➢提出一个假设 ➢如果假设成立,得到现有样本的可能性
➢可能性很小(小概率事件),在一次试验中本不 该得到,居然得到了,说明我们的假设有问题, 拒绝之。
➢有可能得到手头的结果,故根据现有的样本无法 拒绝事先的假设(没理由)
例1
样本:随机抽查25名男炊事员的血清总胆固 醇 , 求 得 其 均 数 为 5.1mmol/L , 标 准 差为0.88mmol/L。
假设检验的基本思想:女士和奶
➢ 女士说她可以辨认出加奶和水的顺序 ➢ 事先假设:她在耍我们,每次她都在瞎猜 ➢ 现在给她对十杯牛奶做出判断 ➢ 如果她是瞎猜的,却全部正确,几率为0.510≈0.001 ➢ 0.001是小概率,认为不会发生(即10次全猜对是
不可能的) ➢ 现在试验的结果是十杯全部说对了 ➢ 故断定假设不成立
布
F
s12 (大) s22 (小)
~ F( ,1 , 2 )
方差齐性检验
男性组
12=?
➢除抽样误差外,该单位食堂炊事员与健康男性存 在本质上的差异:偷东西吃?。(必然的、大于 随机误差)
➢两种情况只有一个是正确的,且二者必居其 一,需要我们作出推断。
假设检验的一般步骤
➢步骤1:建立假设 ➢在假设的前提下有规律可寻
➢零假设(null hypothesis),记为H0,表示目前的 差异是由于抽样误差引起的。
医学统计学 第五讲 计量资料的统计推断-假设检验
可计算出样本标准误:3.8/10=0.38
(3) n = 100;
假设检验:
▲ 建立假设: 检验假设:某校女大学生身高均数与一般女子身高 均数相同; H0:μ=μ 0; 备择假设 :某校女大学生身高均数与一般女子身高 均数不同; H1:μ≠μ0
▲ 确定显著性水平( ):0.05
24
▲ 计算统计量:u 统计量: u = ▲ 确定概率值:
25
二、小样本 已知中学一般男生的心率平均为74次/分钟。 为了研究常参加体育锻炼的中学生心脏功能
是否与一般的中学生相同,在某地区中学生
中随机抽取常年参加体育锻炼的男生16名,
测量他们的心率,得平均心率为65.63次/分钟,
标准差为7.2次/分钟。
▲目的:比较一个小样本均数所代表的未知总 体均数与已知的总体均数有无差别。
20
一、样本均数与总体均数的比较
实质是一个未知总体与一个已知总体均数的比较
(一)、大样本
一般女性平均身高160.1 cm。某大学 随机抽取100名女大学生,测量其身高,身 高的均数是163.74cm,标准差是3.80cm。 请问某大学18岁女大学生身高是否与一般 女性不同。
21
▲目的:比较样本均数所代表的未知总体均数 与已知的总体均数有无差别
(3)计算统计量
根据资料类型与分析目的选择适当的
方法,使用适宜的公式计算出统计量,比
如计量资料分析常用 u 、t 或F检验。
注意:在检验假设成立的情况下,才 会出现的分布类型或公式。
(4)确定概率值(P)
将计算得到的u值或 t值与查表得到u或t,ν , 比较 ,得到 P值的大小。 根据u分布和t分布我们知道,
n4
. . . . . .
医学统计学:第七章 分类资料的假设检验
H0成立时, 304例老年胃溃疡患者中胃出血发生人数的分布 14
1.建立假设,确定检验水准
H0 : 0 0.2 H1 : 0
单侧 0.05
2.计算累统计量 u 值
0 0.20, n 304, p 0.3158
u p 0 0.3158 0.2 5.05
0 (1 0 )
H0(λ =3)成立时, 每毫升水中大肠杆菌数的概率分布 26
1.建立假设,确定检验水准 H0: 0 3 H1: 0 单侧 α=0.05 2. 计算累计概率 P 值,做出推断结论 需求 1ml 水样中至少有 5 个大肠杆菌的概率
P( X 5) 1 P(0) P(1) P(2) P(3) P(4) 0.1847
P( X 2) 1 e0.15 0.150 e0.15 0.151 1 P(0) P(1) 0.0102
0!
1!
P<0.05,按 α=0.05 检验水准拒绝 H0,接受 H1,可以认为该批疫苗的严重反应率高于一般。
25
例8 卫生标准规定, 生活饮用水大肠杆菌数不 得超过3个/ml。现对某饮用水进行抽检,抽取 1ml水样培养得到5个大肠杆菌。问该水样中 的大肠杆菌是否超标?
接受 H1,故可认为双亲中只有一方患高血压与双亲均患
高血压的子代中高血压患病率不同。
18
例6 某研究者在某地区随机抽取10岁儿 童100人,20岁青年120人,检查发现10岁 儿童中有70人患龋齿,20岁青年中有60人 患龋齿,问该地区10岁儿童与20岁青年患 龋齿率是否相等?
p1=70/100=0.70 p2=60/120=0.50 pc =(70+60)/(100+120)=0.5909
u
X1 X2
1.建立假设,确定检验水准
H0 : 0 0.2 H1 : 0
单侧 0.05
2.计算累统计量 u 值
0 0.20, n 304, p 0.3158
u p 0 0.3158 0.2 5.05
0 (1 0 )
H0(λ =3)成立时, 每毫升水中大肠杆菌数的概率分布 26
1.建立假设,确定检验水准 H0: 0 3 H1: 0 单侧 α=0.05 2. 计算累计概率 P 值,做出推断结论 需求 1ml 水样中至少有 5 个大肠杆菌的概率
P( X 5) 1 P(0) P(1) P(2) P(3) P(4) 0.1847
P( X 2) 1 e0.15 0.150 e0.15 0.151 1 P(0) P(1) 0.0102
0!
1!
P<0.05,按 α=0.05 检验水准拒绝 H0,接受 H1,可以认为该批疫苗的严重反应率高于一般。
25
例8 卫生标准规定, 生活饮用水大肠杆菌数不 得超过3个/ml。现对某饮用水进行抽检,抽取 1ml水样培养得到5个大肠杆菌。问该水样中 的大肠杆菌是否超标?
接受 H1,故可认为双亲中只有一方患高血压与双亲均患
高血压的子代中高血压患病率不同。
18
例6 某研究者在某地区随机抽取10岁儿 童100人,20岁青年120人,检查发现10岁 儿童中有70人患龋齿,20岁青年中有60人 患龋齿,问该地区10岁儿童与20岁青年患 龋齿率是否相等?
p1=70/100=0.70 p2=60/120=0.50 pc =(70+60)/(100+120)=0.5909
u
X1 X2
医学统计学第3版 第7章 假设检验
检验形式 双侧检验 单侧检验 目的 是否0 是否>0 是否<0 H0 H1
=0 =0 =0
0 >0 <0
建立检验假设,确定检验水准
检验水准(significance level),以表示
习惯上取 =0.05或0.01 是小概率事件在本次假设检验中发生的界值标 准 应在设计时根据专业知识和研究目的,在进行 假设检验前设定
选定适当的检验方法,计算相应统计量。 依据:
分析目的 设计方法 变量类型 已知条件
选定检验方法,计算检验统计量
本例:
分析目的:高原地区成年男子平均Hb量高于一 般人群,即 >0 设计方法:调查设计 变量类型:定量资料 已知条件: 0=140g/L;n=25,x=155g/L, s=24g/L;未知
P=P(t≥t*)
确定P值,作出统计推断
X- 155-140 =4.8412 = t = s x 24/ 60
=59
P =P(t 4.8412)<0.0005
●
●
1.6714.841
确定P值,作出统计推断
若P,表示在H0成立的条件下,出现等 于及大于现有统计量的概率是小概率,按 小概率事件原理现有样本信息不支持H0, 因而拒绝H0。
不拒绝H0 II 型错误
未知
1. ,
2. , 3. , 4. n ,
的影响因素
假设检验需要注意的问题
数据应来自设计科学的实验或调查
样本的代表性 可比性/均衡性:比较的基础
数据应该满足假设检验方法的前提条件 正确理解假设检验中概率值的含义
差异有统计学意义与差异大小的区别
假设检验的分类
根据假设的对象
参数检验—对总体参数提出假设 非参数检验—对总体分布提出假设
=0 =0 =0
0 >0 <0
建立检验假设,确定检验水准
检验水准(significance level),以表示
习惯上取 =0.05或0.01 是小概率事件在本次假设检验中发生的界值标 准 应在设计时根据专业知识和研究目的,在进行 假设检验前设定
选定适当的检验方法,计算相应统计量。 依据:
分析目的 设计方法 变量类型 已知条件
选定检验方法,计算检验统计量
本例:
分析目的:高原地区成年男子平均Hb量高于一 般人群,即 >0 设计方法:调查设计 变量类型:定量资料 已知条件: 0=140g/L;n=25,x=155g/L, s=24g/L;未知
P=P(t≥t*)
确定P值,作出统计推断
X- 155-140 =4.8412 = t = s x 24/ 60
=59
P =P(t 4.8412)<0.0005
●
●
1.6714.841
确定P值,作出统计推断
若P,表示在H0成立的条件下,出现等 于及大于现有统计量的概率是小概率,按 小概率事件原理现有样本信息不支持H0, 因而拒绝H0。
不拒绝H0 II 型错误
未知
1. ,
2. , 3. , 4. n ,
的影响因素
假设检验需要注意的问题
数据应来自设计科学的实验或调查
样本的代表性 可比性/均衡性:比较的基础
数据应该满足假设检验方法的前提条件 正确理解假设检验中概率值的含义
差异有统计学意义与差异大小的区别
假设检验的分类
根据假设的对象
参数检验—对总体参数提出假设 非参数检验—对总体分布提出假设
医学统计学 假设检验
2023/12/7
计量资料的统计推断
30
t检验注意事项
4. 假设检验的结论不能绝对化
不能拒绝H0,有可能是样本数量不够 拒绝H0 ,有可能犯第Ⅰ类错误
3 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54
4 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98
5 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76
6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60
(X1 X1)2 (X2 X2)2 n1 n2-2
例 3-9 白血病组 ( X1) :12.3 13.2 13.7 15.2 15.4 15.8 16.9 正常组 ( X 2 ) : 10.8 11.6 12.3 12.7 13.5 13.5 14.8
问正常鼠和白血病鼠脾脏中 DNA 平均含量(mg/g)是否不同?
5.41
0.04
2.06
1.24
0.82
1.64
1.83
-0.19
1.06
1.45
-0.39
0.77
0.92
-0.15
--
--
1.34
d2
0.1521 0.0196 0.7569 0.0400 0.0196 0.2401 0.5184 0.0016 0.6724 0.0361 0.1521 0.0225 2.6314
3. 自身对比。即同一受试对象处理前后的结果进行比 较。
2023/12/7
计量资料的统计推断
19
二、配对样本t 检验
目的:判断不同的处理是否有差别
假设检验-医学统计学
▪ 有可能得到手头的结果,故根据现有的样本无法拒绝事先的假设。
12
假设检验的一般思想
假设检验的意义 假设检验的基本思想 假设检验的一般步骤
定量资料均数的t检验
样本均数与总体均数比较的 t 检验 两个样本均数的 t 检验 配对样本的 t 检验 t 检验的应用条件 假设检验应用的注意事项
13
样本:随机抽查25名男炊事员的血清总胆固醇,求得其均数为 5.1mmol/L,标准差为0.88mmol/L。
▪ 医学统计学
1
假设检验的一般思想
假设检验的意义 假设检验的基本思想 假设检验的一般步骤
定量资料均数的t检验
样本均数与总体均数比较的 t 检验 两个样本均数的 t 检验 配对样本的 t 检验 t 检验的应用条件 假设检验应用的注意事项
2
假设检验的一般思想
假设检验的意义 假设检验的基本思想 假设检验的一般步骤
总体参数
未知
样本统计量
统计 推断
已知
风险
总体Α是100例正常成年男子的血红蛋白(单位:g/L),从中随机抽
取从样中本随机a1抽和取样样本本ab2
;总体B是另外100例正常成年男子的血红蛋白, ;三个样本的含量均为10例,有关数值如下:
µ
σ
a1/b1
a2
A
130
7.5
131.9
128.3
B
140
8.2
138.2
6
▪ 在知道A和B总体的参数时
a1-a2 a1-b1
抽样误差 本质差别
7
▪ 假如事先不知道A和B是不是同一个总体
a1-b1
抽样误差
?
本质差别
A=B A≠B
12
假设检验的一般思想
假设检验的意义 假设检验的基本思想 假设检验的一般步骤
定量资料均数的t检验
样本均数与总体均数比较的 t 检验 两个样本均数的 t 检验 配对样本的 t 检验 t 检验的应用条件 假设检验应用的注意事项
13
样本:随机抽查25名男炊事员的血清总胆固醇,求得其均数为 5.1mmol/L,标准差为0.88mmol/L。
▪ 医学统计学
1
假设检验的一般思想
假设检验的意义 假设检验的基本思想 假设检验的一般步骤
定量资料均数的t检验
样本均数与总体均数比较的 t 检验 两个样本均数的 t 检验 配对样本的 t 检验 t 检验的应用条件 假设检验应用的注意事项
2
假设检验的一般思想
假设检验的意义 假设检验的基本思想 假设检验的一般步骤
总体参数
未知
样本统计量
统计 推断
已知
风险
总体Α是100例正常成年男子的血红蛋白(单位:g/L),从中随机抽
取从样中本随机a1抽和取样样本本ab2
;总体B是另外100例正常成年男子的血红蛋白, ;三个样本的含量均为10例,有关数值如下:
µ
σ
a1/b1
a2
A
130
7.5
131.9
128.3
B
140
8.2
138.2
6
▪ 在知道A和B总体的参数时
a1-a2 a1-b1
抽样误差 本质差别
7
▪ 假如事先不知道A和B是不是同一个总体
a1-b1
抽样误差
?
本质差别
A=B A≠B
医学统计学:5假设检验
n P X
n
检验假设为:
H0 : 0 H1 : 0
当H0成立时,检验统计量为:
Z
X n 0
n 0 1 0
~
N 0,1
Z
p 0
0 1 0
~
N 0,1
n
当n不太大时,需作连续性校正:
Z
X n 0 0.5
n 0 1 0
~
N
0,1
Z
p 0
0.5 n
0 1 0
~
N 0,1
这表明在自然情况下,25只鸭感染只数不超过1 只属于小概率事件,很难在一次实验中出现,故 在α=0.05水准上,拒绝H0,接受H1 ,差别有高 度统计学意义,可以认为药物对预防感染有效。
正态近似法
如果二项分布的π或1-π不太小,则当n足够大时, 即阳性数与阴性数都大于等于5时,近似地有
X ~ N (n , n 1 P ~ N , 1
它不成立。
❖小概率思想:是指小概率事件在一次随机试验中
认为基本上不会发生。
概率小于多少算小概率是相对的,在进行统计分
析时要事先规定,即检验水准。
二、假设检验的基本步骤:
例5-1 已知一般无肝肾疾患的正常人群尿素氮 均值为4.882mmol/L,16名脂肪肝患者的尿素 氮平均值为5.997mmol/L,标准差为 1.920mmol/L。问脂肪肝患者尿素氮测定值得 均数是否与正常人相同?
造成两者不等的原因:
①同一总体,即 0 但有抽样误差存在; ②非同一总体,即 0 存在本质上的差别,
同时有抽样误差存在。
0
0
0
0
XX
假设检验的基本步骤(采用反证法思想)
1、建立检验假设与单双侧 2、确定检验水准 3、选择检验方法并计算统计量 4、确定P值 5、作出推断结论
n
检验假设为:
H0 : 0 H1 : 0
当H0成立时,检验统计量为:
Z
X n 0
n 0 1 0
~
N 0,1
Z
p 0
0 1 0
~
N 0,1
n
当n不太大时,需作连续性校正:
Z
X n 0 0.5
n 0 1 0
~
N
0,1
Z
p 0
0.5 n
0 1 0
~
N 0,1
这表明在自然情况下,25只鸭感染只数不超过1 只属于小概率事件,很难在一次实验中出现,故 在α=0.05水准上,拒绝H0,接受H1 ,差别有高 度统计学意义,可以认为药物对预防感染有效。
正态近似法
如果二项分布的π或1-π不太小,则当n足够大时, 即阳性数与阴性数都大于等于5时,近似地有
X ~ N (n , n 1 P ~ N , 1
它不成立。
❖小概率思想:是指小概率事件在一次随机试验中
认为基本上不会发生。
概率小于多少算小概率是相对的,在进行统计分
析时要事先规定,即检验水准。
二、假设检验的基本步骤:
例5-1 已知一般无肝肾疾患的正常人群尿素氮 均值为4.882mmol/L,16名脂肪肝患者的尿素 氮平均值为5.997mmol/L,标准差为 1.920mmol/L。问脂肪肝患者尿素氮测定值得 均数是否与正常人相同?
造成两者不等的原因:
①同一总体,即 0 但有抽样误差存在; ②非同一总体,即 0 存在本质上的差别,
同时有抽样误差存在。
0
0
0
0
XX
假设检验的基本步骤(采用反证法思想)
1、建立检验假设与单双侧 2、确定检验水准 3、选择检验方法并计算统计量 4、确定P值 5、作出推断结论
医学统计学假设检验
I类错误 (α)
推断正确
推断正确
II类错误 (β)
10
五、双侧检验与单侧检验 1. 同一组数据,采用单侧与双侧检验,可能导致不同的结论。 如下图
2.对于一个实际问题,究竟应采用双侧还是单侧检验,需要 根据问题本身的专业意义来确定,并且应在设计阶段就事 先确定。
11
样本均数的假设检验
一、一个样本均数的假设检验 设有两个正态总体N(μ0,σ2) 、N(μ,σ2) ,其总
的心率相同。 H1:μ≠μ0 即假设常年参加锻炼的中ห้องสมุดไป่ตู้男生与一般中学男
生的心率不同。 确定检验水准α=0.05。
2).选择统计量并计算其值:
uX0 6574 16.67 n 5.4 100
3).根据检验统计量的性质,选择适当的统计表,查出相应的 界值 u0.05/2 1.96。现经计算所得的
u16.671.96
,
2 2
已知时,用u (z)检验,其统计量为
: u X1 X2
X1X2
其中:
X1X2
12 22
n1 n2
15
2.总体方差
2 1
,
2 2
未知时,分大、小样本两种情况。
1)对于大样本,用u (z)检验,其统计量为:
其中:
u X1 X2 S X1X2
S X1X2
S12 S22 n1 n2
26
t X0 n1
Sn
例1 例2
13
二、两个样本均数的假设检验
设有两个正态总体 ,已知两个样本均数和样 本标准差
N
(
1
,
2 1
)
μ1未知
从中抽取一个 含量为n1的样本
医学统计学:假设检验
THANKS
谢谢您的观看
04
假设检验的常见错误与注意 事项
第一类错误与第二类错误
第一类错误
当原假设为真时,拒绝原假设,即错误地认 为原假设是错误的。其概率通常用α表示, 也称为显著性水平。
第二类错误
当原假设为假时,不拒绝原假设,即错误地 认为原假设是正确的。其概率通常用β表示
。ห้องสมุดไป่ตู้
差异检验与趋势检验的注意事项
• 差异检验:主要用于比较两组或多组数据的均值是否存在显著差异。注意事项包括 • 确定样本是否独立:在进行t检验或方差分析时,样本应是独立取得的,否则将影响结果的准确性。 • 确定总体方差是否已知:在进行t检验时,如果总体方差未知,则应采用t'检验或Welch t检验。 • 正确理解p值:p值是假设检验的核心,它表示观察到的数据与原假设之间的矛盾程度。一般来说,如果p值
04 第四步
根据样本数据和临界值进行推断。 如果检验统计量大于临界值,则拒 绝原假设;如果检验统计量小于临 界值,则不拒绝原假设。
假设检验的意义与应用
意义
假设检验是统计学中最重要的方法之一,它可以帮助我们科 学地推断样本数据所反映的总体的性质,从而为科学研究提 供依据。
应用
假设检验广泛应用于各个领域,如医学、社会科学、自然科 学等。在医学领域中,假设检验被广泛应用于临床试验、流 行病学研究、病因学研究等方面。
要点三
多因素方差分析:这种检验方法用于 比较两个或更多个分类变量的均值是 否存在显著差异。多因素方差分析常 用于研究多个分类变量对连续变量的 影响,其中每个分类变量的取值均为 两个或更多水平。
回归分析
回归分析是一种常用的统计分析方法 ,主要用于研究连续变量与分类变量 之间的关系。在回归分析中,我们需 要确定回归系数以及它们的显著性水 平,以揭示自变量对因变量的影响程 度和方向。
医学统计学 假设检验的基本概念
1
P
t / 2,
t t /2,
若 P ,按所取检验水准 ,拒绝H0 , 接受H1 ,下“有差别”的结论。其统计学依 据是,在 H0 成立的条件下,得到现有检验结 果的概率小于 ,因为小概率事件不可能在 一次试验中发生,所以拒绝 H0 。
若 P ,不拒绝H0,但不能下 “无差别”或“相等”的结论,只能下
造成 X 0 的可能原因有二:
① 抽样误差造成的; ② 本质差异造成的。
假 设 检 验 的 目 的 —— 就 是 判 断 差 别 是由哪种原因造成的。
一种假设H0
一般新生儿头围
34.50cm
另一种假设H1
抽样误差
X 33.89cn
总体不同
矿区新生儿头围
34.50cm
二、假设检验的基本步骤
例8–1 通过以往大规模调查,已知某地一 般新生儿的头围均数为34.50cm,标准 差为1.99cm。为研究某矿区新生儿的发 育状况,现从该地某矿区随机抽取新生 儿55人,测得其头围均数为33.89cm, 问该矿区新生儿的头围总体均数与一般 新生儿头围总体均数是否不同?
1.建立检验假设,确定检验水准(选用单侧或双侧检验)
例8–1 通过以往大规模调查,已知某地一般新 生儿的头围均数为34.50cm,标准差为1.99cm。 为研究某矿区新生儿的发育状况,现从该地某 矿区随机抽取新生儿55人,测得其头围均数为 33.89cm,问该矿区新生儿的头围总体均数与 一般新生儿头围总体均数是否不同?
本例: 0 34.50cm, , X 33.89cm
先规定的概率值,它确定了小概率事件的
标准。在实际工作中常取 = 0.05。可根据
不同研究目的给予不同设置。
H0: 34.50(该矿区新生儿的头围与当地一般新生儿头围均数相同) H1: 34.50 (该矿区新生儿的头围与当地一般新生儿头围均数不同) 0.05
06参数估计与假设检验(医学统计学)
三、总体均数的区间估计
(一) 已知
95%可信区间:
一般情况
其中 为标准正态分布的双侧界值。
(二) 未知
Confidence interval
通常未知,这时可以用其估计量S 代替,但
已不再服从标准正态分布,而是服从
著名的t 分布。
William Gosset
图6-1 不同自由度的 t 分布图
t分布
四、两总体均数差的区间估计
实际中,有时需要计算两个总体均数差值的可信 区间,例如通过计算两种降压药物平均降压的差 值比较两种药物的差别,其双侧 100(1 )%可信 区间的计算公式为 ( X1 X 2 ) t /2, SX1X2 其中, n1 n2 2 为自由度,SX1X2 为两样本均数之 差的标准误。
样本率来代替总体率,其估计值为:
p(1 p)
Sp
n
二、参数估计
点估计: 是使用单一的数值直接作为总体参数的估 计值,如用估计相应的,用估计相应的。该法表 达简单,但未考虑抽样误差的影响,无法评价参 数估计的准确程度。
区间估计(interval estimation)是指按预先给定的概 率,计算出一个区间,使它能够包含未知的总体 均数。事先给定的概率称为可信度,计算得到的 区间称为可信区间(confidence interval,CI)。
n
250
六、两总体率差值的区间估计
在大样本情况下,可采用正态近似法对两总体率 差值进行可信区间估计,其计算公式为:
( p1 p2 ) z S /2 )( n1
1 n2
),pc =
X1 n1
X2 n2
X1和X2分别表示两组中某事件发生的例数。
例6-7 某医院口腔科医生用极固宁治疗牙本质过 敏症,以双氟涂料作对照,进行了1年的追踪观察 ,结果见表6-1所示,试估计两组有效率差别95% 的可信区间。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
自由度也需要校正
F 检验(两总体) Levene 检验 Bartlett 检验
������ =
2(大) ������1
1.B-要求正态分布 L-不依赖总体分布 2.随机分布在残差 0 上下, 无任何特殊结构, 不存在异常点 1.T 在界值范围内,则 P>概率 2.左侧找较小样本量,上方找两组例数差值 3.当������1 < 10; ������2 − ������1 ≤ 10:查表
������ = ������������
������������组间
组内
1.方差不齐:数据变换;非参数检验 2.纵标目:分子自由度,横标目:分母自由 度 3.偏态资料:对数变换、平方根变换、角度 变换 敏感,激进 ������0 成立也可以进行比较 可以对感兴趣的两组进行比较 应用广;保守;调整检验水准 探索性;一般性分析 多组均数与指定组均数比较 ������������ (存在多组相同秩次) ������������ = ������ 1 − ∑ (������������3 − ������������ )/(������ 3 − ������)
������������������ (非参数) 析因设计 ANOVA ������������ = ������������ A ������������ =
������������
SE
析因设计 (多因素 设计) 重复测量 设计
分析多个因素之 间相互作用
比较主效应和 交互效应的总 体差异
正态分布 方差齐性(残差图) 独立性 每组每个时点资料 分别服从各自对应 正态分布方差齐
1 1 √������������误 (������ +������ ) ������ ������
������ = ������组内 = ������ − ������ Bonfferoni 法 SNK Dunnett-t 比较多个总体 分布 非正态分布 方差不齐 偏峰分布 比较两两分布 随机区组 设计 对重要的非实验 因素控制 比较处理因素 和区组因素 K-W 检验有意义 方差齐性,正态性 同区组内不独立 Bonfferoni 法 多因素 ANOVA ������������������ (近似正态法) ������ =
配对设计
二分类 (2*2) (不 相互独立)
比较概率分布
������ + c ≥ 40
McNemar 检验
������ 2 =
(������−������)2 b+c
, ν=1
误用一般四格表������ 2 会增大 II 类错误
������ + c < 40 独立多组 二分类 (R*2) (分 组变量多于 2 组) 概率分布两两 比较 无 序 多 分 类 (R*C) 比较概率分布 ������������������ < 5 个 数 不 超 过 总格子 1/5;不能有 1 个������������������ < 1 有 序 多 分 类 (R*C) 比较总体分布 有序分类变量 相持不多 ������ 2 检验有意义 比较概率分布
������ = ������ ������
̅̅̅̅ ̅̅̅̅ ������ −������ ������
̅̅̅̅̅ ̅̅̅̅̅ ������ ������ −������ ������
(参数)
计算调整检验水准,最为保守,犯 I 型错误 的概率最低;比较次数超过 10 次以上,不 建议采用 ������A = a − 1 ������B = ������ − 1 ������AB = (������ − 1)(������ − 1) ������误差 = ������������(������ − 1) 主效应 = 相加⁄2 交互效应 = 相减⁄2 1. 不同时间点处理组之间的总体均数差异 不全相同 2.两两比较:用 Bonforroni 成组 t 检验,比 较校正α
正态近似法
Z
������������ =
������ √������
(c < 1)(出现较多相持情况时)
配对 t 检验
������ = ������
̅ ������ ⁄ ������ √������
可替代随机区组设计的方差分析,|������| = ������
������ = ������ − 1
Pearson������ 2 检验
������ 2 = ∑������ ������=1 ������ = 1
(������������ −������������ )2 ������������
������ 2 只看单侧卡方值
������ ≥ 40 1 ≤ ������������������ < 5
随机样本
������ = ������������
������������处理
误差
������
������处理 = k − 1 ������区组 = ������ − 1 ������误差 = (������ − 1)(������ − 1) 方差不齐 Friedman 秩和检验 (M 检验) ̅ ������ = ∑ ������������ − ������ ������ = ������ − 1(������ 2 分布) 当超出界值表时, 可近似������ 2 检验; 对于相同
������ = ������1 + ������2 − 2
1
Sorted by SYSUCC Seele NERV
设计 正态分布 方差不齐 比较方差齐性
2 2 ������1 = ������2
校正 t 检验
������ ‘ =
̅̅̅̅ ̅̅̅̅ ������1 −������ 2
������2 ������2 √ 1+ 2 ������1 ������2
样本分别 相加后 作为
������ =
������1 −������2 √������1 −������2
1. ������ = ������ 2 2.Poisson 分布可加性原理 3.当λ = 20时,接近正态分布
2
数、放射性核素等) 正态分布检验 每组资料<20
Sorted by SYSUCC Seele NERV
������−������0 ������������ ������(1−π) ������
假设检验 Z 检验
计算统计量 ������ =
̅ −������0 ������ ������ ⁄ √������
其他
������������ ̅ = ������⁄√������ t 检验 ������ =
连 续 性 校 正 ������ 2 检 验 (Yates’correction)
校正������ 2
4
Sorted by SYSUCC Seele NERV
������ < 40,或至少存在 一个������������������ < 1
Fisher 确切概率法
P
1. 将小于或等于样本观察值概率的所有可 能结局求和 2.不属于������ 2 范畴,但作为������ 2 的补充
̅ −������0 ������ ������⁄√������
1.自由度不同对应的 90、95、99%界值不同 2.非正态总体 n≥30 时,样本均数服从正态 分布 IC 直接查表
������������ ̅ = ������ ⁄√������ ������ = ������ − 1 P
������������ = √ W 检验(灵敏) 矩法检验(保守)
Wilcoxon 符号秩和检 验
T(绝对值较小)
非正态分布 ������ > 25 Poisson 分布 比较均数 λ1 = ������2 Poisson 分布(菌落
正态近似法
������ =
������1 −������2 ������������
������������ (出现较多相持情况时) 连续性校正 Z(25<n<50)
������������总 = ������������组间 + ������������组内 ������总 = ������ − 1 ������组间 = ������ − 1 ������组内 = ������ − ������ ������ =
̅̅̅̅ ̅̅̅̅ |������ 1 −������ 2|
Sorted by SYSUCC Seele NERV
假设检验:为了支持������������ 而进行,然而多希望得出拒绝������������ 的结论。 数据类型 定量资料 实验设计 完全随机 设计 样本情况 单 组 独立 样本 & 两样本 (n>30) 差 值 研究目的 比较均数 μ = ������0 数据情况 正态分布 方差齐性 总体标准差 (σ) 已知 正态分布 方差齐性 σ未知 比较频率 π = ������0 二项分布 观察结果相互独立 ������较大, ������π 和������(1 − π) > 5 累计概率 函数直 接计 算 P 值进行假设检验 Z 检验 ������ =
������������B ������������SE ������������AB ������������SE ������������1
SE1
������������������ = 重复测量 ANOVA (球形对称性,若不满 足则不能 进一步 分解 残差项)
分两样本连续取 值
比较时间效 应、 主效应、 交 互效应的总体 差异
正态性检验
������ < 50
1. ������ > 50样本均数近似服从正态分布,α取 0.1 或更大 2.n≥1000,可绘制 10-15 个组段直方图计 算各组段理论频数和实际频数实施拟合优 度