医学统计学假设检验
合集下载
8.医学统计学-假设检验(2学时)
① ② ③ ④ 如何衡量这25名儿童总胆固醇样本平均数的抽样误差? 估计25名儿童的胆固醇平均水平的95%可信区间 根据可信区间判断高胆固醇是否有家庭聚集性? 根据假设检验结果判断高胆固醇是否有家族聚集性?
假设检验的基本思想 α和P 假设检验的基本步骤 假设检验的两类错误 α和β 假设检验与可信区间的关系
/ 2,
t
t
/ 2,
t / 2,
x t / 2, Sx
x t / 2, S x x t / 2, S x
2
1
二、正态分布法(Z分布法)
当σ已知或n较大时(n>50),可采用正态分布法 总体率的区间估计:小样本用查表法;大样本,服
σ已知
2018/4/11
标准差与标准误的区别与联系
一、t分布法
标 准 差(S) 标 准 误( S X )
S n
t
1.表示个体变量值的变异度大小,即
( X X ) 2 n 1
1.表示样本均数抽样误差的大小,即样
当σ未知且n较小
X Sx
原 始 变 量 值 的 离 散 程 度 。 公 式 为 : 本均数的离散程度。公式为: S X
双侧置信区间
n较大时(n>50)
从正态分布的用正态近似法估计总体率的置信区间。 一、查表法
X Z / 2 x
X Z x
X Z x
X Z / 2 S x
X Z S x
X Z S x
小样本(n≤50),p较小时,查附表6,直接确定总 体率95%和99%的置信区间。 治疗N=30人,有效者X=5 ,估计有效率95%置信 区间
假设检验的基本思想 α和P 假设检验的基本步骤 假设检验的两类错误 α和β 假设检验与可信区间的关系
/ 2,
t
t
/ 2,
t / 2,
x t / 2, Sx
x t / 2, S x x t / 2, S x
2
1
二、正态分布法(Z分布法)
当σ已知或n较大时(n>50),可采用正态分布法 总体率的区间估计:小样本用查表法;大样本,服
σ已知
2018/4/11
标准差与标准误的区别与联系
一、t分布法
标 准 差(S) 标 准 误( S X )
S n
t
1.表示个体变量值的变异度大小,即
( X X ) 2 n 1
1.表示样本均数抽样误差的大小,即样
当σ未知且n较小
X Sx
原 始 变 量 值 的 离 散 程 度 。 公 式 为 : 本均数的离散程度。公式为: S X
双侧置信区间
n较大时(n>50)
从正态分布的用正态近似法估计总体率的置信区间。 一、查表法
X Z / 2 x
X Z x
X Z x
X Z / 2 S x
X Z S x
X Z S x
小样本(n≤50),p较小时,查附表6,直接确定总 体率95%和99%的置信区间。 治疗N=30人,有效者X=5 ,估计有效率95%置信 区间
医学统计学假设检验
T检验
双边检验
构造T统计量 T
X 0 S n
~ t (n 1)
X 0 由 P t 2 (n 1) S n 确定拒绝域 T t 2 (n 1) x 0 如果统计量的观测值 T t 2 (n 1) S n
如果统计量的观测值
2 0
~ (n)
2
由
2 (n) 或
2 2 2
2 1 2
(n)
则拒绝原假设;否则接受原假设
一个正态总体均值未知的方差检验
问题:设总体 假设
2
2检验
X~N(,2),未知
2 0 2 2 0
H0 : ; H1 : ; 双边检验 (n 1) S 2 2统计量 2 构造 ~ 2 (n 1) 由 2 0 2 2 2 2 P (n 1) , P (n 1)
~ N (0,1)
则拒绝原假设;否则接受原假设
例1 由经验知某零件的重量X~N(,2),=15, =0.05;技术革新后,抽出6个零件,测得重量为 (单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已 知方差不变,试统计推断,平均重量是否仍为15克? (=0.05)
引
言
统计假设——通过实际观察或理论分析对总体分布形式 或对总体分布形式中的某些参数作出某种 假设。 假设检验——根据问题的要求提出假设,构造适当的统 计量,按照样本提供的信息,以及一定的 规则,对假设的正确性进行判断。
基本原则——小概率事件在一次试验中是不可能发生的。
基本概念
引例:已知某班《应用数学》的期末考试成绩服从 正态分布。根据平时的学习情况及试卷的难易程度,估 计平均成绩为75分,考试后随机抽样5位同学的试卷, 得平均成绩为72分,试问所估计的75分是否正确? “全班平均成绩是75分”,这就是一个假设 根据样本均值为72分,和已有的定理结论,对EX=75 是否正确作出判断,这就是检验,对总体均值的检验。
医学统计学第7版假设检验步骤
医学统计学第7版假设检验步骤
1. 提出原假设(0)和备择假设(1)
- 原假设通常是要被检验的陈述
- 备择假设是原假设被拒绝时要接受的陈述
2. 选择适当的检验统计量及其在原假设为真时的概率分布
3. 确定显著性水平α
- 通常取0.05或0.01,表示拒绝原假设的最大概率
4. 根据样本数据计算检验统计量的观测值
5. 确定拒绝域
- 拒绝域是原假设被拒绝的取值范围
- 通常利用显著性水平α从概率分布中确定拒绝域
6. 进行判断
- 若观测值落在拒绝域内,拒绝原假设
- 若观测值落在保留域内,无法拒绝原假设
7. 陈述结论
以上是我对医学统计学第7版假设检验步骤的总结,没有直接引用书中内容,希望对您有所帮助。
医学统计学课件:假设检验
统计推断基础
参数估计
用样本数据估计总体参数的方法。
显著性检验
理解显著性检验的基本原理和方法。
假设检验
根据样本数据对总体参数进行检验的方法。
置信区间
掌握置信区间的概念和计算方法。
03
参数假设检验
单参数假设检验
定义
单参数假设检验是当我们只有一个总 体参数需要检验时的假设检验。例如 ,我们可能需要确定一个药物是否对 一组患者的平均血压有降低作用。
应用场景:例如,检验某种新药的疗效是否显著优于安 慰剂。
案例二:两样本t检验
总结词:两样本t检验是一种常用的假设检验方 法,适用于比较两个独立样本的平均数是否存在 显著差异。
详细描述
1. 定义假设:通常包括零假设(H0,即两个样本的 平均数无差异)和对立假设(H1,即两个样本的平 均数存在差异)。
02
假设检验的数学基础
概率基础
概率定义
表示随机事件发生的可能性程度。
概率运算
掌握加法、乘法和条件概率等运算方法。
独立性和互斥性
理解事件之间的独立性和互斥性。
分布基础
分布定义
描述随机变量取值的概率规律。
连续型和离散型分布
理解连续型和离散型分布的概念和特点。
常用分布
掌握常用的分布及其性质,如正态分布、二项分布等。
假设检验步骤
根据符号分布,计算临界值和p值,判断假设是 否成立。
05
假设检验的注意事项与误用
假设检验的注意事项
明确研究目的和背 景
在假设检验前,需要明确研究目 的和背景,以便确定合适的假设 和检验方法。
合理选择样本量和 样本类型
样本量和样本类型的选择对假设 检验的结果具有重要影响。在确 定样本量时,需要考虑研究目的 、研究设计、误差概率等因素。
医学统计学第七、八章 假设检验的基本概念和t检验
S x 1 − x 2 为两样本均数差值的标准误
Sx −x
1
2
⎛1 1⎞ ⎟ = S ⎜ + ⎜n n ⎟ 2 ⎠ ⎝ 1
2 c
在两总体方差相等的条件下,可将两方差合并, 求合并方差(pooled variance) S c2
2 ⎡ ( Σ x1 ) ⎤ 2 ⎢ Σ x1 − ⎥ + n1 ⎦ ⎣ = n1 − 1 + 2 ⎡ ( Σx2 ) ⎤ 2 ⎢Σ x2 − ⎥ n2 ⎦ ⎣ n2 − 1
t 检验的应用条件:
① 单样本t检验中,σ 未知且n 较小,样本取自 正态总体; ② 两小样本均数比较时,两样本均来自正态分 布总体,两样本的总体方差相等;若两总体 方差不齐可用t’检验; ③ 两大样本均数比较时,可用Z检验。
1、样本均数与总体均数比较的 t 检验
• 使用范围:用于样本均数与已知总体均数(一 般为理论值、标准值或经过大量观察所得的稳 定值等)的比较。 • 分析目的:推断样本所代表的未知总体均数 μ 与已知总体均数 μ0有无差别。 • 若 n 较大,则 tα .ν ≈ tα .∞ , 可按算得的 t 值用 v = ∞ 查 t 界值表( t 即为 Z )得P值。
回到例子:
2.计算统计量
已知μ0= 3min,n=50, X=4min
4−3 t= = 4 .7140 1 .5 / 50
υ = 50 − 1 = 49
3、确定 P 值,作出统计推断 根据算出的检验统计量如 t、z 值,查 相应的界值表,即可得到概率 P。 P值是在H0成立前提下,抽得比现有样 本统计量更极端的统计量值的概率。 P值越小只能说明:作出拒绝H0 ,接受 H1的统计学证据越充分。
X −μ X −μ 用公式:t = 或z = σX SX
医学统计学总体均数的估计与假设检验
均数的抽样误差: 抽样引起的样本均数与总体均数之间或样本均数 之间的差别。 标准误: 即样本均数的标准差。表示样本均数对总体均数的离散程度。
一、 均数的抽样误差与标准误( )
例4.1某市随机抽查12岁男孩100人,得身高均数139.6cm,标准差6.85cm,资料,求标准误?
第三章 总体均数的估计与假设检验
添加副标题
汇报人姓名
均数的抽样误差与标准误
t分布
总体均数的估计
假设检验的一般步骤
t检验
u 检验
两均数的等效检验
正态性检验
两样本方差齐性检验
假设检验时应注意的问题
利用总体均数的可信区间进行假设检验
课堂讨论
第三章 总体均数的估计与假设检验
一、 均数的抽样误差与标准误( )
等效检验的假设
七、两均数的等效检验
H0: | 1- 2| H1: | 1- 2|< 为等效界值,若两总体均数差值在范围内为等效,超过则为不等效。 是推断两种处理效果是否相近或相等的统计方法。 为什么推断两种处理效果是否相近或相等不能用前面所述的假设检验方法?
检验水准、自由度及结果判断同t检验。
=n- 1=25 -1=24 查t界值表(P804),得单侧 t0.05,24 = 1.711 因: t =1.833> t0.05,24 所以:P < 0.05
结论:按照 = 0.05水准,拒绝H0 ,故可认为该山区健康成年男子脉搏高于一般人群。
1
上例如用双侧检验,查表得双侧 t0.05,24 = 2.064
样本含量一定时,增大,则减少,减少则增大,所以, 的确定并不是越小越好,一般取0.05较合理。
结论时,尽可能明确相结合。
02
一、 均数的抽样误差与标准误( )
例4.1某市随机抽查12岁男孩100人,得身高均数139.6cm,标准差6.85cm,资料,求标准误?
第三章 总体均数的估计与假设检验
添加副标题
汇报人姓名
均数的抽样误差与标准误
t分布
总体均数的估计
假设检验的一般步骤
t检验
u 检验
两均数的等效检验
正态性检验
两样本方差齐性检验
假设检验时应注意的问题
利用总体均数的可信区间进行假设检验
课堂讨论
第三章 总体均数的估计与假设检验
一、 均数的抽样误差与标准误( )
等效检验的假设
七、两均数的等效检验
H0: | 1- 2| H1: | 1- 2|< 为等效界值,若两总体均数差值在范围内为等效,超过则为不等效。 是推断两种处理效果是否相近或相等的统计方法。 为什么推断两种处理效果是否相近或相等不能用前面所述的假设检验方法?
检验水准、自由度及结果判断同t检验。
=n- 1=25 -1=24 查t界值表(P804),得单侧 t0.05,24 = 1.711 因: t =1.833> t0.05,24 所以:P < 0.05
结论:按照 = 0.05水准,拒绝H0 ,故可认为该山区健康成年男子脉搏高于一般人群。
1
上例如用双侧检验,查表得双侧 t0.05,24 = 2.064
样本含量一定时,增大,则减少,减少则增大,所以, 的确定并不是越小越好,一般取0.05较合理。
结论时,尽可能明确相结合。
02
医学统计学-假设检验概述
二、假设检验应注意的问题
假设检验利用小概率反证法思想,从问题对立面 (H0)出发间接判断要解决的问题(H1)是否成立。在H0 成立的条件下计算检验统计量,获得P值来判断。当P ≤,就是小概率事件。
小概率事件原理:小概率事件在一次抽样中发生 的可能性很小,如果它发生了,则有理由怀疑H0,认 为H1成立,该结论可能犯的错误。
当不拒绝H0时,没有拒绝实际上不成立的H0,这 类错误称为Ⅱ类错误(“存伪”),其概率大小用β 表示。
假设检验中的两类错误
客观实际
拒绝H0
不拒绝H0
H0成立 第Ⅰ类错误(α) 推断正确(1- α)
H0不成立 推断正确(1- β) 第Ⅱ类错误(β)
α与β的关系: 当样本量一定时, α愈小, 则β愈大,反之α愈大,
距法
理论上:
• 总体偏度系数1=0为对称,1>0为正偏态,1<0为负偏态; • 总体峰度系数2=0为正态峰,2>0为尖峭峰,2<0为平阔峰。 • 只有同时满足对称和正态峰两个条件时,才能认为资料服从
假设检验概述
第五章 假设检验概述
第一节 假设检验的分类、论证方法与步骤 一、假设检验的分类 二、假设检验的论证方法 三、假设检验的步骤
第二节 假设检验的两类错误和注意事项 一、Ⅰ型错误和Ⅱ型错误 二、应用假设检验的注意事项
第三节 正态性检验与数据转换 一、正态性检验 二、数据转换
第四节 例题和SPSS电脑实验
P>:不拒绝H0 ,还不能认为差异有统计学意义… P:拒绝H0,接受H1 ,差异有统计学意义…
第二节 假设检验的两类错 误和注意事项
一、Ⅰ型错误和Ⅱ型错误
1. Ⅰ型错误: 当拒绝H0时,可能拒绝了实际上成立的H0,这
医学统计学-假设检验
差别有统计学意义,可以认为病毒性肝炎患者的转 铁蛋白含量较低。
3.4 两组资料比较的u检验
➢当随机抽样的样本例数足够大时,t检验统计 量的自由度逐渐增大,t分布逐渐逼近于标准 正态分布,可以利用近似正态分布的原理进 行u检验。
u XA XB sX A X B
XA XB sA2 nA sB2 nB
1 假设检验的基本思想
➢提出一个假设 ➢如果假设成立,得到现有样本的可能性
➢可能性很小(小概率事件),在一次试验中本不 该得到,居然得到了,说明我们的假设有问题, 拒绝之。
➢有可能得到手头的结果,故根据现有的样本无法 拒绝事先的假设(没理由)
例1
样本:随机抽查25名男炊事员的血清总胆固 醇 , 求 得 其 均 数 为 5.1mmol/L , 标 准 差为0.88mmol/L。
假设检验的基本思想:女士和奶
➢ 女士说她可以辨认出加奶和水的顺序 ➢ 事先假设:她在耍我们,每次她都在瞎猜 ➢ 现在给她对十杯牛奶做出判断 ➢ 如果她是瞎猜的,却全部正确,几率为0.510≈0.001 ➢ 0.001是小概率,认为不会发生(即10次全猜对是
不可能的) ➢ 现在试验的结果是十杯全部说对了 ➢ 故断定假设不成立
布
F
s12 (大) s22 (小)
~ F( ,1 , 2 )
方差齐性检验
男性组
12=?
➢除抽样误差外,该单位食堂炊事员与健康男性存 在本质上的差异:偷东西吃?。(必然的、大于 随机误差)
➢两种情况只有一个是正确的,且二者必居其 一,需要我们作出推断。
假设检验的一般步骤
➢步骤1:建立假设 ➢在假设的前提下有规律可寻
➢零假设(null hypothesis),记为H0,表示目前的 差异是由于抽样误差引起的。
3.4 两组资料比较的u检验
➢当随机抽样的样本例数足够大时,t检验统计 量的自由度逐渐增大,t分布逐渐逼近于标准 正态分布,可以利用近似正态分布的原理进 行u检验。
u XA XB sX A X B
XA XB sA2 nA sB2 nB
1 假设检验的基本思想
➢提出一个假设 ➢如果假设成立,得到现有样本的可能性
➢可能性很小(小概率事件),在一次试验中本不 该得到,居然得到了,说明我们的假设有问题, 拒绝之。
➢有可能得到手头的结果,故根据现有的样本无法 拒绝事先的假设(没理由)
例1
样本:随机抽查25名男炊事员的血清总胆固 醇 , 求 得 其 均 数 为 5.1mmol/L , 标 准 差为0.88mmol/L。
假设检验的基本思想:女士和奶
➢ 女士说她可以辨认出加奶和水的顺序 ➢ 事先假设:她在耍我们,每次她都在瞎猜 ➢ 现在给她对十杯牛奶做出判断 ➢ 如果她是瞎猜的,却全部正确,几率为0.510≈0.001 ➢ 0.001是小概率,认为不会发生(即10次全猜对是
不可能的) ➢ 现在试验的结果是十杯全部说对了 ➢ 故断定假设不成立
布
F
s12 (大) s22 (小)
~ F( ,1 , 2 )
方差齐性检验
男性组
12=?
➢除抽样误差外,该单位食堂炊事员与健康男性存 在本质上的差异:偷东西吃?。(必然的、大于 随机误差)
➢两种情况只有一个是正确的,且二者必居其 一,需要我们作出推断。
假设检验的一般步骤
➢步骤1:建立假设 ➢在假设的前提下有规律可寻
➢零假设(null hypothesis),记为H0,表示目前的 差异是由于抽样误差引起的。
医学统计学 第六讲 第三章 计量资料的统计推断假设检验
计量资料假设检验之二
样本与总体的关系
N(μ0,σ02)
x n1
1
x n2
2
x n3
3
x n4
4
...
...
n
xn
N(μ,σ2) x
2
假设检验的一般步骤 ▲ 建立假设(反证法): ▲ 确定显著性水平( ): ▲ 计算统计量:u, t,2 ▲ 确定概率值: ▲ 做出推论
3
第三节 t 检验和u检验 4
8
假设检验: ▲ 建立假设:
检验假设 H0:两组药物镇痛时间相同, 1=2 备择假设 H1:两组药物镇痛时间不同; 1≠2 ▲ 确定显著性水平( ):0.05
▲ 计算统计量t 值 9
计算公式: 合并标准误
t X1 X2 S
X1 X2
S X1X2
SC2n11
1
n2
合并方差
SC2s12(n1n 11 ) n2S 22(2n21)
合并自由度 10
t X1 X2 SX1X2
X1 X2
S12
(n1 1) S22(n2 n1 n2 2
1)
1 n1
1 n2
6.23.5
7.859
1.423011.22(281) 1 1
30282 30 28
11
▲ 确定概率值:自由度:30+ 28 –2 = 56 t 0.05(56) = 2.005 7.859 > t 0.05(56) , p < 0.05; ▲ 做出推论: 按=0.05水准, 拒绝H0,接受H1, 可以认为 两组药物镇痛疗效不同。
F=s12(较大)/s22( 较小) = 0.832/0.642 = 1.682
23
样本与总体的关系
N(μ0,σ02)
x n1
1
x n2
2
x n3
3
x n4
4
...
...
n
xn
N(μ,σ2) x
2
假设检验的一般步骤 ▲ 建立假设(反证法): ▲ 确定显著性水平( ): ▲ 计算统计量:u, t,2 ▲ 确定概率值: ▲ 做出推论
3
第三节 t 检验和u检验 4
8
假设检验: ▲ 建立假设:
检验假设 H0:两组药物镇痛时间相同, 1=2 备择假设 H1:两组药物镇痛时间不同; 1≠2 ▲ 确定显著性水平( ):0.05
▲ 计算统计量t 值 9
计算公式: 合并标准误
t X1 X2 S
X1 X2
S X1X2
SC2n11
1
n2
合并方差
SC2s12(n1n 11 ) n2S 22(2n21)
合并自由度 10
t X1 X2 SX1X2
X1 X2
S12
(n1 1) S22(n2 n1 n2 2
1)
1 n1
1 n2
6.23.5
7.859
1.423011.22(281) 1 1
30282 30 28
11
▲ 确定概率值:自由度:30+ 28 –2 = 56 t 0.05(56) = 2.005 7.859 > t 0.05(56) , p < 0.05; ▲ 做出推论: 按=0.05水准, 拒绝H0,接受H1, 可以认为 两组药物镇痛疗效不同。
F=s12(较大)/s22( 较小) = 0.832/0.642 = 1.682
23
医学统计学 假设检验
2023/12/7
计量资料的统计推断
30
t检验注意事项
4. 假设检验的结论不能绝对化
不能拒绝H0,有可能是样本数量不够 拒绝H0 ,有可能犯第Ⅰ类错误
3 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54
4 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98
5 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76
6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60
(X1 X1)2 (X2 X2)2 n1 n2-2
例 3-9 白血病组 ( X1) :12.3 13.2 13.7 15.2 15.4 15.8 16.9 正常组 ( X 2 ) : 10.8 11.6 12.3 12.7 13.5 13.5 14.8
问正常鼠和白血病鼠脾脏中 DNA 平均含量(mg/g)是否不同?
5.41
0.04
2.06
1.24
0.82
1.64
1.83
-0.19
1.06
1.45
-0.39
0.77
0.92
-0.15
--
--
1.34
d2
0.1521 0.0196 0.7569 0.0400 0.0196 0.2401 0.5184 0.0016 0.6724 0.0361 0.1521 0.0225 2.6314
3. 自身对比。即同一受试对象处理前后的结果进行比 较。
2023/12/7
计量资料的统计推断
19
二、配对样本t 检验
目的:判断不同的处理是否有差别
假设检验-医学统计学
▪ 有可能得到手头的结果,故根据现有的样本无法拒绝事先的假设。
12
假设检验的一般思想
假设检验的意义 假设检验的基本思想 假设检验的一般步骤
定量资料均数的t检验
样本均数与总体均数比较的 t 检验 两个样本均数的 t 检验 配对样本的 t 检验 t 检验的应用条件 假设检验应用的注意事项
13
样本:随机抽查25名男炊事员的血清总胆固醇,求得其均数为 5.1mmol/L,标准差为0.88mmol/L。
▪ 医学统计学
1
假设检验的一般思想
假设检验的意义 假设检验的基本思想 假设检验的一般步骤
定量资料均数的t检验
样本均数与总体均数比较的 t 检验 两个样本均数的 t 检验 配对样本的 t 检验 t 检验的应用条件 假设检验应用的注意事项
2
假设检验的一般思想
假设检验的意义 假设检验的基本思想 假设检验的一般步骤
总体参数
未知
样本统计量
统计 推断
已知
风险
总体Α是100例正常成年男子的血红蛋白(单位:g/L),从中随机抽
取从样中本随机a1抽和取样样本本ab2
;总体B是另外100例正常成年男子的血红蛋白, ;三个样本的含量均为10例,有关数值如下:
µ
σ
a1/b1
a2
A
130
7.5
131.9
128.3
B
140
8.2
138.2
6
▪ 在知道A和B总体的参数时
a1-a2 a1-b1
抽样误差 本质差别
7
▪ 假如事先不知道A和B是不是同一个总体
a1-b1
抽样误差
?
本质差别
A=B A≠B
12
假设检验的一般思想
假设检验的意义 假设检验的基本思想 假设检验的一般步骤
定量资料均数的t检验
样本均数与总体均数比较的 t 检验 两个样本均数的 t 检验 配对样本的 t 检验 t 检验的应用条件 假设检验应用的注意事项
13
样本:随机抽查25名男炊事员的血清总胆固醇,求得其均数为 5.1mmol/L,标准差为0.88mmol/L。
▪ 医学统计学
1
假设检验的一般思想
假设检验的意义 假设检验的基本思想 假设检验的一般步骤
定量资料均数的t检验
样本均数与总体均数比较的 t 检验 两个样本均数的 t 检验 配对样本的 t 检验 t 检验的应用条件 假设检验应用的注意事项
2
假设检验的一般思想
假设检验的意义 假设检验的基本思想 假设检验的一般步骤
总体参数
未知
样本统计量
统计 推断
已知
风险
总体Α是100例正常成年男子的血红蛋白(单位:g/L),从中随机抽
取从样中本随机a1抽和取样样本本ab2
;总体B是另外100例正常成年男子的血红蛋白, ;三个样本的含量均为10例,有关数值如下:
µ
σ
a1/b1
a2
A
130
7.5
131.9
128.3
B
140
8.2
138.2
6
▪ 在知道A和B总体的参数时
a1-a2 a1-b1
抽样误差 本质差别
7
▪ 假如事先不知道A和B是不是同一个总体
a1-b1
抽样误差
?
本质差别
A=B A≠B
55.假设检验医学统计学
• 第一类错误(Type I Error) 当H0为真时,假设检验结论拒绝H0, 接受H1 ,亦称 为假阳性错误。
• 第二类错误(Type II Error) 当真实情况为H0不成立时,假设检验结论不拒绝H0, 亦称为假阴性错误。 。
10
I型错误和II型错误
• 1- 常被用来表达某假设检验方法的检验的功
在假设检验之前人为规定; 假设检验在做拒绝H0结论时,允许犯I型错误的最大值。
正确理解P值、值的含义
P 值 根据样本资料计算得到的
值 在假设检验之前人为规定
正确理解P值的统计意义
t
X-μ
SX
P t ***
P≤ 时,拒绝H0,接受H1 P> 时,不拒绝H0
/2
/2
-t t / 2,
0
t / 2, t
效(power of a test),国内学者也称它为把握度 ,表示当两总体确实有差别时,按照规定的检 验水准发现其差别的能力。
11
I型错误和II型错误
实际情况
H0 成立 H0 不成立
假设检验的结果
拒绝 H0
不拒绝 H0
I 型错误() 正确判断(1-)
把握度(1-) II 型错误()
12
I型错误和II型错误图示
sC2
(
1 n1
1 n2
)
6
t X1 X2 7.581 sX1 X2
(3) P <0.05 (t 0.05/2,15 = 2.131),按=0.05水准,
拒绝H0,接受H1 ,差别有统计学意义,可以 认为正常含氧环境和低氧环境中运动后的心 肌血流量有差别。
7
小结
• 单样本t 检验 t | X |
• 第二类错误(Type II Error) 当真实情况为H0不成立时,假设检验结论不拒绝H0, 亦称为假阴性错误。 。
10
I型错误和II型错误
• 1- 常被用来表达某假设检验方法的检验的功
在假设检验之前人为规定; 假设检验在做拒绝H0结论时,允许犯I型错误的最大值。
正确理解P值、值的含义
P 值 根据样本资料计算得到的
值 在假设检验之前人为规定
正确理解P值的统计意义
t
X-μ
SX
P t ***
P≤ 时,拒绝H0,接受H1 P> 时,不拒绝H0
/2
/2
-t t / 2,
0
t / 2, t
效(power of a test),国内学者也称它为把握度 ,表示当两总体确实有差别时,按照规定的检 验水准发现其差别的能力。
11
I型错误和II型错误
实际情况
H0 成立 H0 不成立
假设检验的结果
拒绝 H0
不拒绝 H0
I 型错误() 正确判断(1-)
把握度(1-) II 型错误()
12
I型错误和II型错误图示
sC2
(
1 n1
1 n2
)
6
t X1 X2 7.581 sX1 X2
(3) P <0.05 (t 0.05/2,15 = 2.131),按=0.05水准,
拒绝H0,接受H1 ,差别有统计学意义,可以 认为正常含氧环境和低氧环境中运动后的心 肌血流量有差别。
7
小结
• 单样本t 检验 t | X |
医学统计学假设检验
I类错误 (α)
推断正确
推断正确
II类错误 (β)
10
五、双侧检验与单侧检验 1. 同一组数据,采用单侧与双侧检验,可能导致不同的结论。 如下图
2.对于一个实际问题,究竟应采用双侧还是单侧检验,需要 根据问题本身的专业意义来确定,并且应在设计阶段就事 先确定。
11
样本均数的假设检验
一、一个样本均数的假设检验 设有两个正态总体N(μ0,σ2) 、N(μ,σ2) ,其总
的心率相同。 H1:μ≠μ0 即假设常年参加锻炼的中ห้องสมุดไป่ตู้男生与一般中学男
生的心率不同。 确定检验水准α=0.05。
2).选择统计量并计算其值:
uX0 6574 16.67 n 5.4 100
3).根据检验统计量的性质,选择适当的统计表,查出相应的 界值 u0.05/2 1.96。现经计算所得的
u16.671.96
,
2 2
已知时,用u (z)检验,其统计量为
: u X1 X2
X1X2
其中:
X1X2
12 22
n1 n2
15
2.总体方差
2 1
,
2 2
未知时,分大、小样本两种情况。
1)对于大样本,用u (z)检验,其统计量为:
其中:
u X1 X2 S X1X2
S X1X2
S12 S22 n1 n2
26
t X0 n1
Sn
例1 例2
13
二、两个样本均数的假设检验
设有两个正态总体 ,已知两个样本均数和样 本标准差
N
(
1
,
2 1
)
μ1未知
从中抽取一个 含量为n1的样本
医学统计学:假设检验
THANKS
谢谢您的观看
04
假设检验的常见错误与注意 事项
第一类错误与第二类错误
第一类错误
当原假设为真时,拒绝原假设,即错误地认 为原假设是错误的。其概率通常用α表示, 也称为显著性水平。
第二类错误
当原假设为假时,不拒绝原假设,即错误地 认为原假设是正确的。其概率通常用β表示
。ห้องสมุดไป่ตู้
差异检验与趋势检验的注意事项
• 差异检验:主要用于比较两组或多组数据的均值是否存在显著差异。注意事项包括 • 确定样本是否独立:在进行t检验或方差分析时,样本应是独立取得的,否则将影响结果的准确性。 • 确定总体方差是否已知:在进行t检验时,如果总体方差未知,则应采用t'检验或Welch t检验。 • 正确理解p值:p值是假设检验的核心,它表示观察到的数据与原假设之间的矛盾程度。一般来说,如果p值
04 第四步
根据样本数据和临界值进行推断。 如果检验统计量大于临界值,则拒 绝原假设;如果检验统计量小于临 界值,则不拒绝原假设。
假设检验的意义与应用
意义
假设检验是统计学中最重要的方法之一,它可以帮助我们科 学地推断样本数据所反映的总体的性质,从而为科学研究提 供依据。
应用
假设检验广泛应用于各个领域,如医学、社会科学、自然科 学等。在医学领域中,假设检验被广泛应用于临床试验、流 行病学研究、病因学研究等方面。
要点三
多因素方差分析:这种检验方法用于 比较两个或更多个分类变量的均值是 否存在显著差异。多因素方差分析常 用于研究多个分类变量对连续变量的 影响,其中每个分类变量的取值均为 两个或更多水平。
回归分析
回归分析是一种常用的统计分析方法 ,主要用于研究连续变量与分类变量 之间的关系。在回归分析中,我们需 要确定回归系数以及它们的显著性水 平,以揭示自变量对因变量的影响程 度和方向。
06参数估计与假设检验(医学统计学)
三、总体均数的区间估计
(一) 已知
95%可信区间:
一般情况
其中 为标准正态分布的双侧界值。
(二) 未知
Confidence interval
通常未知,这时可以用其估计量S 代替,但
已不再服从标准正态分布,而是服从
著名的t 分布。
William Gosset
图6-1 不同自由度的 t 分布图
t分布
四、两总体均数差的区间估计
实际中,有时需要计算两个总体均数差值的可信 区间,例如通过计算两种降压药物平均降压的差 值比较两种药物的差别,其双侧 100(1 )%可信 区间的计算公式为 ( X1 X 2 ) t /2, SX1X2 其中, n1 n2 2 为自由度,SX1X2 为两样本均数之 差的标准误。
样本率来代替总体率,其估计值为:
p(1 p)
Sp
n
二、参数估计
点估计: 是使用单一的数值直接作为总体参数的估 计值,如用估计相应的,用估计相应的。该法表 达简单,但未考虑抽样误差的影响,无法评价参 数估计的准确程度。
区间估计(interval estimation)是指按预先给定的概 率,计算出一个区间,使它能够包含未知的总体 均数。事先给定的概率称为可信度,计算得到的 区间称为可信区间(confidence interval,CI)。
n
250
六、两总体率差值的区间估计
在大样本情况下,可采用正态近似法对两总体率 差值进行可信区间估计,其计算公式为:
( p1 p2 ) z S /2 )( n1
1 n2
),pc =
X1 n1
X2 n2
X1和X2分别表示两组中某事件发生的例数。
例6-7 某医院口腔科医生用极固宁治疗牙本质过 敏症,以双氟涂料作对照,进行了1年的追踪观察 ,结果见表6-1所示,试估计两组有效率差别95% 的可信区间。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
❖ 例如,根据大量调查,已知正常成年男性 平均脉搏数为72次/分,现随机抽查了20名 肝阳上亢成年男性病人,其平均脉搏为84 次/分,标准差为6.4次/分。问肝阳上亢男 病人的平均脉搏数是否较正常人快?
❖ 以上两个均数不等有两种可能:
第一,由于抽样误差所致;
第二,由于肝阳上亢的影响。
例如
已知正常成年男子脉搏平均为72 次/分,现随机检查20名慢性胃炎所致 脾虚男病人,其脉搏均数为75次/分, 标准差为6.4次/分,问此类脾虚男病人 的脉搏快于健康成年男子的脉搏?
2、假设检验的目的
判断是由于何种原因造成的不同,以做出决策。
3、假设检验的原理
反证法:当一件事情的发生只有两种可能A和B,为了肯
定其中的一种情况A,但又不能直接证实A,这时否定另一 种可能B,则间接的肯定了A。
概率论(小概率) :如果一件事情发生的概率很小,那
么在进行一次试验时,我们说这个事件是“不会发生的”。 从一般的常识可知,这句话在大多数情况下是正确的,但是 它一定有犯错误的时候,因为概率再小也是有可能发生的。
α是在统计推断时,预先设定的一个小概率值,是当H0 为真时,允许错误地拒绝H0的概率。
双侧与单侧检验界值比较
(2) 选定适当的检验方法,计算检验
统计量值 t 检验 Z 检验
❖ 设计类型 ❖ 资料的类型和分布 ❖ 统计推断的目的 ❖ n的大小 ❖ 如完全随机设计实验中,已知样本均数
与总体均数比较,n又不大,可用t检验, 计算统计量t值。
(1)建立假设,选定检验水准:
假设两种:一种是检验假设,假设差异完全由抽样误差造 成,常称无效假设,用H0表示。另一种是和H0相对立的备 择假设,用H1表示。假设检验是针对H0进行的。
确定双侧或单侧检验:
H0:此类脾虚病对脉搏数无影响,H0:μ=72次/分 H1:脾虚病人的脉搏数不同于正常人,H1:μ≠72次/分 选定检验水准: α=0.05
“概率很小(接近于零)的事件在一次抽样中不 太可能出现,故可以认为小概率事件在一次随机 抽样中是不会发生的”。
“小概率原理”
❖ 例如在2000粒中药丸中只有一粒是虫蛀过的,现从中随机取 一粒,则取得“虫蛀过的药丸”的概率是1/2000,这个概率 是很小的,因此也可以将这一事件看作在一次抽样中是不会 发生的。若从中随机抽取一粒,恰好是虫蛀过的,这种情况 发生了,我们自然可以认为“假设”有问题,即虫蛀率p不是 1/2000,从而否定了假设。否定假设的依据就是小概率事件 原理。由此我们得到一个推理方法:如果在某假设(记为H0) 成立的条件下,事件A是一个小概率事件,现在只进行一次 试验,事件A就发生了,我们就认为原来的假设(H0)是不 成立的。
❖ 参数检验(parametric test):若总体分布类型已 知,需要对总体的未知参数进行假设检验。
❖ 非参数检验:若总体分布类型未知,需要对未 知分布函数的总体的分布类型或其中的某些未 知参数进行假设检验。
假设检验(hypothesis test)的基本思想
亦称显著性检验(significance test)是先对总体的特 征(如总体的参数或分布、位置)提出某种假设,如假 设总体均数(或总体率)为一定值、总体均数(或总体 率)相等、总体服从某种分布、两总体分布位置相同等 等,然后根据随机样本提供的信息,运用“小概率原理” 推断假设是否成立。
❖ 了解:
置信区间与假设检验的关系
教学内容提要
❖ 重点讲解:
假设检验原理 单样本正态资料的假设检验 两样本正态资料的假设检验 Z检验 假设检验应注意的问题
❖ 介绍:
置信区间与假设检验的关系
❖ 假设检验的基本任务:事先对总体分布或总体 参数作出假设,利用样本信息判断原假设是否 合理,从而决定是否拒绝或接受设检验: 1、原因 2、目的 3、原理 4、过程(步骤) 5、结果
某事发生了: 是由于碰巧?还是由于必然的
原因?统计学家运用显著性检验 来处理这类问题。
1、假设检验的原因
由于总体不同或因个体差异的存在,在研究中进行 随机抽样获得的样本均数,x1、x2、x3、x4…,不同。样本 均数不同有两种(而且只有两种)可能: (1)分别所代表的总体均数相同,由于抽样误差造成了样 本均数的差别。差别无显著性 (差别无统计学意义) (2)分别所代表的总体均数不同。差别有显著性(差别有 统计学意义)
第五章 假设检验
参数?
随机抽样
( 、、)
总体
统计量
(x、s、p)
样本
统计推断
通过样本统计量推断总体参数之间是否 存在差异,其推断过程称为假设检验。
教学目的与要求
❖ 掌握:
假设检验原理 单样本正态资料的假设检验 两样本正态资料的假设检验 二项分布与Poisson分布资料的Z检验 假设检验应注意的问题
(4) 作出推断结论
当P≤α时,统计学结论为按所取α检验水 准拒绝H0,接受H1,称“差异有显著性”(“差 异有统计学意义”)。
当P >α时,没有理由怀疑H0的真实性,统 计学结论为按所取α检验水准不拒绝H0,称“差 异无显著性”(“差异无统计学意义”)。
α与P异同
相同:
α与P都是用检验统计量分布的尾部面积大小表示。 不同:
4、假设检验的步骤
▲ 建立假设(反证法),确定显 著性水平( )
▲ 计算统计量:u, t,2 ▲ 确定概率P值 ▲ 做出推论
【例5-1】
已知正常成年男子脉搏平均为72次/ 分,现随机检查20名慢性胃炎所致脾虚 男病人,其脉搏均数为75次/分,标准差 为6.4次/分,推断此类脾虚男病人的脉 搏是否不同于健康成年男子的脉搏。
α是在统计推断时,预先设定的一个小概率值,是当 H0为真时,允许错误地拒绝H0的概率,是检验水准。
P值是由实际样本决定的,是指从由H0所规定的总 体中随机抽样,获得大于及等于(或小于)现有样本检 验统计量值的概率。
(3)
计算P值
P值:是在H0成立时,取得大于或等 于现有检验统计量值的概率。
(3)计算概率值(P)
将计算得到的Z值或 t值与查表得到Z或 t,ν,比较,得到 P值的大小。根据u分布和 t分布我们知道,如果|Z|> Z或| t |> t , 则 P< ;如果|Z|< Z或| t | < t ,则P> 。