计量资料的统计推断-t检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t分布 特征
f(t)
ν─>∞(标准正态曲线) ν =5 ν =1
-5
-4
-3
-2
-1
0
1
不同自由度下的t 分布图
2
3
4
5
• 自由度ν 不同,曲线形态不同,t分布是一簇曲线。 • 自由度ν 越大,t分布越接近于正态分布;当自由度 ν 逼近∞时,t分布趋向于标准正态分布。
t
概率、自由度与t值关系 ——t界值
140 138 140 135 135 120 147 114 138 120
治疗矽肺患者血红蛋白量(克%)
编号
1
治疗前
113
治疗后
140
治疗前后差数d
27
2
3 4 5 6
150
150 135 128 100
138
140 135 135 120
-12
-10 0 7 20
7
8 9 10
110
120 130 123
配对样本均数t检验——实例分析
• 例: 有12名接种卡介苗的儿童,8周后用 两批不同的结核菌素,一批是标准结核菌 素,一批是新制结核菌素,分别注射在儿 童的前臂,两种结核菌素的皮肤浸润反应 平均直径(mm)如表5-1所示,问两种结核菌 素的反应性有无差别?
表 5-1
12 名儿童分别用两种结核菌素的皮肤浸润反应结果(mm) 编号 1 2 3 4 5 6 7 8 9 10 11 12 合计 标准品 12.0 14.5 15.5 12.0 13.0 12.0 10.5 7.5 9.0 15.0 13.0 10.5 新制品 10.0 10.0 12.5 13.0 10.0 5.5 8.5 6.5 5.5 8.0 6.5 9.5 差值 d 2.0 4.5 3.0 -1.0 3.0 6.5 2.0 1.0 3.5 7.0 6.5 1.0 39(d) d2 4.00 20.25 9.00 1.00 9.00 42.25 4.00 1.00 12.25 49.20 42.25 1.00 195(d2)
• 例:以往通过大规模调查已知某地新生儿出生 体重为3.30kg.从该地难产儿中随机抽取35名新 生儿作为研究样本,平均出生体重为3.42kg,标 准差为0.40kg,问该地难产儿出生体重是否与一 般新生儿体重不同?
• 本例已知总体均数0=3.30kg,但总体标准差 未知,n=35为小样本,S=0.40kg • 故选用单样本t检验。
• 如两种疗法治疗糖尿病的疗效比较
25例糖尿病患者 随机分成两组, 总体 甲组单纯用药物 治疗,乙组采用 药物治疗合并饮 食疗法,二个月 后测空腹血糖 (mmol/L) 问两种 样本 疗法治疗后患者 血糖值是否相同?
药物治疗
1
? =
推 断
药物治疗合 并饮食疗法
2
甲组 n1=12
X 1 =15.21
t0.05,9=1.833
• 自由度n-135-134 ,查“t界值表”,得双 侧t0.05/2,34=2.032
t检验与Z检验
(t test and z test)
一、单个样本的t检验 二、配对设计计量资料比较的t检验 三、两独立样本资料均数比较的t检验 四、Z检验 五、t’检验
第一节 单组样本t检验
配对设计概述
• 应用配对设计可以减少实验的误差和控制非处理因素,提 高统计处理的效率。 • 配对设计处理分配方式主要有三种情况: ①两个同质受试对象分别接受两种处理,如把同窝、同 性别和体重相近的动物配成一对,或把同性别和年龄 相近的相同病情病人配成一对; ②同一受试对象或同一标本的两个部分,随机分配接受 两种不同处理; ③自身对比(self-contrast)。即将同一受试对象处理 (实验或治疗)前后的结果进行比较,如对高血压患 者治疗前后、运动员体育运动前后的某一生理指标进 行比较。
William Sealey Gosset
(1876.6—1937.10)
t分布——t值与t分布的引入
样本均数正态分布
N(, )
2 X
u X
N(,2)
观察值正态分布
-3
-2
-1
0
1
2
3
-3
-2
-1
0
1
2
3
X
t
t分布
X SX
z u S代替
X X
u z
X
t 分布曲线
t , t
配对样本均数t检验——检验步骤
例: 应用克矽平治疗矽肺患者10名, 治疗前后血红蛋白的含量如下表所示,问 该药是否引起血红蛋白含量的变化?
克矽平治疗矽肺患者治疗前后 血红蛋白含量(g/L) 编号 治疗前 治疗后
1 2 3 4 5 6 7 8 9 10
113 150 150 135 128 100 110 120 130 123
• 配对样本均数t检验简称配对t检验(paired t test),又称 非独立两样本均数t检验,适用于配对设计计量资料均数的
比较
• 目的:检验两相关样本均数所代表的未知总体均数是否有 差别 • 配对设计(paired design)是将受试对象按某些重要特征 相近的原则配成对子,每对中的两个个体随机地给予两种 处理
单侧
P(t t , )
或 P(t t , )
双侧
P( t t/
2 ,
) P t t/ 2 ) ( ,
概率、自由度与t值关系 ——t界值
• 一定自由度和概率下的t值 t, ,t/2, 可通
过查t界值表——附表C2(p560)获得; • 例如=9,单侧=0.05 ,查“t界值表”得单侧
• 又称单样本均数t检验(one sample t test),适用 于样本均数与已知总体均数μ 0的比较,其比较目 的是检验样本均数所代表的总体均数μ 是否与已 知总体均数μ 0有差别。
• 已知总体均数μ 0一般为标准值、理论值或经大量 观察得到的较稳定的指标值。 • 单样t检验的应用条件是总体标准未知的小样本 资料(如n<50),且服从正态分布。
一、单样本t 检验
(one sample t-test)
t
X 0 SX
自由度ν= n-1
单个样本 t 检验原理
在 H0 : = 0的假定下, 可以认为样本是从已知总 体中抽取的,根据t分布 的原理,单个样本t检验 的公式为:
未知总体 已知总体
0
样本
X
自由度=n-1
单个样本t检验——实例分析
医学统计学
医学统计学
t 检验——问题提出
• 假设检验是通过两组或多组的样本统计量的差别 或样本统计量与总体参数的差异来推断他们相应 的总体参数是否相同; • 医疗卫生实践中最常见的是计量资料两组比较的 问题;
• t检验 (t test, student t test)和z检验(z test)是用于计量资料两组比较的最常用的假设检 验方法
• 标准正态分布中z值大小与尾部面积(概率)有 关,以 z (单侧)和 z/2(双侧)表示; • 在t分布中,当自由度一定时,越小,|t|越大; • 在一定时,自由度越小,|t|越大,大于z值 • 在t分布中,t值与、的大小有关; • 在单侧时(尾部面积取单侧)t 界值表示为t, , 双侧时表示为t/2, ,其意义为
单个样本t检验——检验步骤
• 1. 建立检验假设,确定检验水准
H0:0,该地难产儿与一般新生儿平均出生
体重相同;
H1:0,该地难产儿与一般新生儿平均出生
体重不同;
0.05。
• 2. 计算检验统计量
在μ =μ 0成立的前提条件下,计算统计量为:
单个样本t检验——检验步骤
X 0 X 0 3.42 3.30 t 1.77 S SX 0.40 / 35 n
二、配对资料比较的t 检验 ( paired sample t test )
2、目的:判断不同的处理间是否有差别?
即:差值的总体均数为0
3、公式:
t
d 0 Sd
d Sd
ν = n-1
配对样本均数t检验原理
• 配对设计的资料具有对子内数据一一对应的特征, 研究者应关心是对子的效应差值而不是各自的效 应值。 • 进行配对t检验时,首选应计算各对数据间的差值d, 将d作为变量计算均数。 • 配对样本t检验的基本原理是假设两种处理的效应 相同,理论上差值d的总体均数μd 为0;现有的不 等于0差值样本均数可以来自μd = 0的总体,也可以 来μd ≠ 0的总体。
3. 确定P值,做出推断结论 本例自由度n-135-134,查附表C2,得
t0.05/2,34=2.032。 因为t t0.05/2,34,故P0.05,表明差异无统计 学意义,按 0.05水准不拒绝H0,根据现有样
本信息,尚不能认为该地难产儿与一般新生儿平 均出生体重不同。
第二节 配对资料比较的t检验
39, d
2
195。
配对样本均数t检验——检验步骤
– 先计算差数的标准差
Sd
d
2
d
n 1 n
2
392 195
12 12 1
2.4909
– 计算差值的标准误
2.4909 Sd 0.7191 n 3.464 Sd
– 按公式计算,得:
d 3.25 t 4.5195 Sd 0.7191
S 16.4574 Sd 5.2043 n 10
d 6.8 t 1.307 Sd 5.2043
3.确定
P 值,作出推断结论
自由度df =10-1= 9 , 查t 临界值(C2,p560)得:
0.20< P <0.40,按α=0.05水准 不拒绝H0,差异无统计学意义。 根据目前资料尚不能认为克矽平 对血红蛋白含量有影响。
配对样本均数t检验原理
• 可将该检验理解为差值样本均数d 所来自的未知总体均数 与已知总体均数μ d(μ d = 0)比较的单样本t检验.其检验 统计量为:
d d d 0 d t Sd Sd Sd
自由度=n-1
n
式中:d为每对数据的差值,d 为样本中各对差值d的均数,
Sd为样本差值的标准差,Sd 为差值样本均数的标准差,即差 值样本的标准误,n为配对样本的对子数
配对样本均数t检验——检验步骤
• 3. 确定 P 值,作出推断结论 –自由度计算为 ν =n-1=12-1=11,
–查t分布界值表,得t0.05/2,11 = 2.201,
t0.01/2,11 = 3.106,本例t > t0.01(11), P <0.01,
按0.05的检验水准,拒绝H0,接受H1,可认为差 别有统计学意义 –可认为两种方法皮肤浸润反应结果的差别有统计学 意义
X
乙组 n2=13
X 2=10.85
t 检验——问题提出
• 根据研究设计t检验有三种形式:
–单组样本资料的t检验
–配对样本均数t检验(非独立两样本均数t检验)
–两组独立样本均数t检验
• t检验是以t分布为基础的,为便于学习在介绍t检
验前先介绍t分布
t 分 布
X1 , X 2 , X 3 ,, X n服从正态分布N ( , ), X X t ,服从t分布, 自由度 n 1 。 SX S n
147
114 138 120
37
-6 8 -3
使用配对t检验
解:1.建立检பைடு நூலகம்假设,确定检验水准
H0:μd=0,假设该药不影响血红蛋白的变
化,即治疗前后总体差数为0。
H1:μd≠0 ,假设该药影响血红蛋白的变
化,即治疗前后总体差数不为0。 α=0.05.
2.计算t值
d 6 .8
Sd 16.4574
第三节 两独立样本t检验
• 两独立样本t 检验(two independent sample
t-test),又称成组 t 检验。
配对样本均数t检验——检验步骤
• 1. 建立检验假设,确定检验水准 –H0:d=0,两种结核菌素的皮肤浸润反应总体平均直 径差异为0;
–H1:d0,两种结核菌素的皮肤浸润反应总体平均直
径差异不为0; –0.05。 • 2. 计算检验统计量 –先计算差值d及d2如上表第四、五列所示,本例d =
N(0,1) 标准正态分布
0.025 0.025
-1.96
0
1.96
t分布 特征
• 不服从标准正态分布,小样本时服从 自由度ν =n-1的t分布
X SX
• t分布曲线是以0为中心的对称分布 • 自由度较小时,曲线峰的高度低于标准正态 曲线,且曲线峰的宽度也较标准正态分布曲 线峰狭,尾部面积大于标准正态曲线尾部 面积,而且自由度越小,t分布的这种特征 越明显 (翘尾低狭峰)