第五章 t检验1

合集下载

第二讲-第五章 t检验-2011

第二讲-第五章 t检验-2011

S12 S22 nn

S2 x1

S2 x2
(三)根据df=(n1-1)+(n2-1),查临界值: t0.05、t0.01,将 计算所得 t 值的绝对值与其比 较,作出统计推断。
【例5.3】 某种猪场分别测定长白后备种猪和蓝塘后 备种猪90kg时的背膘厚度,测定结果如表5-3所示。 设两品种后备种猪90kg 时的背膘厚度值服从正态分 布,且方差相等,问该两品种后备种猪90kg时的背 膘厚度有无显著差异?
(x1 x1)2 (x2 x2 )2 ( 1 1 )
(n1 1) (n2 1)
n1
n 2
(n1 1)S12 (n2 1)S22 ( 1 1 )
(n1 1) (n2 1)
n1 n2
当 n1 n2 n 时
S x1x2
(x1 x1)2 (x2 x2 )2 n(n 1)
总体平均数 反映了总体特征, i 表示误差。
若样本含量为n,则可得到n个观测值:
x1, x2,L , xn ,
x xi n ( ,则有:
x1 = 1 + 1,x2= 2+ 2
两个样本平均数之差( x1 - x2)也包括了两部分:
表5-4 粤黄鸡饲养试验增重
二、配对设计两样本平均数的差异显著性检验
非配对设计要求试验单位尽可能一致。如 果试验单位变异较大,如试验动物的年龄、体 重相差较大,若采用上述方法就有可能使处理 效应受到系统误差的影响而降低试验的准确性 与精确性。 为了消除试验单位不一致对试验结 果的影响,正确地估计处理效应,减少系统误 差,降低试验误差,提高试验的准确性与精确 性,可以利用局部控制的原则,采用配对设计。

第五章 t检验

第五章  t检验

河南大学医学院授课教案首页预防医学教研室教研室主任签名注:教后记放在讲义最后一页。

基本内容第一节假设检验的基本步骤一、假设检验的基本思想在抽样研究中,由于样本所来自的总体其参数是未知的,只能根据样本统计量对其所来自总体的参数进行估计,如果要比较两个或几个总体的参数是否相同,也只能分别从这些总体中抽取样本,根据这些样本的统计量作出统计推断,籍此比较总体参数是否相同。

由于存在抽样误差,总体参数与样本统计量并不恰好相同,因此判断两个或多个总体参数是否相同是一件很困难的事情。

如医生在某山区随机测量了25名健康成年男子的脉搏,平均次数为74.2次/分钟,标准差为5.2次/分钟,但是根据医学常识,一般男子的平均脉搏次数为72次/分钟,问该山区男子脉搏数与一般男子是否不同?要回答这个看似简单的问题并非易事。

这个问题难以从正面直接回答,可以先假定该山区所有男子脉搏数数值组成一个总体,其总体均数和标准差均为未知数,不妨分别以μ、σ表示。

如果我们假设该山区男子的脉搏数与一般地区的男子相同,即属于同一总体,μ=72,所测量的25名男子的平均脉搏数(样本均数)之所以不恰好等于72次/分,是由于抽样误差所致。

如果上述假设成立,则理论上讲,样本均数很可能在总体均数(μ=72)的附近,样本均数远离总体均数的可能性很小。

如果将样本均数变换为t值,则t值很可能在0的附近,t值远离0的可能性很小。

如果t值很小上述假设可能不正确,可拒绝上述假设。

假设检验包括单侧检验和双侧检验两种情况,当根据专业知识已知两总体的参数中甲肯定不会小于乙,或甲肯定不会大于乙时,可考虑用单侧检验,否则,宜用双侧检验。

假设检验中的如何下检验结论(以t 检验为例): 1、单侧检验: 如计算统计量t 为正值αt t ≥ α≤P 拒绝0H ,接受1H αt t < α>P 不拒绝0H 如计算统计量t 为负值αt t -≤ α≤P 拒绝0H ,接受1H αt t -> α>P 不拒绝0H 2、双侧检验:2||αt t ≥ α≤P 拒绝0H ,接受1H 2||αt t < α>P 不拒绝0H 二、假设检验的一般步骤 假设检验一般分为三步:1、建立假设,确定检验水准。

张勤主编的生物统计学方面的习题作业及答案

张勤主编的生物统计学方面的习题作业及答案

第一章绪论一、名词解释总体个体样本样本含量随机样本参数统计量准确性精确性二、简答题1、什么是生物统计?它在畜牧、水产科学研究中有何作用?2、统计分析的两个特点是什么?3、如何提高试验的准确性与精确性?4、如何控制、降低随机误差,避免系统误差?第二章资料的整理一、名词解释数量性状资料质量性状资料半定量(等级)资料计数资料计量资料二、简答题1、资料可以分为哪几类?它们有何区别与联系?2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样?3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?4、统计表与统计图有何用途?常用统计图、统计表有哪些?第三章平均数、标准差与变异系数一、名词解释算术平均数几何平均数中位数众数调和平均数标准差方差离均差的平方和(平方和)变异系数二、简答题1、生物统计中常用的平均数有几种?各在什么情况下应用?2、算术平均数有哪些基本性质?3、标准差有哪些特性?4、为什么变异系数要与平均数、标准差配合使用?三、计算题1、10头母猪第一胎的产仔数分别为:9、8、7、10、12、10、11、14、8、9头。

试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。

2、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。

试利用加权法计算其平均数、标准差与变异系数。

组别组中值(x)次数(f)80—84 288—92 1096—100 29104—108 28112—116 20120—124 15128—132 13136—140 33、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、4、4、4、5、9、12(天)。

试求潜伏期的中位数。

4、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的年平均增长率。

5、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、130、140、120、110头。

第五章t-检验

第五章t-检验

第五章t-检验第五章 t 检验统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断; 包括假设检验和参数估计。

第⼀节显著性检验的基本原理⼀、显著性检验的意义随机抽测10头长⽩猪和10头⼤⽩猪经产母猪的产仔数,资料如下:长⽩:11,11,9,12,10,13,13,8,10,13 ⼤⽩:8, 11,12,10,9, 8 ,8, 9,10,7=11头, S 1=1.76头; =9.2头, S 2=1.549头。

仅凭 - =1.8头,得出长⽩与⼤⽩产仔数不同的结论是不可靠的。

因为如再随机抽样,⼜可得两样本。

由于抽样误差的随机性,两样本平均数就不⼀定是11头和9.2头,其差值也不⼀定是1.8头。

这种差异有两种原因:品种造成的差异;试验误差(或抽样误差)。

两个总体间的差异⽐较:⼀种⽅法是计算出总体参数进⾏⽐较。

准确,但常常是不可能进⾏的;另⼀种通过样本研究其所代表的总体。

为什么以样本平均数作为检验对象呢?这是因为样本平均数具有下述特征:1、离均差的平⽅和∑( x - )2最⼩。

说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。

2、样本平均数是总体平均数的⽆偏估计值,即E ()=µ。

3、根据统计学中⼼极限定理,样本平均数服从或逼近正态分布。

由上所述,⼀⽅⾯有依据由样本平均数和的差异来推断总体平均数µ1 、µ2相同与否,另⼀⽅⾯⼜不能仅据样本平均数表⾯上的差异直接作出结论,其根本原因在于试验误差(或抽样误差)的不可避免性。

Xi= µ + εi1x 2x 1x 2x x x 1x 2x εµεµ+=+∑==∑n n x x i i /)(µ1-µ2 处理效应;试验误差( - )。

从试验的表⾯效应与试验误差的权衡⽐较中间接地推断处理效应是否存在,是显著性检验的基本思想。

⼆、显著性检验的基本步骤(⼀)⾸先对试验样本所在的总体作假设假设µ1 = µ2 或µ1 -µ2 =0,意义是试验的表⾯效应:- =1.8头是试验误差,处理⽆效,称为⽆效假设,记作 H 0µ1 = µ2 或µ1 -µ2 =0 , 是被检验的假设,通过检验可能被接受,也可能被否定。

第5章t检验

第5章t检验

1. 建立检验假设,确定检验水准 H0: σ12= σ 22 两组体重的总体方差相等 H1: σ12≠ σ22 两组体重的总体方差不等 α=0.05 2. 计算检验统计量 已知:n1=12 X1=45.75 S12=17.659 n2=13 X2=36.538 S22=3.269
S1 (较大) 17.659 F 2 5.402 S 2(较小) 3.269
注: P<0.01 差别有高度统计学意义 (P越小,越有理由拒绝H0)。
第三节
配对样本t检验
d 0 d t Sd Sd / n
配对设计主要有以下两种形式:
①同源配对: 同一受试对象处理前后的数据;同一受 试对象两个部位的数据;同一样品用两 种方法(仪器)检验的结果; ②异源配对: 配对的两个受试对象分别接受两种处理 后的数据。
第四节 两独立样本 t 检验 Two independent sample t-test • 又称成组t检验 • 适用于完全随机设计的两样本均数的比 较
将受试对象完全 随机地分配到两 组中
一、总体方差相等时的两独立样本 t 检验
应用条件:1. 两样本所代表的总体服从正态分布
2. 两总体方差具有齐性
s1 s12 17.659 2 sx 1.472 1 n n1 12 1
2 s2 s2 3.269 2 sx 2.179 2 n n2 12 2 2
2
三、完全随机分组两组几何均数比较的t检验
宜用几何平均数表示集中水平的资料,不服从 正态分布,但是测量值的对数值服从正态分布, 如抗体滴度的资料。此时可对lgx进行t检验。
t
' 2 2 S x t (1 ) S x t ( 2 )

第5章t检验

第5章t检验

3.5
12.25
10
15.0
8.0
7.0
49.20
Байду номын сангаас
11
13.0
6.5
6.5
42.25
12
10.5
合计
9.5
1.0
1.00
39(d)
195(d2)
H0:d=0, H1:d0, 0.05。
自由度计算为 ν=n-1=n-1=12-1=11,
查附表2,得t0.05(11) = 2.201,
t0.01(11) = 3.106,本例t > t0.01(11), P < 0.01,差别有统计学意义,拒绝H0,接受H1,
应的总体方差相等(方差齐性) u 检验:1.大样本
2.样本小,但总体标准差已知
➢t检验 样本均数与总体均数比较的t检验 配对设计资料比较的t检验 两独立样本均数比较的t检验
➢样本均数与总体均数的比较的t检验,亦 称单样本t检验(one sample t test) 。
➢用于从正态总体中获得含量为n的样本, 算得均数和标准差,判断其总体均数μ 是否与某个已知总体均数μ0相同。
可认为两种方法皮肤浸润反应结果的差别有 统计学意义。
查表,t与自由度为9(10-1)时的t界值进行比 较,得到0.01<p<0.05。
P=2*[1-CDF.T(2.434,9)]
CDF.T(quant, df)。数值。返回 t 分布(指定自由度为 df)中的 值将小于 quant 的累积概率。
SPSS软件操作
• 第一步:以“血尿素氮” 为变量名,建立变量
t
df
Sig. (2-tailed) Difference Lower

《生统》第五章 假设检验-t检验

《生统》第五章 假设检验-t检验
表5-4 粤黄鸡饲养试验增重 饲料 A B 8 8 ni 增 重(g) 720、710、735、680、690、705、700、705 680、695、700、715、708、685、698、688
ni
检验步骤:
1、提出无效假设与备择假设 H0:μ1=μ2,HA: μ1 ≠ μ2 2、计算 t 值
表5-2 非配对设计资料的一般形式
处理 1 2 观察值xij x11, x12,… x1j X21, x22,… x2j 样本含量ni n1 n2i 平均数 总体平均数 μ1 μ2
x1 x2
显著性检验的基本步骤:
(一)提出无效假设与备择假设 (二)计算值 计算公式为:
t x1 x 2 S x1 x2
结论:差异极显著
二、配对设计两样本平均数 差异显著性检验
1、自身配对 2、同源配对 配对设计两样本平均数差异显著性检验的基本步骤: (一)提出无效假设与备择假设 (二)计算 t 值
d t Sd
Sd Sd n
d d
n(n 1)
2

d
2
n(n 1)
( d ) 2 / n
检验步骤:
2、计算 t 值
S x1 x2
( x1 x1 ) 2 ( x2 x2 ) 2 ( 1
(n1 1) (n 2 1)
n1

1 ) n2
1、提出无效假设与备择假设
sx1 x2
2 S12 (n1 1) S2 (n2 1) 1 1 (n1 1) n2 1) n1 n2
|t|<t0.05, |t|≥ t0.01 , 则 P>0.05 则 P≤0.01 差异不显著 差异显著 差异极显著 t0.01 ≤|t|< t0.05 ,则 0.01<P≤0.05

05t检验

05t检验

t
Sd
Sd
dd6.80.68 克 %
N 10
S
d2 N d2
2.0 9 06.82
101.65 克 %
医学统计学
N1
1 01
8
三、配对计量资料比较的t 检验
Sd
S 1.650.52克 % N 10
d 0.68 t 1.31
Sd 0.52
3.计算自由度,查附表1(t 界限表)
df = 10-1 = 9
7
11.0
14.7
3.7
13.69
8
12.0
11.4
-0.6
0.36
9
13.0
13.8
0.8
10医学统计学 12.3
12.0
-0.3
0.64
0.09
7
合计
6.8
29.00
三、配对计量资料比较的t 检验
1.H0:假设该药不影响血红蛋白的变化,即治疗前
后差数为0。
2.计算t值:此处使用公式为:
d 0 d
1 .9 6 S X X 1 .9 6 S X
X
1.96
1.96
SX
X
1.96 SX
X
1.96 SX
医学统计学99% 界限值 ?
正态性 ?
3
第一节 t 检验
▪ 一、t 值及假设检验的界限值
对于近似正态性资料,t的界限值为: 查t界值表
医学统计学
t0.05 1.96 t0.0520 2.086 t0.0550 2.009
可以认为克山病患者血磷的平均值明显高于当地健康人的血磷平均值。
医学统计学
12
五、两大样本均数的比较——U 检验

第五章 t检验

第五章  t检验

2 S1

2

2
2 S2
/ n2 n 2 1
王 青

2
第二章
资料整理和描述性统计
太原师范学院生物系
总目录
结束放映
返回
生物统计学
2 ②.两个总体方差不相等 1
2 2
H 0 : 1 2 H A : 1 2 当n1 n2时
x1 x2 t ~ t df S x1 x2
生物统计学
第五章 t 测定(检验)
——两个样本平均数的差异显著性检验
当样本容量n<30,且总体方差σ 2未知时,
要检验 ⑴ 样本均数与指定总体的平均数 (µ 0)间的差
异显著性;
⑵ 或两样品平均数间的差异显著性。
就必须使用 t 检验 法。
第二章
资料整理和描述性统计
太原师范学院生物系


总目录
结束放映
验单位随机地分配到两个处理组中。 • 配对的要求是,配成对子的两个试验单位的初始
条件尽量一致,不同对子间试验单位的初始条件
允许有差异,每一个对子就是试验处理的一个重
复。
• 配对的方式有两种:自身配对与同源配对。
第二章
资料整理和描述性统计
太原师范学院生物系


总目录
结束放映
返回
生物统计学
第二节 两个总体平均数的比较
2 n 1 S 1 , 2 ) 1

F

2 n1 1 S1 / n1 1 2 1 ~ F ( n1 1, n 2 1) 2 n 2 1 S2 / n2 1 2 2

第二章
资料整理和描述性统计

t检验

t检验

已知总体均数——一般为标准值、理论值或 已知总体均数——一般为标准值、理论值或 经大量观察得到的较稳定的指标值。
计算步骤
一、建立假设,确定检验水准:
H0:未知总体与已知总体的均数相同(μ=μ0) H1:未知总体与已知总体的均数不同(μ≠μ0) 检验水准为α
公式:
总体方差已知:
U = X μ0 σ n
注意:P值越小只能说明作出拒绝H0,接受H1的推论时犯错误的机会越 小,并不能说明μ与μ0差异的大小。因此,只能说差异有无统计学意 义,或差异有无高度统计学意义。
2
§5.2 单个样本t检验 单个样本t
未知总体与已知总体均数的比较 未知总体与已知总体均数的比较 该检验对样本有如下的要求:
1.假定样本来自同分布的总体,即同质性。 1.假定样本来自同分布的总体,即同质性。 2.每个个体的测量值要相互独立, 2.每个个体的测量值要相互独立,且是随机抽样。 3.研究的变量应服从正态分布(或近似服从正态分 3.研究的变量应服从正态分布(或近似服从正态分 布)。
∑ x (∑ x)
2
2
n
n 1
= 7.2(次/ 分)

解:(此时以单侧为例) 一、建立假设,确定检验水准:
H0:常年参加体育锻炼的中学男生的心率与一般的中学男生相等(μ=μ0) H1:常年参加体育锻炼的中学男生的心率比一般的中学男生慢(μ<μ0) 检验水准α=0.05。
§5.3 配对样本t检验 配对样本t
二、计算检验统计量:
t = X μ0 65 . 6 74 = = 4 . 65 S n 7 . 2 16
三、确定P值,得出结论:
查t界值表,t0.05 (15)=1.753 ∵t=|-4.65| > t0.05(15)=1.753 ,∴P <0.05 统计:按照α=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。 专业:结合本例,常年参加体育锻炼的中学男生的心率比一般的中学男 生慢。

第五章 t检验

第五章 t检验

选择题:
1. 按α=0.10水准做t检验,P>0.10,不能认为两总体均 数不相等,此时若推断有错,其错误的概率为 ( )。 A.大于0.10 B.β,而β未知 C.小于0.10 D.1-β,而β未知
2.某地正常成年男子红细胞的普查结果,均数为480 万/mm3,标准差为41.0万/mm3,后者反映( ) A.个体变异 B.抽样误差 C.总体均数不同 D.均数间变异
(2) 当 p > , 不能拒绝 H0, 不能接受H1,按不能接受 H1下结论,也可能犯错误;
2、第 I 类错误和第 II 类错误
假设检验的结果有两种。
(1)
当拒绝 H0 时, 可能犯错误,可能拒绝了实际 上成立的H0, 称为 І 类错误( “弃真”的错 误 ),其概率大小用 α 表示。 H0 时,也可能犯错误,没有拒绝 实际上不成立的H0 , 这类称为 II 类错误( ”存 伪”的错误), 其概率大小用 β 表示, β 值一般 不能确切的知道。
• .某市250名8岁男孩体重 有95%的人在18~30kg 范围内,由此可推知此 250名男孩体重的标准差 大约为 • A. 2 kg • B. 2.326 kg • C. 6.122 kg • D. 3.061 kg • E. 6 kg
• 同样性质的两项研究工作 中,都作两样本均数差别 的假设检验,结果均为P< 0.05,P值越小,则 • A. 两样本均数差别越大 • B. 两总体均数差别越大 • C. 越有理由说两总体均 数不同 • D. 越有理由说两样本均 数不同 • E. 越有理由说两总体均 数差别很大
3. 统计学中的差异显著或不显著,和日常生
活中所说的差异大小概念不同. (不仅区别于均
数差异的大小,还区别于均数变异的大小)

第五章t检验

第五章t检验
▪ 20.99,20.41,20.62,20.75,20.10,20.00, 20.80,20.91,22.60,22.30,20.99,20.41, 20.50,23.00,22.60 计算得均数为21.13,标准差为0.98
样本均数与总体均数的比较
▪ 建立检验假设,确定检验水准 H0: = 0 H1: ≠ 0 =0.05
相等
一、单样本t检验 one sample t-test
▪ 即样本均数代表的未知总体均数和已知 总体均数0(一般为理论值、标准值或 经过大量观察所得的稳定值等)的比较。 这时检验统计量的计算在H0成立的前提 条件下计算。
t
X
S X
X 0 ,
S/ n
n -1
one sample t-test
已知总体
未知总体
X=136.0g/L S= 6.0g/L n=280
出现差别的两种可能:
▪总体均数不同,故样本均数有差别 ▪总体均数相同,差别仅仅是由于抽样误差 造成的
怎样判断属于哪一种可能? 先计算一个统计量,如t值,然后根据相 应的概率做判断。
一、假设检验的基本原理
样本均数与已知总体均数不等,原因? (1) ≠ 0,两总体均数不等 (2)= 0 ,抽样误差所致 这种不等,有多大的可能性由抽样误差造成?如果抽样误差
一般认为双侧检验较保守和稳妥,尤其是多样 本。
▪ 研究者想知道是否有一方较高,则采用单侧 检验(one-side test)。
从专业知识判断知:一结果不可能低于另一结 果,拟用单侧检验。
▪ 一般认为双侧检验稳妥,故常用。
确定检验水准, size of a test,
▪ 过去称显著性水平(significance level)

第五章-t检验

第五章-t检验

单样本t检验结果显示,大学生的人际关系总分显著低于检验值15分,说明大学生的人际 关系困扰程度较轻。
在绘制表格报告统计检验结果时,研究者常用*代表p值大小。一般用**代表p<0.01,用 *代表p<0.05,p大于0.05则不标注*。
17
第 一 节
检检
验验
值样
的本
差来
异自
——


t
单 样 本
的 均 值 与
第 一 节
检检
验验
值样
的本
差来
异自
——


t
单 样 本
的 均 值 与
检指
验定
二、操作方法
( 1 ) 在 SPSS 菜 单 栏 中 选 择 【 分 析 】> 【比较均值】>【单样 本t检验】菜单命令, 如图5-1所示。
10
图5-1 单样本t检验的操作命令
第 一 节
检检
验验
值样
的本
差来
异自
——


t

t
单 样 本
的 均 值 与
检指
验定
12
二、操作方法
(3)在【检验变量】列表框下方的【检验值】 编辑框中输入某个数值,这个数值往往是总体均值 或某个已知的值。
(4)单击【选项】按钮,将弹出【单样本t检验: 选项】对话框,如图5-3所示,根据需要设定置信区 间和缺失值的处理方式。系统默认置信区间的百分 比为95%,缺失值的处理方式为【按分析顺序排除 个案】,即当计算涉及到包含缺失值的个案时,系 统自动剔除该个案。当然,研究者也可以选择【按 列表排除个案】方式,即系统先剔除所有包含缺失 值的个案后再进行分析。但在很多情况下都保持系 统默认设置,不做改变。完成设置后,单击【继续】 按钮,返回【单样本t检验】对话框。

第五章 T检验

第五章 T检验

如果P> a,则接受H0,拒绝H1,方差相等。
例5.3现希望评价两位老师的教学质量,试比较其分别任 教的甲、乙两班(设甲、乙两班原成绩相近,不存在差别) 考试后的成绩是否存在差异?

甲班:85 73 86 77 94 68 82 83 90 88 85 87 74 85 80 82 88 90 93 乙班:75 90 62 73 75 75 76 83 66 65 78 80 68 87 74 64 68 72 80

5.3两组独立样本t检验
该检验相应的假设为:

H0:u1= u2 两个样本均数的差异完全是由抽样误差造成 的,两个总体均数相等。 H1 :u1≠ u2两个样本均数的差异除由抽样误差造成外, 两总体均数确实存在差异。

方差齐性检验
两个总体的方差相等。
两个总体的方差不等。 计算F统计量,确定P值。 如果P≤ a,则拒绝H0,接受H1,方差不等。
成 绩
甲班的成绩要高于乙班, 其老师的教学质量要高 于乙班教师的教学质量。
5.4两组配对样本t检验
定义:根据样本数据对样本来自的两配对总体的均值是否有 显著性差异进行推断一般用于同一研究对象(或两配对对 象)分别给予两种不同处理的效果比较,以及同一研究对 象(或两配对对象)处理前后的比较。前者推断两种效果 有无差别,后者推断某种处理是否有效。 基本原理是求出每对值的差值:如果两种处理没有差异,则 总体均数应当为0,反之,差值的总体均数应远离0。通过 检验该差值总体均数是否为0,就可以得知两种处理有无 差异。 H0:ud= 0,两种处理无差别
计算统计量
在原假设H0前提下,认为样本来自u=74的整体,计算t值如 下:
确定P值和结论
自由度df=n-1=15, a=0.05可查表得双侧临界值:

第五章 T检验

第五章 T检验
i
=44 ±1.1
42.9<μ<45.1
2) 从总体上看,男女年龄是否有差异? 解:比较男女平均年龄的总体参数的区间, μ男
(43.8,46.1)
μ女
(42.9,45.1)
二者有交集,故总体年龄在95%的置信度上 没有差异。
3 比例数的参数估计:
当样本的统计量不是平均数,而是以比例的形式出
现时,比如,共青团员在调查中占9.4%,也可以用
x m Z s n
i
来直接计算出|Zxi|是否大于Z95%。
解:1) 确定有关总体参数的假设
H0 : m =800; H1 : m 800;
2) 确定检验此假设的概率标准: 置信度为95%,显著度为5%,即Z=1.96 3)计算Zxi
xi 790 800 z xi 2 S .E 5
5.2 MEANS 过程
• 功能:分组计算、比较指定变量的描述统计量。包括均值、标准差、
总和、观测数、方差等等,还可以给出方差分析表和线性检ompare Means->Means

Dependent List:因变量(分析变量,一般为定距或定序变量)
Independent List:自变量(分组变量,为分类变量,注意可分层)
4)判定:Zxi=-2,绝对值大于Z95%,因此在5%
的显著水平上否定原假设m =800。
接受区95%
样本2:X2= 790;S=10 样本1:X1=795; 假设 m =800 S=10
拒绝区5%
m!1.96S. E
5.均值比较与T检验
• 5.1 均值比较与均值比较的检验过程 • 5.2 MEANS 过程 • 5.3 单一样本的T检验 • 5.4 独立样本的T检验 • 5.5 配对样本T检验

医学统计学第05章 t检验

医学统计学第05章 t检验

25例糖尿病患者 随机分成两组, 总体 甲组单纯用药物 治疗,乙组采用 药物治疗合并饮 食疗法,二个月 后测空腹血糖 (mmol/L) 问两种 样本 疗法治疗后患者 血糖值是否相同?
药物治疗
1
? =
药物治疗合 并饮食疗法
2
推断
甲组
n1=12
XX1 =15.21
乙组 n2=13 X 2=10.85
t 检验——问题提出
径差异不为0;
–0.05。
• 计算检验统计量
–先计算差值d及d2如上表第四、五列所示,本例d = 39, d 2 195。
配对样本均数t检验——检验步骤
– 先计算差数的标准差
Sd
d2
d 2
n
n 1
392
195 12 2.4909
12 1
– 计算差值的标准误
S Sd 2.4909 0.7191 d n 3.464
第三节 两独立样本t检验
• 两独立样本t检验要求两样本所代表的总体服从正 态分布N(μ1,σ12)和N(μ2,σ22),且两总体方 差σ12、σ22相等,即方差齐性(homogeneity of
variance, homoscedasticity)。
• 若两总体方差不等,即方差不齐,可采用t’检验,
–可认为两种方法皮肤浸润反应结果的差别有统计学意 义。
第三节 两独立样本t检验
• 两独立样本t 检验(two independent sample t-test),又称成组 t 检验。
• 适用于完全随机设计的两样本均数的比较,其目 的是检验两样本所来自总体的均数是否相等。
• 完全随机设计是将受试对象随机地分配到两组中, 每组患者分别接受不同的处理,分析比较处理的 效应。

第五章t检验

第五章t检验

第五章t检验第五章 t 检验前面讲了样本平均数抽样分布的问题。

抽样研究的目的是用样本信息来推断总体特征。

所谓统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断,它主要包括假设检验(test of hypothesis )和参数估计(parametric estimation )二个内容。

由一个样本平均数可以对总体平均数作出估计,但样本平均数包含有抽样误差,用包含有抽样误差的样本平均数来推断总体,其结论并不是绝对正确的。

因而要对样本平均数进行统计假设检验。

假设检验又叫显著性检验(test of significance ),是统计学中一个很重要的内容。

显著性检验的方法很多,常用的有t 检验、F 检验和χ2检验等。

尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。

本章以两个平均数的差异显著性检验为例来阐明显著检验的原理,介绍几种t 检验的方法,然后介绍总体参数的区间估计(interval estimation )。

第一节显著性检验的基本原理一、显著性检验的意义为了便于理解,我们用一个具体的例子来说明显著性检验的意义。

随机抽取10头长白猪和10头大白猪的产仔数,数据如下:长白:11,11,9,12,10,13,13,8,10,13 大白:8,11,12,10,9,8,8,9,10,7经计算,得长白猪10头经产母猪产仔平均数1x =11头,标准差S 1=1.76头;大白猪10头经产母猪产仔平均数2x =9.2头,标准差S 2=1.549头。

能否仅凭这两个平均数的差值1x -2x =1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的。

这是因为如果随机测试10头长白猪和10头长白猪的产仔数,可以多得到两个样本数据。

由于抽样误差的随机性,两个样本的平均值不一定是11和9.2,差值也不一定是1.8。

造成这种差异的原因可能有两个,一个是品种造成的差异,即长白猪和大白猪的本质不同,另一个可能是实验误差(或取样误差)。

第5讲t检验.

第5讲t检验.
25
假设检验:
▲ 建立假设: 检验假设:心肌梗塞病人血清 ß 脂旦白与正常人血 清 ß 脂旦白均数相同;
备择假设:心肌梗塞病人血清 ß 脂旦白与正常人血
清 ß脂旦白均数不同; ▲ 确定显著性水平( a ):0.05
26
▲ 计算统计量:t 统计量: t = 4.34;
自由度:25 + 23 –2 = 46
(1) 一个总体均数:3.30kg ;
(2) 一个样本均数:3.42kg ; (3) 可计算出样本标准误:0.42/ 5 (4) n =25 < 100;
14
假设检验:
▲ 建立假设:
检验假设:难产儿平均出生体重与一般 婴儿平均出生体重相同; 备择假设 :难产儿平均出生体重与一般 婴儿平均出生体重不同; ▲ 确定显著性水平( a ):0.05
(1) 一个样本: 均数491.4, 标准差138.5 (mg/100ml);
另一个样本:均数672.3, 标准差150.7 (mg/100ml);
(2) n1=25; n2=23
(3) 近似正态分布:138.5×2 < 491.4; 150.7×2 < 672.3
(4) 方差齐:25/23 < 2
31
例 5-5 表 5-2
国产与进口两药物治疗绝经后妇女
骨 质 疏 松 症 第 2-4 腰 椎 骨 密 度 改 善 值 (mg/cm2)
国产药 -5 64 63 77 74 25 38 n1=20, 68 45 29 9 77 -2 89 77 63 70 36 82 -14 -17 48 47 60 58 11 23 n2=19, 进口药 52 30 15 -4 60 -14 72 61 48 54 22 65
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
两类错误 任何假设检验的结果都有犯错误的可能
• 一类错误:以真为假 - 原假设正确但被否定。 P(一类错误) =
• 二类错误:以假为真 - 原假设错误但被接受。 P(二类错误) =
一般无法计算!
魏泽辉讲义
22
5.1.3显著水平与两种类型的错误 I 型错误和 II 型错误图示
魏泽辉讲义
1-
0
不拒绝H0
真实情况 (未知)
H0为真 H0不真
魏泽辉讲义
所作决策
接受H0
正确
拒绝H0
犯第I类错误
犯第II类错误
正确
25
5.1.4双侧检验和单侧检验
•双侧检验:否定域在检验统计量分布的两尾 •单侧检验:否定域在检验统计量分布的一侧
– 左侧检验:否定域在检验统计量分布的左侧 – 右侧检验:否定域在检验统计量分布的右侧
魏泽辉讲义
26
五、显著性检验中应注意的问题
(一)为了保证试验结果的可靠及正确,要有严密 合理的试验或抽样设计,保证各样本是从相应同 质总体中随机抽取的
(二)选用的显著性检验方法应符合其应用条件 (三)要正确理解差异显著或极显著的统计意义 (四)合理建立统计假设,正确计算检验统计量 (五) 结论不能绝对化
魏泽辉讲义
5
造成差异可能原因:
• 可能是品种造成的差异 • 可能是试验误差(或抽样误差)
如何区分两类性质的差异
怎样通过样本来推断总体
魏泽辉讲义
6
样本平均数作为检验对象的原因
1、离均差的平方和∑( x - x )2最小。
说明样本平均数与样本各个观测值最接 近,平均数是资料的代表数。
2、样本平均数是总体平均数的无偏估计值,
Χ2分 布
1、提出假设
(1) H0:μ=μ0;HA:μ≠μ0 双侧检验
2、计算t值 t x 0
Sx
df n 1
3、查临界t值,作出统计推断
Sx
S n
魏泽辉讲义
34
【例5.1】 母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别 为116、115、113、112、114、117、115、116、114、113(天), 试检验所得样本的平均数与总体平均数114天有无显著差异?
按题意,此例应采用单侧检验。
1、提出无效假设与备择假设 H 0 : =246, H A : >250
魏泽辉讲义
36
1
2、计算 t 值
2
经计算得: x =252,S=9.115
3
所以 t x u = 252 246 = 6 =2.281
魏泽辉讲义
28
t检验主要内容:
显著性 检验
u检验:总体方差已知 单个总体 t检验:总体方差未知
两个总体
非配对试验 配对试验
u检验:总体方差已知
t检验:总体方差未知 方差齐性检验
总体方差未知相等
百分数的比较 总体方差未知不等
标准误
!! 自由度
魏泽辉讲义
t值和临界值
32
5.2 样本平均数与 总体平均数差异显著性检验
假设检验 (hypothesis test)利用样本统计量
对总体的分布特征进行检验
魏泽辉讲义
2
假设检验
• 假设(hypothsis)
– 对总体的某些未知的或不完全知道的性质 所提出的待考察的命题
• 假设检验(显著性检验)
–对假设成立与否做出的推断
(t检验、F检验、2检验 )
魏泽辉讲义
3
5.1 显著性检验的基本原理
本例:试验的表面效应是试验误差的概率在0.01─0.05之间,
小于0.05,故有理由否定H0: 1 2 ,从而接受HA:1 2
结论:可以认为长白猪与大白猪两品种经产母猪产仔数
总体平均数µ1和µ2不相同
魏泽辉讲义
20
5.1.3显著水平与两种类型的错误
• 用来确定否定或接受无效假设的概率标准叫显 著水平(significance level),记作α。 在生物学研究中常取α=0.05或α=0.01
1


拒绝H0
23
5.1.3显著水平与两种类型的错误
影响 II 型错误概率大小的因素 - 显著性水平 - 样本含量 n - 假设分布与真实分布总体平均数之差 - 两个分布的总体方差
检验功效 一个错误的原假设能够被否定的概率 检验功效 = 1 - II 型错误概率 =1-β
魏泽辉讲义
24
5.1.3显著水平与两种类型的错误
第五章 t 检 验
魏泽辉讲义
统计推断的内容之一
1
统计推断 (statistical inference)
统计推断是根据带随机性的观测数据(样本) 以及问题的条件和假设模型,而对未知事物作 出的,以概率形式表达的推断。
参数估计 (parameter estimation)用样本
统计量对总体参数进行估计
检验一个样本平均数与已知的总体平均数是否有显著差异 (检验该样本是否来自某一总体)
已知的总体平均数一般为一些公认的理论数值、经验数值 或期望数值。
(正常生理指标、怀孕期、家禽出雏日龄)
魏泽辉讲义
33
X 0 X 0
t X 0
n
n
标准 正态 分布
显著性检验步骤
S n
S2
2
(n1)S 2 2
n 1
则 xi= μ+ εi(i=1、2……n)
则,x
xi
n
i
n
总体均数 试验误差
魏泽辉讲义
9
x1 1 1, x2 2 2 x1 x2 (1 1) (2 2 ) (1 2 ) (1 2 )
1 2 : 处理效应 1 2 : 试验误差
x1 x2 : 表面效应
目的就是分析表面效应主要 是由处理效应引起,还是由 实验误差引起。从而分析处 理效应是否存在。
n1 n2
28 21.6 ( 1 1 )
(10 1) (10 1) 10 10
0.742
t x1 x2 11 9.2 2.426
S x1 x2
0.742
P(| t|>2.101)= P(t>2.101)+ P(t <-2.101)=0.05 P(| t|>2.878)= P(t>2.878)+ P(t<-2.878)=0.01
魏泽辉讲义
13
5.1.2显著性检验的基本步骤
例(续):随机抽测10头长白猪和10头大白猪经产母猪的 产仔数,资料如下
长白:11,11,9,12,10,13,13,8,10,13 大白:8,11,12,10,9,8,8,9,10,7
x2 =11头, S1=1.76头 x1 =9.2头,S2=1.549头
表面效应可以计算,实验误 差可以估计,根据这些推断 处理效应是否显著。
魏泽辉讲义
11
5.1.2显著性检验的基本步骤:
1、提出假设
H0:原假设或零假设,被直接检验的假设
HA:备择假设,一旦否定原假设就接受备择假设
2、构造合适的统计量
在无效假设成立的前提下,构造合适的统计量,并研究试 验所得统计量的抽样分布,计算无效假设正确的概率
均数差异不显著,可以认为该样本取自母猪怀孕期为114
天魏的泽总辉讲体义 。
35
【例 5.2】 按饲料配方规定,每 1000kg 某种饲料中维 生素 C 不得少于 246g,现从工厂的产品中随机抽测 12 个样 品,测得维生素 C 含量如下:255、260、262、248、244、245、 250、238、246、248、258、270g/1000kg,若样品的维生素 C 含量服从正态分布,问此产品是否符合规定要求?
- 差异不显著:|t|< t0.05,P>0.05 ; t值的右上方标记“ns”或不标记符号
- 差异显著:t0.05≤|t|<t0.01, 0.01 <P≤0.05 ; t值的右上方标记“*”
- 差异极显著:|t|≥t0.01, P ≤0.01 ; t值的右上方标记“* *”
魏泽辉讲义
21
5.1.3显著水平与两种类型的错误
魏泽辉讲义
4
5.1.1 显著性检验的意义
例:随机抽测10头长白猪和10头大白猪经产母猪的产仔 数,资料如下
长白:11,11,9,12,10,13,13,8,10,13 大白:8,11,12,10,9,8,8,9,10,7
x1 =11头, S1=1.76头 x2=9.2头,S2=1.549头
x1 - x2 =1.8头
魏泽辉讲义
12
3、否定或接受无效假设
根据小概率事件原理,比较检验统计量和临界值的关系,确 定其落在否定域还是接收域。
显著水平:0.01;0.05
(1)差异不显著:接受原假设 (2)差异显著:在 0.05 水平下,否定原假设,接受备择假设 (3)差异极显著:在 0.01 水平下,否定原假设,接受备择假设
- 差异极显著:在 =1%水平下,检验统 计量的观察值落在否定域中
魏泽辉讲义
19
假设推断
若随机事件的概率很小,例如小于0.05,0.01,0.001,称 之为小概率事件;
在统计学上,把小概率事件在一次试验中看成是实际上不 可能发生的事件,称为小概率事件实际不可能原理。
t0.05(18) 2.101 本例t 2.426
n1 n2
12 x1 x2
S x1x2 叫做均数差异标准误;
n1、n2为两样本的含量。
统计量t 服从自由度df =(n1-1)=(n2-1)的t分布
魏泽辉讲义
ቤተ መጻሕፍቲ ባይዱ
15
构造检验统计量
相关文档
最新文档