6.计量资料的统计推断—t检验
实习3 计量资料的统计推断.
分析
• 计算差值d d • 计算 d n
s
d
d d n
2
2
n 1
s
• 计算t值
d
Sd n
d 0 t Sd
4.已知某地120名正常成人脉搏均数为 73.2/min,标准差为8.1/min,试估计该地正常 成年人脉搏总体均数的95%可信区间。
分析 1.大样本 2.代入公式,计算t值
5.某地区1999年测定了30岁以上正常人与冠心病人 的血清总胆固醇含量(mmol/L),资料见实习表3-1。 试检验正常人与冠心病人血清总胆固醇含量的差异有 无显著性。
实习表3-1 某地区30岁以上正常人与冠心病人的血清总胆固醇含量(mmol/L)
组别 测定人数 56 正常人 142 冠心病人
均数 4.67 5.78
• • • •
利用公式估计医学正常值 估计总体均数的可信区间 两样本均数比较的u检验 样本均数与总体均数的比较
2.某校在体检中随机抽取了同年级男生12 人,女生15人,测定其体重指数(BMI), 结果如下,试分析男女生体重指数有无差异?
男生(12人): 20.7 22.4 19.6 20.1 20.8 23.1 18.2 19.6 19.9 21.7 22.5 22.0 女生(15人): 18.5 17.6 19.5 18.7 21.3 20.5 17.5 21.9 22.1 20.8 19.7 19.0 19.8 20.5 20.7
分析
• • • • 计算男生体重指数的样本均数,标准差 计算女生体重指数的样本均数,标准差 进行两样本均数比较的t检验 利用计算器统计功能键进行简化计算
3.某新药治疗贫血患者12名,治 疗前和治疗后的血红蛋白(g/L)含 量如下: 患者号 1 2 3 4 5 6 7 8 9 10 11 12 治疗前 123 110 130 142 133 129 100 110 125 128 117 107 治疗后 128 135 128 147 150 140 125 127 130 150 127 110
T检验-郑金来
18
t 值表规律:
(1) 自由度(υ)一定时,p 与 t 成反比;
(2) 概率(p) 一定时, υ 与 t 成反比;
zhengjinlai@
19
小样本思想
戈塞特:t分布与小样本
由于“有些实验不能多次地进行”,从而“必须 根据少数的事例(小样本)来判断实验结果的正 确性”
与正态分布的关系
Lower Bound Upper Bound
.241 .478
zhengjinlai@
36
Statistics 身 高 N Mean Std. Error of Mean Std. Deviation Percentiles Valid Missing
2.5 97.5
100 0 163.7430 .37998 3.79985 155.9675 170.8850
标; 样本均数的标准差。
SPSS结果中用std. error of mean 表示
zhengjinlai@
10
标准误示意图
X1 S1
μσ
X2 S2 XI Si Xn Sn
σx
X服从什么分布?
zhengjinlai@
二、(均数)标准误
sx
s n
意义:反映抽样误差的大小。标准误越小,
zhengjinlai@
15
zhengjinlai@
16
t 分布(与u 分布 比较的特点)
zhengjinlai@
17
t 值表
横坐标:自由度, υ 纵坐标:概率, p, 即曲线下阴影部分的面积; 表中的数字:相应的 |t | 界值。
zhengjinlai@
zhengjinlai@
医学统计学-第六章t检验
t
X1 X2
S
2 C
1 n1
1 n2
n1 n2 2
S
2 C
n1
1S
2 1
n 2
1S
2 2
n1 n2 2
两本均数比较的t检验亦称为成组t检验,又称为独立样本t检验
(independent samples t-test)。 适用于比较按完全随机设计而得到的两组资料,比较的目的是推断它们
各自所代表的总体均数和是否相等。
➢ 假设检验的基本思想
➢ 假设检验的基本思想是小概率反证法思想。
➢ 小概率事件(P≤0.05)是指在一次试验中基本上不大会发生的
事件。 ➢ 小概率事件原理:一个事件如果发生的概率很小,那么它在一次
试验中是实际不会发生的。在数学上,我们称这个原理为小概率 事件原理。 ➢ 反证法思想是先提出假设,再用适当的统计方法确定假设成立的 可能性大小,如可能性小,则认为假设不成立,若可能性大,则还 不能认为假设不成立。
α =0.05
SC2=699.725,t=-3.764
3.确定P值 ,作出推断结论
υ =20+20-2=38 , 查 t 界 值 表 , 得 t0.05/2,38=2.024, 现 |t|=3.764>t0.05/2,23=2.069,故P<0.05。按α=0.05水准,拒绝 H0,,接受H1,差异有统计学意义。
F
S12 (较大) S( 22 较小)
υ1为分子自由度,υ2为分母自由度
F统计量服从F分布,可以查F界值表,附表3-3。F值越大, 对应的P值越小。
1.建立假设,确定检验水准
2.计算统计量
F
S12 (较大)=26.82/26.12 =1.051 S( 22 较小)
统计学t检验简介(六)
检验的步骤:
(1)提出假设 H : 38, H1 : 38
(2)计算统计量的值
t
X X
42 38 5.7
3.365
n 1 24 1
(3)确定检验的形式(右尾检验)
(4)统计决断 t 3.365** t230.01 2.500
所以在0.01显著性水平上,拒绝初始假设,接 受备择假设.即:这一届初一学生的自学能力极 其显著地高于上一届.
(4)统计决断
df=20-1=19 t=2.266*> t190.05 2.093
所以在0.05水平上拒绝初始假设,接受备择假设,即该校 初三英语平均分数与全区平均分数有本质区别,或者说, 它不属于平均数为65的总体.
某校上一届初一学生自学能力平均分数 为38,这一届初一24个学生自学能力平均 分数为42,标准差为5.7,假定这一届初一 学生的学习条件与上一届相同,试问这一 届初一学生的自学能力是否高于上一届?
Z
X
63 68 8.6
3.94
确定检验的形式(采用左尾检验) n
46
统计决断
所以在0.01水平上拒
绝 ,接受
,即该校入学考试数学的平均分极其显著地低于全
市的[自平己均总分结数单。侧Z检验的H统3 .计94决** 断 规2H.31则3。 Z] 0.01
Z0.05 1.65
对12名来自城市的学生与14名来自农村的学生进 行心理素质测验,试分析城市学生与农村学生心 理素质有无显著差异。
对12名学生进行培训之后,其培训前后某项心理 测试得分如表5.1所示,试分析该培训是否引起 学生心理变化。
均值比较的概念
统计学常用概念:T检验、F检验、卡方检验、P值、自由度
统计学常⽤概念:T检验、F检验、卡⽅检验、P值、⾃由度1,T检验和F检验的由来⼀般⽽⾔,为了确定从样本(sample)统计结果推论⾄总体时所犯错的概率,我们会利⽤统计学家所开发的⼀些统计⽅法,进⾏统计检定。
通过把所得到的统计检定值,与统计学家建⽴了⼀些随机变量的概率分布(probability distribution)进⾏⽐较,我们可以知道在多少%的机会下会得到⽬前的结果。
倘若经⽐较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信⼼的说,这不是巧合,是具有统计学上的意义的(⽤统计学的话讲,就是能够拒绝虚⽆假设null hypothesis,Ho)。
相反,若⽐较后发现,出现的机率很⾼,并不罕见;那我们便不能很有信⼼的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。
F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。
统计显著性(sig)就是出现⽬前样本这结果的机率。
2,统计学意义(P值或sig值)结果的统计学意义是结果真实程度(能够代表总体)的⼀种估计⽅法。
专业上,p值为结果可信程度的⼀个递减指标,p值越⼤,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。
p值是将观察结果认为有效即具有总体代表性的犯错概率。
如p=0.05提⽰样本中变量关联有5%的可能是由于偶然性造成的。
即假设总体中任意变量间均⽆关联,我们重复类似实验,会发现约20个实验中有⼀个实验,我们所研究的变量关联将等于或强于我们的实验结果。
(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效⼒有关。
)在许多研究领域,0.05的p值通常被认为是可接受错误的边界⽔平。
3,T检验和F检验⾄於具体要检定的内容,须看你是在做哪⼀个统计程序。
举⼀个例⼦,⽐如,你要检验两独⽴样本均数差异是否能推论⾄总体,⽽⾏的t检验。
数值变量的统计推断-t检验
例3 25例糖尿病患者随机分成两组,
甲组单纯用药物治疗,乙组采用药物
治疗合并饮食疗法,2个月后测空腹
血糖,如表所示,问二组患者血糖值
是否相同?
表 25 名糖尿病患者两种疗法治疗后 2 个月血糖值(mmol/L) 编 号 1 2 3 4 5 6 7 8 9 10 11 12 甲组血糖值 (X1) 8.4 10.5 12.0 12.0 13.9 15.3 16.7 18.0 18.7 20.7 21.1 15.2 编 号 1 2 3 4 5 6 7 8 9 10 11 12 13 乙组血糖值 (X2) 5.4 6.4 6.4 7.5 7.6 8.1 11.6 12.0 13.4 13.5 14.8 15.6 18.7
表 5-3
编号
两种饲料喂养小白鼠 4 周后体重增重(g)情况
高蛋白组体重增加 量(X1) 编号 低蛋白组体重增加 量(X2) 1 2 3 4 5 6 7 8 9 10 11 12 13 36 38 37 38 36 39 37 35 33 37 39 34 36
1 2 3 4 5 6 7 8 9 10 11 12
S 6.5次 / 分 , n 30
µ0=72次/分
µ=?
已知总体
n=30,
未知总体
x 74 .2 次/分 S 6.0 次/分
假设检验的基本步骤
Ⅰ 建立检验假设,确定检验水准 Ⅱ 选择统计方法,计算检验统计量 Ⅲ 确定P值,作出推断结论
Ⅰ、建立检验假设,确定检验水准
假设有两种:
(1)用H0表示 : 即检验假设,常称为无效假设。
样本对总体有较好代表性,对比组间有较好组间均衡性—随 机抽样和随机分组; 样本来自正态分布总体,配对t检验要求差值服从正态分布, 实际应用时单峰对称分布也可以;大样本时,用u 检验,且
《计量资料的统计推断》的复习思考题
《计量资料的统计推断》的复习思考题1.什么是统计推断?统计推断包括哪两方面内容?2.什么样的分布是t分布?对称分布、正态分布、t分布和标准正态分布有何区别和联系?3.什么是标准误?标准差和标准误有什么区别和联系?4.什么是总体均数的可信区间?某指标的95%正常值范围和95%可信区间有何区别何联系?5.显著性检验的目的意义是什么?基本原理是什么?前提条件有哪些?6.什么情况下可认为具有可比性?举例说明日常生活中常犯的没有可比性时进行比较的错误。
7.显著性检验的一般步骤有哪些?8.显著性检验时,假设有几种?哪几种?如何假设?9.假设检验时,如何选择进行单侧或双侧检验?10.什么是检验水准/显著性水平?一般是多少?如何根据实际情况来确定检验水准?11.假设检验时的“P值”是什么?举例说明。
12.统计学结论和实际意义有何异同?13.什么情况下应该作u/z检验?什么情况下应该作t检验?14.举例说明成组设计和配对设计有何区别。
15.有人说,“只要是比较两个均数,都可以作t检验。
”你认为这种说法对吗?为什么?16.什么是I类错误?什么是II类错误?为什么显著性检验时会犯这两类错误?这两类错误各有什么特点?相互之间有什么关系?17.什么是把握度?科学研究时如何才能使把握度达到一定的水平?18.为什么说统计学结论是概率性的,既不绝对肯定,也不绝对否定?19.随机抽取某品种2月龄苗猪25头,测得其平均体重为20kg,标准差为3kg。
试估计该品种2月龄苗猪的体重。
20.随机测得100听某批某种罐头净重量平均为344.0g,标准差为4.43g。
试估计该批该种罐头的净重量和正常值范围。
21.某鱼场按常规方法所育鲢鱼苗一月龄的平均体长为7.25cm,标准差为1.58cm。
为提高鱼苗质量,现采用一新方法进行育苗,一月龄时随机抽取100尾进行测量,测得其平均体长为7.65cm。
试问新方法能否使一月龄鲢鱼苗体长更长?22.某名优绿茶含水量标准为不超过5.5%。
计量资料的统计推断-t检验
t分布 特征
f(t)
ν─>∞(标准正态曲线) ν =5 ν =1
-5
-4
-3
-2
-1
0
1
不同自由度下的t 分布图
2
3
4
5
• 自由度ν 不同,曲线形态不同,t分布是一簇曲线。 • 自由度ν 越大,t分布越接近于正态分布;当自由度 ν 逼近∞时,t分布趋向于标准正态分布。
t
概率、自由度与t值关系 ——t界值
140 138 140 135 135 120 147 114 138 120
治疗矽肺患者血红蛋白量(克%)
编号
1
治疗前
113
治疗后
140
治疗前后差数d
27
2
3 4 5 6
150
150 135 128 100
138
140 135 135 120
-12
-10 0 7 20
7
8 9 10
110
120 130 123
配对样本均数t检验——实例分析
• 例: 有12名接种卡介苗的儿童,8周后用 两批不同的结核菌素,一批是标准结核菌 素,一批是新制结核菌素,分别注射在儿 童的前臂,两种结核菌素的皮肤浸润反应 平均直径(mm)如表5-1所示,问两种结核菌 素的反应性有无差别?
表 5-1
12 名儿童分别用两种结核菌素的皮肤浸润反应结果(mm) 编号 1 2 3 4 5 6 7 8 9 10 11 12 合计 标准品 12.0 14.5 15.5 12.0 13.0 12.0 10.5 7.5 9.0 15.0 13.0 10.5 新制品 10.0 10.0 12.5 13.0 10.0 5.5 8.5 6.5 5.5 8.0 6.5 9.5 差值 d 2.0 4.5 3.0 -1.0 3.0 6.5 2.0 1.0 3.5 7.0 6.5 1.0 39(d) d2 4.00 20.25 9.00 1.00 9.00 42.25 4.00 1.00 12.25 49.20 42.25 1.00 195(d2)
计量资料的统计推断
2018/6/22
Plan 1-2-3-4-5-6-7-9:1-18-26-40-63-81-89-97-106
均数
8
6.
19
2、均数的标准误
均数的标准误 (standard error of mean):样本均数的标准差,它反映了 样本均数间的离散程度。 意 义:反映抽样误差的大小。标准误越 小,抽样误差越小,用样本均数估计总体 均数的可靠性越大。
5
样本均数分布示意图:
样本 1 x1 样本 2 样本 3
x2
x3
总体 X
μσ
样本 4 样本 5
x4
x5 x.....
样本均数 X
若 总 体 服 从 正 态 分 布 或 抽 样 例 数 足 够 大
样本 6
x6
N ,
2018/6/22 Plan 1-2-3-4-5-6-7-9:1-18-26-40-63-81-89-97-106
某地成年男子红细胞数的抽样调查, n=144人,均数为5.38×1012/L, s=0.44×1012/L,求其标准误。
s 0.44 12 sx n 144 0.037(10 / L)
2008执考:若不知总体标准差,反映均数 抽样误差大小的指标,用: A. S B. sx C.SP D.σp E. x
2018/6/22 Plan 1-2-3-4-5-6-7-9:1-18-26-40-63-81-89-97-106 11
3、标准误与标准差的区别与联系 标准差 标准误
意义 衡量均数的标准差,衡 量样本均数的离散程度, 反映了抽样误差的大小。
s
( x x ) n 1
2018/6/22 Plan 1-2-3-4-5-6-7-9:1-18-26-40-63-81-89-97-106 4
医学统计学计量资料的统计推断
医学统计学计量资料的统计推断主要内容:标准误t 分布总体均数的估计假设检验均数的 t检验、u 检验、方差分析几个重要概念的回顾:计量资料:总体:样本:统计量:参数:统计推断:参数估计、假设检验第一节均数的抽样误差与总体均数的估计欲了解某地2000年正常成年男性血清总胆固醇的平均水平,随机抽取该地200名正常成年男性作为样本。
由于存在个体差异,抽得的样本均数不太可能恰好等于总体均数。
一、均数的抽样误差与标准误一、均数的抽样误差与标准误抽样误差:由于抽样引起的样本统计量与总体参数之间的差异X数理统计推理和中心极限定理表明:1、从正态总体N(??,??2)中,随机抽取例数为n的样本,样本均数??X 也服从正态分布;即使从偏态总体抽样,当n足够大时??X也近似正态分布。
2、从均数为??,标准差为??的正态或偏态总体中抽取例数为n的样本,样本均数??X的总体均数也为??,标准差为X标准误含义:样本均数的标准差计算:(标准误的估计值)注意: X 、S??X均为样本均数的标准误标准误意义:反映抽样误差的大小。
标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。
标准误用途:衡量抽样误差大小估计总体均数可信区间用于假设检验二 t 分布对正态变量样本均数??X做正态变换(u变换):X 常未知而用S??X估计,则为t变换:二、 t 分布t值的分布即为t分布t 分布的曲线:与??有关t分布与标准正态分布的比较1、二者都是单峰分布,以0为中心左右对称2、t分布的峰部较矮而尾部翘得较高说明远侧的t值个数相对较多即尾部面积(概率P值)较大。
当ν逐渐增大时,t分布逐渐逼近标准正态分布,当ν→??时,t分布完全成为标准正态分布t 界值表(附表9-1 )t??/2,??:表示自由度为??,双侧概率P为??时t的界值t分布曲线下面积的规律:中间95%的t值:- t0.05/2,?? ?? t0.05/2,??中间99%的t值:- t0.01/2,?? ?? t0.01/2,??单尾概率:一侧尾部面积双尾概率:双侧尾部面积(1) 自由度(ν)一定时,p与t成反比;(2) 概率(p)一定时,ν与t成反比;三总体均数的估计统计推断:用样本信息推论总体特征。
医学统计学第八章-t检验
随机数:206 126
……
试验
对照
试验
对照
对照
试验
对子号
试验组
对照组
1
门诊6
门诊1
2
门诊4
门诊2
3
门诊3
门诊5
……
……
试验组与对照组的两个观察对象均按照一定的条件配成对子, 同一对子中的“混杂”因素在二者间几乎相同;而在不同对子 间这些“混杂”因素则有可能差别很大
01
02
03
单样本资料的t检验
单样本资料的t检验
P/ 2
P / 2
t39
0
-2.023
2.023
-1.294
1.294
1/2α
1/2 α
由于t=-1.294>t0.05/2,35=-2.023,因此虽然无法准确得出P值,但仍然可以推断P>0.05(经过计算机软件得出结果P=0.203 )
在a=0.05的水准上,不拒绝H0,尚不认为农村新生儿的出生体重与该地平均水平不同。
2
样本对应的总体均数等于3.36,仅仅是由于抽样误差所致这种差别;
3
非抽样误差,二者的确有别?
4
两种情况只有一个是正确的,且二者必居其一,需要我们作出推断。
单样本资料的t检验
H0:=3.36,农村新儿体重与该地平均水平相同
H1:≠3.36,二者不同 (有可能高也有可能低,总之不相等即可)
检验水准a=0.05(双侧)
02
假设检验与区间估计的关系
2.018
前面阐述了方差齐性的情况下,如何进行两个样本均数比较的t检验
如果方差不齐,很多学者建议在这样的情况下采用自由度校正的方法计算t分布的概率,或者直接采用非参数检验
第六讲t检验
2 1
2 2
12
第三节 两独立样本t检验
两独立样本检验两样本含量可以相等或不等,但在总例数不变 的条件下,当两样本含量相等时,统计检验效率较高 。
两独立样本t检验统计量公式为:
t
S X1 X 2
X1 X 2 S X1 X 2
S
ห้องสมุดไป่ตู้2 c
(n1 1) (n2 1) n1 n2 2
X 0
/ n
8
第二节 单样本t检验
【例 7-2】已知用常规水提法粗提人参须根总皂苷得率为 9.23 (%), 现用碱水提取法粗提人参须根总皂苷10次,其得率(%) 分别为 9.54 , 9.61 , 9.25 , 9.47 , 9.56 , 9.42 , 9.58 , 9.59 , 9.48, 9.65 。问用两种方法粗提人参须根总皂苷得率有无差别?
S12 F 2 , 1 =n1 1 , 2 n2 1 S2
15
第四节 两独立样本校正t检验
Levene检验:对资料不要求正态性,既可以用于正态分布 的资料,又可用于非正态分布的资料或分布不明的资料, 用于检验两个或两个以上样本间的方差是否齐 。 SPSS统计软件在进行两独立样本检验时自带基于均数(正 态资料)的Levene法的方差齐性检验。 说明:若样本含量较大, n1和n2 均大于50,可不必做方差 齐性检验。未进行方差检验时也可简单判断两样本的方差 齐性,当一个样本的方差是另一个样本方差的3倍以上时, 可认为两总体方差不齐。
d 1.144 d t 4.39 n 1 9 1 8 Sd S / n 0.783 9
0 .05 :
(3)确定值,作出统计推断 查t界值表(附表2)得 t 0.05 / 2 (8) 2.306 t t 0.05 / 2 (8)
计量资料统计推断(t检验)-预防医学-课件
3
样本量的确定
合理的样本量对于可靠的t检验结果至关重要。掌握样本量的计算方法和实际应 用技巧。
步骤
假设检验
明确研究问题并提出原假设和备择假设,为接 下来的检验做好准备。
计算P值
通过t值、自由度和显著性水平计算P值,以判 断差异是否显著。
检验统计量
计算t值作为判断两个平均值是否有显著差异的 统计量。
t检验是用于比较两个平均值是否有显著差异的统计方法。它可以帮助我们判 断一种干预措施对预防医学中的结果是否产生了显著影响。
原理
1
正态分布
数据符合正态分布的假设是t检验的前提之一。了解正态分布对于正确应用t检验 至关重要。2单侧、双侧t检验
t检验可以根据研究问题和假设,选择进行单侧或双侧检验,以得出准确的结论。
结果分析
根据P值和显著性水平,判断研究结果是否支持 原假设,进行科学的结论推断和决策。
应用和实例
预防医学中的应用举例
通过实际的研究案例,展示t检验在预防医学领域中 的应用和实际效果。
使用Excel进行统计分析
探索如何使用Excel进行t检验和统计分析,使数据处 理更加高效和准确。
注意事项
数据采集和处理
2 t检验的应用前景
展望t检验在预防医学领域的应用前景,并提 供相关建议和思考。
计量资料统计推断(t检 验)-预防医学-课件
探索计量资料统计推断中的t检验在预防医学中的重要性和应用。通过深入介 绍其原理、步骤和应用实例,让你深入理解这一统计方法。
统计学概述
统计学是研究收集、整理、分析和解释数据的科学。它提供了一种方法来从 数据中推断出关于总体的信息,并进行相应的决策。
t检验是什么?为什么要使用?
计量资料统计推断(t检验)-预防医学-课件
02
t检验的步骤
建立假设
假设检验的基本思想
设立原假设的依据
在假设检验中,通常先设立一个原假 设,然后基于样本数据对原假设进行 检验,判断是否拒绝原假设。
原假设的设立通常基于已有的研究结 果、理论或实践经验,并且原假设应 该是一个可以验证的命题。
原假设与备择假设
原假设通常是研究者想要否定的假设 ,备择假设则是研究者想要接受的假 设。
p值是用于判断是否拒绝原假设 的统计量,p值越小,说明样本 数据与原假设之间的差异越大,
越有理由拒绝原假设。
显著性水平
显著性水平是预先设定的一个临 界值,用于判断是否拒绝原假设
,通常取0.05或0.01。
结论的表述
根据p值与显著性水平的比较结 果,可以得出是否拒绝原假设的 结论,并进一步解释结果的意义
断实验处理或条件改变对数据的影响。
两独立样本t检验
总结词
用于比较两个独立样本的平均值是否存 在显著性差异。
VS
详细描述
两独立样本t检验,也称为两组独立样本t 检验,是统计学中常用的方法之一,用于 比较两个独立样本的平均值是否存在显著 差异。这种方法常用于比较不同组对象的 数据、不同条件下的独立测量等。通过计 算t统计量,我们可以判断两组独立样本 的均值是否存在显著差异,从而推断不同 组别或条件对数据的影响。在进行两独立 样本t检验时,需要注意样本来自的总体 是否具有方差齐性和正态分布等统计假设 ,以确保检验结果的准确性和可靠性。
t检验的适用范围
• t检验适用于样本量较小、数据分布情况未知或总体标准差未知的情况。在预防医学领域,t检验常用于比较两组人群的生理 指标、行为习惯等计量资料的差异。
t检验的假设条件
• 假设条件包括:样本数据来自正态分布总体、总体 方差齐性、独立样本等。在进行t检验之前,需要检 验样本数据是否满足这些假设条件,以确保统计推 断的准确性。
计量资料两组均数的比较 t检验
t 16.9133 0 8.4386 6.9430 / 12
3. 确定 P 值和作推断 查附表 2(t 界值表), t0.05/2,11 2.201,得 p<0.05, 在 =0.05 的水准上
拒绝 H0 ,可以认为健康教育干预措施对于该地区儿童血铅水平的下降有效。
如果 P 值小于或等于检验水准α,意味着在 H0 成立的前提下发生了小概率 事件,根据“小概率事件在一次随机试验中不(大)可能发生”的推断原理,怀 疑 H0 的真实性,从而做出拒绝(reject) H0 的决策。因为 H1 与 H0 是对立的, 既然拒绝 H0 ,就只能接受 H1
如果P值大于α,在 成立的假设下发生较为可 能的事件,没有充足的理由对 提出怀疑。于 是做出不拒绝 的决策
推断样本来自的总体均数µ与已知的某一总体均数µ0(常 为理论值或标准值) 有无差别
n1 t X0 X0
sx
sn
3.确定P值 P值的意义是: 如果总体状况和 一致,统计 量获得现有数值以及更不利于 的数值的可能性(概率) 有多大
第二节 两相关样本均数的比较
配对设计主要适用于以下情况: 同一受试对象处理前后的比较,或两个部位的数据,
1.选择检验方法,建立检验假设并确定检验水准 根据研究目的、研究设计的类型和资料特点(变量种类、
样本大小)等因素选择合适的检验方法。并且将需要推断 的问题表述为一对关于总体特征的假设。 原假设(null hypothesis),又称无效假设,记为H0; 对立假设(alternative hypothesis),又称备择假设,记 为 H1。
如果
2 1
2 2
,两总体分别记为
N
(1
计量资料两组均数的比较 t检验
确定检验水准
确定检验水准β通常为0.2
确定检验水准α通常为0.05
确定检验水准α和β的关系 通常为α+β1
确定检验水准α和β的取舍 通常根据研究目的和实际情
况进行选择
计算样本均数和标准差
计算两组样本的均数
计算t值
计算两组样本的标准差
计算t检验的p值
计算两组样本的标准差之比
判断是否拒绝原假设得出结论
描述性统计用于 描述数据的分布 特征参数统计用 于推断总体特征。
描述性统计不涉 及样本量的大小 参数统计需要一 定的样本量才能 进行。
t检验的适用范围
两组独立样本 两组样本服从正态分布 两组样本方差相等或不相等 两组样本数量相等或不相等
t检验的基本原理
假设检验:检验两组均数是否相等 统计量:t统计量用于衡量两组均数的差异程度 自由度:样本量减1用于计算t统计量的分布 显著性水平:设定一个阈值用于判断两组均数差异是否显著
t值越大表示两组均数差异越大
t值与显著性水平α的关系:t值大于临 界值表示两组均数差异具有统计学意 义
t值小于0表示两组均数差异为负即第一 组均数小于第二组
t值小于临界值表示两组均数差异不具 有统计学意义
p值的意义解读
p值是t检验的核 心表示两组均数 差异的显著性
p值小于0.05表示 两组均数差异具 有统计学意义
t检验的假设条件
两组样本来自同一总体 两组样本服从正态分布 两组样本的方差相等 两组样本的样本量足够大
t检验的步骤
确定样本量
确定研究目的和假设 确定样本量计算公式 确定显著性水平α和检验效能1-β 确定样本量计算公式中的其他参数如标准差、均值等 计算样本量并考虑实际可行性和伦理问题 确定最终样本量并进行t检验
统计学重点(8)
名词解释:1.参数(p a r a me t e r):总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。
是固定的常数统计量(s t a t i s t i c):样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为X、S。
是参数附近波动的随机变量。
2.系统误差(s y s t e m e r r o r):实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或能掌握的。
(受确定因素影响,大小变化有方向性)随机误差(r a n d o m e r r o r):一类不固定的、随机变化的误差,由多种尚无法控制的因素引起。
(影响因素众多,变化无方向性,不可避免,但可用统计方法进行分析)医学参考值(r e f e r e n c e v a l u e):是指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数,也称正常值。
可信区间(c o n f i d e n c e b o u n d/c o n f i d e n c e i n t e r v a l,C I):按预先给定的概率(1-a)所确定的包含未知总体参数的可能范围。
3.I型错误(弃真):拒绝实际上成立的H0,这类“弃真”的错误称为I型错误。
(1-a)即可信度:重复抽样时,样本区间包含总体参数(m)的百分数。
I I型错误(纳伪):接受了实际上不成立的H0,这类“取伪”的错误称为I I型错误,记为β。
(1-β)即把握度(或检验效能):两总体确有差别,被检出有差别的能力。
4.P值:H0成立的前提下,用样本数据所获得的检验统计量,及比样本数据绝对值更为极端的某曲线下的面积。
二项分布(b i n o mi a l d i s t r i b u t i o n):是指在只会产生两种可能结果如“阳性”或“阴性”之一的n次独立重复试验中,当每次试验的“阳性”概率π保持不变时,出现“阳性”次数x=0,1,2…n的一种概率分布。
统计学复习题
《医学统计学》复习资料广西医科大学流行病与卫生统计学教研室2013.1.52012年留学生总复习练习题Part A理论考试题型一、单选题(每题1.5分,共45分。
请在答题卡上将正确答案对应的字母涂黑二、辨析题(每题3分,共15分。
判断对错,并给出理由)三、简答题(每题5分,共10分)四、分析应用题(共30分+10分)Part B练习题一、单选题(每题1.5分,共45分。
请在答题卡上将正确答案对应的字母涂黑)(一)计量资料统计描述1.卫生统计工作的步骤为________。
A.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表2.某病患者5人的潜伏期(天)分别为6,8,5,10,>13,则平均潜伏期为________。
A.5天B.8天C.6~13天D.11天3.算术均数与中位数相比,。
A.抽样误差更大B.不易受极端值的影响C.更充分利用数据信息D.更适用于分布不明及偏态分布资料值为。
4.标准正态分布中,单侧u0.05A.1.96B.0.05C.1.64D.0.0255.统计分析的主要内容有________。
A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表6.统计资料的类型包括________。
A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料7.抽样误差是指________。
A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称8.统计学中所说的总体是指________。
A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体9.描述一组偏态分布资料的变异度,宜用________。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6 计量资料的统计推断-t检验t检验是以t分布为理论依据的假设检验方法,常用于正态总体小样本资料的均数比较,t检验统计量有三个不同的形式,适用于单因素设计的三种不同类型:①单个样本的均数与已知总体均数比较的检验,适用于单组设计,给出一组服从正态分布的定量观测数据和一个标准值(总体均值)的资料。
②配对t检验,适用于配对设计。
③成组t检验,适用于完全随机设计的两均数比较。
SPSS中使用菜单Analyze →Compore Means作t检验,Compore Means的下拉菜单如表6-1所示。
表6-1 Compore Means下拉菜单Means…分层计算…One-Sample T Test…单样本t检验…Independent-Samples T Test…独立样本t检验…Paired-Sample T Test…配对t检验…One-Way ANOV A…单因素方差分析…6.1 计量资料的分层计算Means过程可以对计量资料分层计算均数、标准差等统计量,同时可对第一层分组进行方差分析和线性趋势检验。
例6-1某学校测得不同年级、不同性别的12名学生的身高(cm),数据见表6-2。
试用SPSS的Means过程分别计算不同年级、不同性别学生身高的均数和标准差。
表6-2 12名学生的身高(cm)解年级:1=“初一”、2=“高一”,性别:1=“男”、2=“女”。
选择Analyze→Compare Means→Means命令,弹出Means对话框,如图6-2。
在变量列表中选中身高,送入Dependent(因变量)框中;选中年级,送入Independent(自变量),确定第一层依年级分组,单击Next按钮,选中性别,送入Independent,确定第二层依性别分组;单击OK。
输出结果如图6-3所示。
在Means对话框单击Options(选项)按钮,弹出Means:Options对话框,可以选择要计算的统计量,默认Mean、Number of cases、Standard Deviation;在Statisti cs for First Layer中,可对第一层分组作方差分析(Anova table and eta)和线性趋势检验(Test for linearity)。
图6-1 数据文件L6-1.sav 图6-2 Means对话框图6-3 例6-1计算结果图6-4 例6-2正态性检验结果6.2 单样本t检验单样本t检验是样本均数与已知总体均数比较的t检验,要求原始数据是一组服从正态分布的定量观测数据,原假设为H0:μ=μ0,μ0一般为理论值、标准值或经过大量观察所得的稳定值。
例6-2某中药厂用旧设备生产的六味地黄丸,丸重的均数是8.9克,更新设备后,从所生产的产品中随机抽取9丸,其重量为:9.2,10.0,9.6,9.8,8.6,10.3,9.9,9.1,8.9。
问:设备更新后生产的丸药的平均重量有无变化?解这是单组计量资料分析,H0:μ=8.9,H1:μ≠8.9。
以丸重为变量名,将原始数据建立为9行1列的数据文件。
1.用Explore过程进行正态性检验选择菜单Analyze →Descriptive Statistics→Explore,在弹出的Explore对话框中,将丸重送入Dependent框中;单击Plots按钮,在弹出的Plots对话框中选中Nomality plots with tests,单击Continue;单击OK。
主要输出结果见图6-4,可知,P=0.832>0.05,可认为丸重x服从正态分布。
2.用One-Sample T T est过程进行单样本t检验选择菜单Analyze →Compare Means→One-Sample T Test,在弹出的One-Sample T Test对话框中,选中丸重,将丸重送入上面的Test(检验变量)框中;在下面的Test(检验值)对话框中改系统默认值0为8.9,如图6-5所示;单击OK。
图6-5 One-Sample T Test对话框图6-6 单样本t检验计算结果主要输出结果如图6-6,t=3.118,双侧P=0.014<0.05,按α=0.05水准拒绝H0,差异有统计学意义,可以认为设备更新后生产的丸药的平均重量有变化。
样本均值=9.489>8.9,可以认为,设备更新后生产的丸药的平均重量大于设备更新前。
也可用置信区间推断,由95%Confidence Interval of the Difference(差值的95%CI)为(0.153,1.024),不含0(如果H0:μ=μ0成立,则差值的均数应为0),所以,按α=0.05水准,可以认为设备更新后生产的丸药的平均重量有变化。
6.3 两组配对样本t检验配对t检验是将配对的两组相关资料转化为单组差值资料,适用于配对设计,要求成对数据的差值d服从正态分布。
差值d不服从正态分布,应该选择非参数检验。
例6-3对12份血清分别用原方法(检测时间20分钟)和新方法(检测时间10分钟)测谷-丙转氨酶(nmol·S-1/L),结果见表6-3。
问两法所得结果有无差别?表6-3 12份血清的谷-丙转氨酶编号 1 2 3 4 5 6 7 8 9 10 11 12原法60 142 195 80 242 220 190 25 212 38 236 95新法80 152 243 82 240 220 205 38 243 44 200 100 解这是配对比较,H0:μd=0,H1:μd≠0。
以编号、原法和新法为变量名,将原始数据建立为12行3列的数据文件。
1.计算差值d选择菜单Transform→Compute V ariable,在Target V ariable框中输入d;选中原法,将其送入Numeric expression框中,单击运算键中的“-”,选中新法,将其送入Numeric expression框中;单击OK。
数据文件中增加新变量d。
2.对差值d进行正态性检验步骤见例6-2。
计算出的Shapiro-Wilk统计量,P=0.392>0.05,可认为配对差d服从正态分布。
3.进行配对t检验选择菜单Analyze → Compare Means→ Paired-Sample T Test,弹出的Paired-Sample T Test 对话框(见图6-7),选中原法和新法,将其送入Paired V ariables(配对变量)框中,单击OK。
主要输出结果如图6-8,t=-1.602,双侧P=0.137>0.05,按α=0.05水准不拒绝H0,差异无统计学意义,还不能认为两法测谷-丙转氨酶结果有差别。
图6-7 Paired-Sample T Test 对话框图6-8 两组配对样本t检验计算结果6.4 两组独立样本t检验完全随机设计两组试验资料的分析,一般用成组t检验,推断两总体均数是否相等。
要求两样本相互独立,总体均服从正态分布并且方差齐性。
在两组均正态的条件下,满足方差齐性,用成组t检验(参数检验);不满足方差齐性,可用t′检验,也可用非参数检验。
在正态性不满足的条件下,应该选择非参数检验,也可利用适当的变量变换,使达到正态性和方差齐性,再用t检验。
例6-4测定功能性子宫出血症中实热组与虚寒组的免疫功能,其淋巴细胞转化率如表6-4所示。
比较实热组与虚寒组的淋巴细胞转化率均数是否不同。
表6-4 实热组与虚寒组的免疫功能淋巴细胞转化率实热组0.709 0.755 0.655 0.705 0.723虚寒组0.617 0.608 0.623 0.635 0.593 0.684 0.695 0.718 0.606 0.618解这是成组比较。
H0:μ1=μ2,H1:μ1≠μ2。
以g表示分组(标签值:1=“实热组”、2=“虚寒组”),以x表示淋巴细胞转化率,将原始数据建立成2列15行的数据文件,如图6-9。
1.用Explore过程进行正态性检验选择菜单Analyze →Descriptive Statistics→Explore,在弹出的对话框中,将x送入Dependent框中,将g送入Factor List框中;单击Plots按钮,在弹出的Plots对话框中选中Normality plots with tests,单击Continue;单击OK。
运行后,两组的Shapiro-Wilk统计量分别为0.956、0.855,两组的P值分别为0.782、0.066,均>0.05,均服从正态分布。
2.做成组t 检验选择菜单Analyze → Compare Means→ Independent-Samples T Test,在弹出Independent-Samples T Test 对话框(见图6-10)中,将x选入Test(检验变量)框中,将g选入Grouping(分组变量)框中;单击Define Groups(定义组),在两个Group框中分别键入1和2,单击Continue;单击OK。
图6-9 例6-4数据文件图6-10 Independent-Samples T Test 对话框主要输出结果如图6-11。
先看Levene’s Test for Equality of V ariances(方差齐性Levene检验),若P>0.05,则选择Equal variances assumed(方差齐)的t检验结果;若P≤0.05,则选择Equal variances not assumed(方差不齐)的校正t 检验结果。
t检验或校正t检验的P≤0.05时,认为两总体均数差异有统计学意义;P>0.05时,不能认为两总体均数差异有统计学意义。
本例,Levene’s Test for Equality of V ariances的统计量F=0.938,P =0.350>0.05,不能认为两组的总体方差不齐;t=3.093,双侧P=0.009<0.01,以α=0.01水准的双侧检验拒绝H0,两组的差异有统计意义。
由1组(实热组)均数0.70940>2组(虚寒组)均数0.63970,可以认为实热组的淋巴细胞转化率均数高于虚寒组。
图6-11独立样本t检验计算结果本章小结本章首先介绍了用Meeans过程对计量资料分层计算的方法,然后,分别介绍了SPSS实现计量资料的单样本t检验、配对样本t检验和两组独立样本t检验的方法,在学习过程中,应熟悉各种方法需要的数据文件格式,掌握三种t检验的前提条件,熟练实现SPSS相应功能的操作步骤以及结果的解读与分析,达到灵活运用。
习题6习题6-1表6-5中测得不同医院、不同组的12名患者的年龄(岁)。
分别计算不同医院、不同组别患者年龄的均数和标准差。