计量资料的统计推断-t检验
统计学-t检验
• Three types of Paired Samples.
异 体 配 对
配对样本的类型
配成对子的两个受试对象分别给予两种不同的处理 (如把同窝、同性别和体重相近的动物配成一对;
把同性别、同病情和年龄相近的病人配成一对等);
自 身 配 对
同一受试对象同时分别接受两种不同处理(如同一 动物的左右两侧神经、同一份标本分成两部分);
d 0 d 17.17 t 1475 . sd sd / n 40.33 / 12
(3)
确定P 值,作出统计推断 =n-1=12-1=11 查 t 界值表,得 0.10<P<0.20 ,按 =0.05 水准 不拒绝 H0 ,尚不能认为两种仪器检查的结果 不同。
例3:将20只按体重、月龄及性别配对的大白鼠随机分入甲、乙2组,甲组 给正常饲料,乙组饲料缺乏维生素E。10天后测定大白鼠肝脏的维生素A含 量(IU/g),结果如下。问2组大白鼠肝脏维生素A含量是否有差别?
两独立样本方差的齐性检验
两独立小样本均数的 t 检验,除要求两组数据均应服从正态分布
外,还要求两组数据相应的两总体方差相等,即方差齐性。
即使两总体方差相等,两个样本方差也会有抽样误差,两个样本
方差不等是否能用抽样误差解释?可进行方差齐性检验。
例8 由X线片上测得两组病人的R1值(肺门横径右 侧距, cm),算得结果如下,试检验肺癌病人与矽 肺0期病人的R1值的均数间差异是否明显。 肺癌病人: n1 10, 矽肺0期病人:
4.22 4.40
X2: 4.12
4.95 5.18
7.38 5.92
n1= 18, n2= 16,
T检验-郑金来
18
t 值表规律:
(1) 自由度(υ)一定时,p 与 t 成反比;
(2) 概率(p) 一定时, υ 与 t 成反比;
zhengjinlai@
19
小样本思想
戈塞特:t分布与小样本
由于“有些实验不能多次地进行”,从而“必须 根据少数的事例(小样本)来判断实验结果的正 确性”
与正态分布的关系
Lower Bound Upper Bound
.241 .478
zhengjinlai@
36
Statistics 身 高 N Mean Std. Error of Mean Std. Deviation Percentiles Valid Missing
2.5 97.5
100 0 163.7430 .37998 3.79985 155.9675 170.8850
标; 样本均数的标准差。
SPSS结果中用std. error of mean 表示
zhengjinlai@
10
标准误示意图
X1 S1
μσ
X2 S2 XI Si Xn Sn
σx
X服从什么分布?
zhengjinlai@
二、(均数)标准误
sx
s n
意义:反映抽样误差的大小。标准误越小,
zhengjinlai@
15
zhengjinlai@
16
t 分布(与u 分布 比较的特点)
zhengjinlai@
17
t 值表
横坐标:自由度, υ 纵坐标:概率, p, 即曲线下阴影部分的面积; 表中的数字:相应的 |t | 界值。
zhengjinlai@
zhengjinlai@
数值变量的统计推断-t检验
例3 25例糖尿病患者随机分成两组,
甲组单纯用药物治疗,乙组采用药物
治疗合并饮食疗法,2个月后测空腹
血糖,如表所示,问二组患者血糖值
是否相同?
表 25 名糖尿病患者两种疗法治疗后 2 个月血糖值(mmol/L) 编 号 1 2 3 4 5 6 7 8 9 10 11 12 甲组血糖值 (X1) 8.4 10.5 12.0 12.0 13.9 15.3 16.7 18.0 18.7 20.7 21.1 15.2 编 号 1 2 3 4 5 6 7 8 9 10 11 12 13 乙组血糖值 (X2) 5.4 6.4 6.4 7.5 7.6 8.1 11.6 12.0 13.4 13.5 14.8 15.6 18.7
表 5-3
编号
两种饲料喂养小白鼠 4 周后体重增重(g)情况
高蛋白组体重增加 量(X1) 编号 低蛋白组体重增加 量(X2) 1 2 3 4 5 6 7 8 9 10 11 12 13 36 38 37 38 36 39 37 35 33 37 39 34 36
1 2 3 4 5 6 7 8 9 10 11 12
S 6.5次 / 分 , n 30
µ0=72次/分
µ=?
已知总体
n=30,
未知总体
x 74 .2 次/分 S 6.0 次/分
假设检验的基本步骤
Ⅰ 建立检验假设,确定检验水准 Ⅱ 选择统计方法,计算检验统计量 Ⅲ 确定P值,作出推断结论
Ⅰ、建立检验假设,确定检验水准
假设有两种:
(1)用H0表示 : 即检验假设,常称为无效假设。
样本对总体有较好代表性,对比组间有较好组间均衡性—随 机抽样和随机分组; 样本来自正态分布总体,配对t检验要求差值服从正态分布, 实际应用时单峰对称分布也可以;大样本时,用u 检验,且
《计量资料的统计推断》的复习思考题
《计量资料的统计推断》的复习思考题1.什么是统计推断?统计推断包括哪两方面内容?2.什么样的分布是t分布?对称分布、正态分布、t分布和标准正态分布有何区别和联系?3.什么是标准误?标准差和标准误有什么区别和联系?4.什么是总体均数的可信区间?某指标的95%正常值范围和95%可信区间有何区别何联系?5.显著性检验的目的意义是什么?基本原理是什么?前提条件有哪些?6.什么情况下可认为具有可比性?举例说明日常生活中常犯的没有可比性时进行比较的错误。
7.显著性检验的一般步骤有哪些?8.显著性检验时,假设有几种?哪几种?如何假设?9.假设检验时,如何选择进行单侧或双侧检验?10.什么是检验水准/显著性水平?一般是多少?如何根据实际情况来确定检验水准?11.假设检验时的“P值”是什么?举例说明。
12.统计学结论和实际意义有何异同?13.什么情况下应该作u/z检验?什么情况下应该作t检验?14.举例说明成组设计和配对设计有何区别。
15.有人说,“只要是比较两个均数,都可以作t检验。
”你认为这种说法对吗?为什么?16.什么是I类错误?什么是II类错误?为什么显著性检验时会犯这两类错误?这两类错误各有什么特点?相互之间有什么关系?17.什么是把握度?科学研究时如何才能使把握度达到一定的水平?18.为什么说统计学结论是概率性的,既不绝对肯定,也不绝对否定?19.随机抽取某品种2月龄苗猪25头,测得其平均体重为20kg,标准差为3kg。
试估计该品种2月龄苗猪的体重。
20.随机测得100听某批某种罐头净重量平均为344.0g,标准差为4.43g。
试估计该批该种罐头的净重量和正常值范围。
21.某鱼场按常规方法所育鲢鱼苗一月龄的平均体长为7.25cm,标准差为1.58cm。
为提高鱼苗质量,现采用一新方法进行育苗,一月龄时随机抽取100尾进行测量,测得其平均体长为7.65cm。
试问新方法能否使一月龄鲢鱼苗体长更长?22.某名优绿茶含水量标准为不超过5.5%。
第5章t检验
1. 建立检验假设,确定检验水准 H0: σ12= σ 22 两组体重的总体方差相等 H1: σ12≠ σ22 两组体重的总体方差不等 α=0.05 2. 计算检验统计量 已知:n1=12 X1=45.75 S12=17.659 n2=13 X2=36.538 S22=3.269
S1 (较大) 17.659 F 2 5.402 S 2(较小) 3.269
注: P<0.01 差别有高度统计学意义 (P越小,越有理由拒绝H0)。
第三节
配对样本t检验
d 0 d t Sd Sd / n
配对设计主要有以下两种形式:
①同源配对: 同一受试对象处理前后的数据;同一受 试对象两个部位的数据;同一样品用两 种方法(仪器)检验的结果; ②异源配对: 配对的两个受试对象分别接受两种处理 后的数据。
第四节 两独立样本 t 检验 Two independent sample t-test • 又称成组t检验 • 适用于完全随机设计的两样本均数的比 较
将受试对象完全 随机地分配到两 组中
一、总体方差相等时的两独立样本 t 检验
应用条件:1. 两样本所代表的总体服从正态分布
2. 两总体方差具有齐性
s1 s12 17.659 2 sx 1.472 1 n n1 12 1
2 s2 s2 3.269 2 sx 2.179 2 n n2 12 2 2
2
三、完全随机分组两组几何均数比较的t检验
宜用几何平均数表示集中水平的资料,不服从 正态分布,但是测量值的对数值服从正态分布, 如抗体滴度的资料。此时可对lgx进行t检验。
t
' 2 2 S x t (1 ) S x t ( 2 )
医学统计学分析计算题-答案 (1)
第二单元 计量资料的统计推断分析计算题2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:表4 某年某地健康成年人的红细胞数和血红蛋白含量指 标性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2女255117.610.2124.7请就上表资料:(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。
(3) 试估计该地健康成年男、女红细胞数的均数。
(4) 该地健康成年男、女血红蛋白含量有无差别?(5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解:(1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。
女性红细胞数的变异系数0.29100%100% 6.94%4.18S CV X =⨯=⨯= 女性血红蛋白含量的变异系数10.2100%100%8.67%117.6S CV X =⨯=⨯=由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。
(2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。
男性红细胞数的标准误0.031X S ===(1210/L ) 男性血红蛋白含量的标准误0.374X S ===(g/L )女性红细胞数的标准误0.018X S ===(1210/L )女性血红蛋白含量的标准误0.639X S ===(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。
样本含量均超过100,可视为大样本。
σ未知,但n 足够大 ,故总体均数的区间估计按(/2/2X X X u S X u S αα-+, )计算。
医学统计学计量资料的统计推断
医学统计学计量资料的统计推断主要内容:标准误t 分布总体均数的估计假设检验均数的 t检验、u 检验、方差分析几个重要概念的回顾:计量资料:总体:样本:统计量:参数:统计推断:参数估计、假设检验第一节均数的抽样误差与总体均数的估计欲了解某地2000年正常成年男性血清总胆固醇的平均水平,随机抽取该地200名正常成年男性作为样本。
由于存在个体差异,抽得的样本均数不太可能恰好等于总体均数。
一、均数的抽样误差与标准误一、均数的抽样误差与标准误抽样误差:由于抽样引起的样本统计量与总体参数之间的差异X数理统计推理和中心极限定理表明:1、从正态总体N(??,??2)中,随机抽取例数为n的样本,样本均数??X 也服从正态分布;即使从偏态总体抽样,当n足够大时??X也近似正态分布。
2、从均数为??,标准差为??的正态或偏态总体中抽取例数为n的样本,样本均数??X的总体均数也为??,标准差为X标准误含义:样本均数的标准差计算:(标准误的估计值)注意: X 、S??X均为样本均数的标准误标准误意义:反映抽样误差的大小。
标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。
标准误用途:衡量抽样误差大小估计总体均数可信区间用于假设检验二 t 分布对正态变量样本均数??X做正态变换(u变换):X 常未知而用S??X估计,则为t变换:二、 t 分布t值的分布即为t分布t 分布的曲线:与??有关t分布与标准正态分布的比较1、二者都是单峰分布,以0为中心左右对称2、t分布的峰部较矮而尾部翘得较高说明远侧的t值个数相对较多即尾部面积(概率P值)较大。
当ν逐渐增大时,t分布逐渐逼近标准正态分布,当ν→??时,t分布完全成为标准正态分布t 界值表(附表9-1 )t??/2,??:表示自由度为??,双侧概率P为??时t的界值t分布曲线下面积的规律:中间95%的t值:- t0.05/2,?? ?? t0.05/2,??中间99%的t值:- t0.01/2,?? ?? t0.01/2,??单尾概率:一侧尾部面积双尾概率:双侧尾部面积(1) 自由度(ν)一定时,p与t成反比;(2) 概率(p)一定时,ν与t成反比;三总体均数的估计统计推断:用样本信息推论总体特征。
医学统计学第八章-t检验
随机数:206 126
……
试验
对照
试验
对照
对照
试验
对子号
试验组
对照组
1
门诊6
门诊1
2
门诊4
门诊2
3
门诊3
门诊5
……
……
试验组与对照组的两个观察对象均按照一定的条件配成对子, 同一对子中的“混杂”因素在二者间几乎相同;而在不同对子 间这些“混杂”因素则有可能差别很大
01
02
03
单样本资料的t检验
单样本资料的t检验
P/ 2
P / 2
t39
0
-2.023
2.023
-1.294
1.294
1/2α
1/2 α
由于t=-1.294>t0.05/2,35=-2.023,因此虽然无法准确得出P值,但仍然可以推断P>0.05(经过计算机软件得出结果P=0.203 )
在a=0.05的水准上,不拒绝H0,尚不认为农村新生儿的出生体重与该地平均水平不同。
2
样本对应的总体均数等于3.36,仅仅是由于抽样误差所致这种差别;
3
非抽样误差,二者的确有别?
4
两种情况只有一个是正确的,且二者必居其一,需要我们作出推断。
单样本资料的t检验
H0:=3.36,农村新儿体重与该地平均水平相同
H1:≠3.36,二者不同 (有可能高也有可能低,总之不相等即可)
检验水准a=0.05(双侧)
02
假设检验与区间估计的关系
2.018
前面阐述了方差齐性的情况下,如何进行两个样本均数比较的t检验
如果方差不齐,很多学者建议在这样的情况下采用自由度校正的方法计算t分布的概率,或者直接采用非参数检验
计量资料统计推断(t检验)-预防医学-课件
3
样本量的确定
合理的样本量对于可靠的t检验结果至关重要。掌握样本量的计算方法和实际应 用技巧。
步骤
假设检验
明确研究问题并提出原假设和备择假设,为接 下来的检验做好准备。
计算P值
通过t值、自由度和显著性水平计算P值,以判 断差异是否显著。
检验统计量
计算t值作为判断两个平均值是否有显著差异的 统计量。
t检验是用于比较两个平均值是否有显著差异的统计方法。它可以帮助我们判 断一种干预措施对预防医学中的结果是否产生了显著影响。
原理
1
正态分布
数据符合正态分布的假设是t检验的前提之一。了解正态分布对于正确应用t检验 至关重要。2单侧、双侧t检验
t检验可以根据研究问题和假设,选择进行单侧或双侧检验,以得出准确的结论。
结果分析
根据P值和显著性水平,判断研究结果是否支持 原假设,进行科学的结论推断和决策。
应用和实例
预防医学中的应用举例
通过实际的研究案例,展示t检验在预防医学领域中 的应用和实际效果。
使用Excel进行统计分析
探索如何使用Excel进行t检验和统计分析,使数据处 理更加高效和准确。
注意事项
数据采集和处理
2 t检验的应用前景
展望t检验在预防医学领域的应用前景,并提 供相关建议和思考。
计量资料统计推断(t检 验)-预防医学-课件
探索计量资料统计推断中的t检验在预防医学中的重要性和应用。通过深入介 绍其原理、步骤和应用实例,让你深入理解这一统计方法。
统计学概述
统计学是研究收集、整理、分析和解释数据的科学。它提供了一种方法来从 数据中推断出关于总体的信息,并进行相应的决策。
t检验是什么?为什么要使用?
03.计量资料的统计推断-t检验和方差分析
(对数变换),则服从正态分布,相应的两总体
方差也可能具有齐性。数据变换后两组间的关系
并没有改变。
也可用秩和检验!
选甲型流感病毒血凝抑制抗体滴度(倒数)小于5者24人,随机 分为2组,每组12人。用甲型流感病毒活疫苗进行免疫,一组 用气雾法,另一组用鼻腔喷雾法,免疫一个月后,分别测定血 凝抑制抗体滴度,结果如下表,问两种方法免疫的效果有无差 别?
有两组小白鼠分别饲以高蛋白和低蛋白饲料,4周后记录小白鼠 体重增加量(g)如下表,问两组动物体重增加量的均数是否相等?
X 1 4 5.7 5 X 2 3 6.5 4
2 S 1 1 7.6 59 2 S 2 3.2 69
t 7.017 p 0.000
完全随机设计两样本几何均数比较的t检验
12名儿童分别用两种结核菌素的皮肤浸润反应结果(mm)
编号 (1) 1 2 标准品 (2) 12.0 14.5 新制品 (3) 10.0 10.0 差值d (4)=(2)(3) 2.0 4.5
3
4 … 8
15.5
12.0 … 7.5
12.5
13.0 … 6.5
3.0
-1.0 … 1.0
9
10 11 12
应用条件:差值服从正态分布!
假设检验的步骤
1. 建立检验假设,确定检验水准;
H 0 : d 0, H 1 : d 0,
0.05(双侧)
2. 计算统计量;
d 0 ~ t , n 1 Sd n
t
X 0 X 0 t , n 1 SX S n
目的:比较两总体均数是否相同。
计量资料统计推断(t检验)-预防医学-课件
02
t检验的步骤
建立假设
假设检验的基本思想
设立原假设的依据
在假设检验中,通常先设立一个原假 设,然后基于样本数据对原假设进行 检验,判断是否拒绝原假设。
原假设的设立通常基于已有的研究结 果、理论或实践经验,并且原假设应 该是一个可以验证的命题。
原假设与备择假设
原假设通常是研究者想要否定的假设 ,备择假设则是研究者想要接受的假 设。
p值是用于判断是否拒绝原假设 的统计量,p值越小,说明样本 数据与原假设之间的差异越大,
越有理由拒绝原假设。
显著性水平
显著性水平是预先设定的一个临 界值,用于判断是否拒绝原假设
,通常取0.05或0.01。
结论的表述
根据p值与显著性水平的比较结 果,可以得出是否拒绝原假设的 结论,并进一步解释结果的意义
断实验处理或条件改变对数据的影响。
两独立样本t检验
总结词
用于比较两个独立样本的平均值是否存 在显著性差异。
VS
详细描述
两独立样本t检验,也称为两组独立样本t 检验,是统计学中常用的方法之一,用于 比较两个独立样本的平均值是否存在显著 差异。这种方法常用于比较不同组对象的 数据、不同条件下的独立测量等。通过计 算t统计量,我们可以判断两组独立样本 的均值是否存在显著差异,从而推断不同 组别或条件对数据的影响。在进行两独立 样本t检验时,需要注意样本来自的总体 是否具有方差齐性和正态分布等统计假设 ,以确保检验结果的准确性和可靠性。
t检验的适用范围
• t检验适用于样本量较小、数据分布情况未知或总体标准差未知的情况。在预防医学领域,t检验常用于比较两组人群的生理 指标、行为习惯等计量资料的差异。
t检验的假设条件
• 假设条件包括:样本数据来自正态分布总体、总体 方差齐性、独立样本等。在进行t检验之前,需要检 验样本数据是否满足这些假设条件,以确保统计推 断的准确性。
t检验的原理方法选择和应用条件
t检验的原理方法选择和应用条件一、t检验的原理t检验是一种统计分析方法,用于比较两个样本均值是否存在显著差异。
其原理基于样本数据的均值和标准差,以及样本大小。
通过计算t值,可以判断两个样本之间的差异是否显著。
二、t检验的方法选择根据研究问题和实验设计的不同,可以选择不同的t检验方法。
以下是常见的t检验方法:1.单样本t检验:用于比较一个样本的均值与已知的总体均值之间是否存在显著差异。
适用于总体标准差未知的情况。
2.独立样本t检验:用于比较两个独立样本的均值是否存在显著差异。
适用于两个样本之间相互独立、总体标准差未知的情况。
3.配对样本t检验:用于比较同一组样本在不同条件下的均值是否存在显著差异。
适用于两个样本之间存在相关性、总体标准差未知的情况。
根据研究目的和数据特点,可以选择适合的t检验方法进行分析。
三、t检验的应用条件为了保证t检验结果的准确性和可靠性,在应用t检验时需要满足一定的条件。
以下是t检验的应用条件:1.样本数据近似正态分布:t检验建立在样本数据近似正态分布的基础上,如果样本数据不满足正态分布,可能会导致结果不准确。
2.样本独立性:当进行独立样本t检验时,两个样本应该是互相独立的,即两个样本之间没有相关性。
否则,会导致结果不准确。
3.总体标准差未知:t检验假设总体标准差未知,当已知总体标准差时,可以使用z检验进行分析。
如果以上条件都满足,就可以使用t检验进行统计分析。
四、使用t检验的注意事项在应用t检验时需要注意以下几点:1.样本大小:样本大小直接影响t检验的准确性和可靠性,通常样本大小越大,结果越准确。
2.显著性水平:在进行参数估计时,需要设置显著性水平,常见的显著性水平包括0.05和0.01,选择适合的显著性水平可以得到更可靠的结论。
3.效应大小:在比较两个样本均值时,需要考虑效应大小。
如果效应较小,样本大小可能需要更大才能得到显著的结果。
通过合理选择t检验的方法、满足应用条件,并注意上述注意事项,可以更加准确地进行数据分析和结论推断。
计量资料两组均数的比较 t检验
确定检验水准
确定检验水准β通常为0.2
确定检验水准α通常为0.05
确定检验水准α和β的关系 通常为α+β1
确定检验水准α和β的取舍 通常根据研究目的和实际情
况进行选择
计算样本均数和标准差
计算两组样本的均数
计算t值
计算两组样本的标准差
计算t检验的p值
计算两组样本的标准差之比
判断是否拒绝原假设得出结论
描述性统计用于 描述数据的分布 特征参数统计用 于推断总体特征。
描述性统计不涉 及样本量的大小 参数统计需要一 定的样本量才能 进行。
t检验的适用范围
两组独立样本 两组样本服从正态分布 两组样本方差相等或不相等 两组样本数量相等或不相等
t检验的基本原理
假设检验:检验两组均数是否相等 统计量:t统计量用于衡量两组均数的差异程度 自由度:样本量减1用于计算t统计量的分布 显著性水平:设定一个阈值用于判断两组均数差异是否显著
t值越大表示两组均数差异越大
t值与显著性水平α的关系:t值大于临 界值表示两组均数差异具有统计学意 义
t值小于0表示两组均数差异为负即第一 组均数小于第二组
t值小于临界值表示两组均数差异不具 有统计学意义
p值的意义解读
p值是t检验的核 心表示两组均数 差异的显著性
p值小于0.05表示 两组均数差异具 有统计学意义
t检验的假设条件
两组样本来自同一总体 两组样本服从正态分布 两组样本的方差相等 两组样本的样本量足够大
t检验的步骤
确定样本量
确定研究目的和假设 确定样本量计算公式 确定显著性水平α和检验效能1-β 确定样本量计算公式中的其他参数如标准差、均值等 计算样本量并考虑实际可行性和伦理问题 确定最终样本量并进行t检验
统计学复习题
《医学统计学》复习资料广西医科大学流行病与卫生统计学教研室2013.1.52012年留学生总复习练习题Part A理论考试题型一、单选题(每题1.5分,共45分。
请在答题卡上将正确答案对应的字母涂黑二、辨析题(每题3分,共15分。
判断对错,并给出理由)三、简答题(每题5分,共10分)四、分析应用题(共30分+10分)Part B练习题一、单选题(每题1.5分,共45分。
请在答题卡上将正确答案对应的字母涂黑)(一)计量资料统计描述1.卫生统计工作的步骤为________。
A.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表2.某病患者5人的潜伏期(天)分别为6,8,5,10,>13,则平均潜伏期为________。
A.5天B.8天C.6~13天D.11天3.算术均数与中位数相比,。
A.抽样误差更大B.不易受极端值的影响C.更充分利用数据信息D.更适用于分布不明及偏态分布资料值为。
4.标准正态分布中,单侧u0.05A.1.96B.0.05C.1.64D.0.0255.统计分析的主要内容有________。
A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表6.统计资料的类型包括________。
A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料7.抽样误差是指________。
A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称8.统计学中所说的总体是指________。
A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体9.描述一组偏态分布资料的变异度,宜用________。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t分布 特征
f(t)
ν─>∞(标准正态曲线) ν =5 ν =1
-5
-4
-3
-2
-1
0
1
不同自由度下的t 分布图
2
3
4
5
• 自由度ν 不同,曲线形态不同,t分布是一簇曲线。 • 自由度ν 越大,t分布越接近于正态分布;当自由度 ν 逼近∞时,t分布趋向于标准正态分布。
t
概率、自由度与t值关系 ——t界值
140 138 140 135 135 120 147 114 138 120
治疗矽肺患者血红蛋白量(克%)
编号
1
治疗前
113
治疗后
140
治疗前后差数d
27
2
3 4 5 6
150
150 135 128 100
138
140 135 135 120
-12
-10 0 7 20
7
8 9 10
110
120 130 123
配对样本均数t检验——实例分析
• 例: 有12名接种卡介苗的儿童,8周后用 两批不同的结核菌素,一批是标准结核菌 素,一批是新制结核菌素,分别注射在儿 童的前臂,两种结核菌素的皮肤浸润反应 平均直径(mm)如表5-1所示,问两种结核菌 素的反应性有无差别?
表 5-1
12 名儿童分别用两种结核菌素的皮肤浸润反应结果(mm) 编号 1 2 3 4 5 6 7 8 9 10 11 12 合计 标准品 12.0 14.5 15.5 12.0 13.0 12.0 10.5 7.5 9.0 15.0 13.0 10.5 新制品 10.0 10.0 12.5 13.0 10.0 5.5 8.5 6.5 5.5 8.0 6.5 9.5 差值 d 2.0 4.5 3.0 -1.0 3.0 6.5 2.0 1.0 3.5 7.0 6.5 1.0 39(d) d2 4.00 20.25 9.00 1.00 9.00 42.25 4.00 1.00 12.25 49.20 42.25 1.00 195(d2)
• 例:以往通过大规模调查已知某地新生儿出生 体重为3.30kg.从该地难产儿中随机抽取35名新 生儿作为研究样本,平均出生体重为3.42kg,标 准差为0.40kg,问该地难产儿出生体重是否与一 般新生儿体重不同?
• 本例已知总体均数0=3.30kg,但总体标准差 未知,n=35为小样本,S=0.40kg • 故选用单样本t检验。
• 如两种疗法治疗糖尿病的疗效比较
25例糖尿病患者 随机分成两组, 总体 甲组单纯用药物 治疗,乙组采用 药物治疗合并饮 食疗法,二个月 后测空腹血糖 (mmol/L) 问两种 样本 疗法治疗后患者 血糖值是否相同?
药物治疗
1
? =
推 断
药物治疗合 并饮食疗法
2
甲组 n1=12
X 1 =15.21
t0.05,9=1.833
• 自由度n-135-134 ,查“t界值表”,得双 侧t0.05/2,34=2.032
t检验与Z检验
(t test and z test)
一、单个样本的t检验 二、配对设计计量资料比较的t检验 三、两独立样本资料均数比较的t检验 四、Z检验 五、t’检验
第一节 单组样本t检验
配对设计概述
• 应用配对设计可以减少实验的误差和控制非处理因素,提 高统计处理的效率。 • 配对设计处理分配方式主要有三种情况: ①两个同质受试对象分别接受两种处理,如把同窝、同 性别和体重相近的动物配成一对,或把同性别和年龄 相近的相同病情病人配成一对; ②同一受试对象或同一标本的两个部分,随机分配接受 两种不同处理; ③自身对比(self-contrast)。即将同一受试对象处理 (实验或治疗)前后的结果进行比较,如对高血压患 者治疗前后、运动员体育运动前后的某一生理指标进 行比较。
William Sealey Gosset
(1876.6—1937.10)
t分布——t值与t分布的引入
样本均数正态分布
N(, )
2 X
u X
N(,2)
观察值正态分布
-3
-2
-1
0
1
2
3
-3
-2
-1
0
1
2
3
X
t
t分布
X SX
z u S代替
X X
u z
X
t 分布曲线
t , t
配对样本均数t检验——检验步骤
例: 应用克矽平治疗矽肺患者10名, 治疗前后血红蛋白的含量如下表所示,问 该药是否引起血红蛋白含量的变化?
克矽平治疗矽肺患者治疗前后 血红蛋白含量(g/L) 编号 治疗前 治疗后
1 2 3 4 5 6 7 8 9 10
113 150 150 135 128 100 110 120 130 123
• 配对样本均数t检验简称配对t检验(paired t test),又称 非独立两样本均数t检验,适用于配对设计计量资料均数的
比较
• 目的:检验两相关样本均数所代表的未知总体均数是否有 差别 • 配对设计(paired design)是将受试对象按某些重要特征 相近的原则配成对子,每对中的两个个体随机地给予两种 处理
单侧
P(t t , )
或 P(t t , )
双侧
P( t t/
2 ,
) P t t/ 2 ) ( ,
概率、自由度与t值关系 ——t界值
• 一定自由度和概率下的t值 t, ,t/2, 可通
过查t界值表——附表C2(p560)获得; • 例如=9,单侧=0.05 ,查“t界值表”得单侧
• 又称单样本均数t检验(one sample t test),适用 于样本均数与已知总体均数μ 0的比较,其比较目 的是检验样本均数所代表的总体均数μ 是否与已 知总体均数μ 0有差别。
• 已知总体均数μ 0一般为标准值、理论值或经大量 观察得到的较稳定的指标值。 • 单样t检验的应用条件是总体标准未知的小样本 资料(如n<50),且服从正态分布。
一、单样本t 检验
(one sample t-test)
t
X 0 SX
自由度ν= n-1
单个样本 t 检验原理
在 H0 : = 0的假定下, 可以认为样本是从已知总 体中抽取的,根据t分布 的原理,单个样本t检验 的公式为:
未知总体 已知总体
0
样本
X
自由度=n-1
单个样本t检验——实例分析
医学统计学
医学统计学
t 检验——问题提出
• 假设检验是通过两组或多组的样本统计量的差别 或样本统计量与总体参数的差异来推断他们相应 的总体参数是否相同; • 医疗卫生实践中最常见的是计量资料两组比较的 问题;
• t检验 (t test, student t test)和z检验(z test)是用于计量资料两组比较的最常用的假设检 验方法
• 标准正态分布中z值大小与尾部面积(概率)有 关,以 z (单侧)和 z/2(双侧)表示; • 在t分布中,当自由度一定时,越小,|t|越大; • 在一定时,自由度越小,|t|越大,大于z值 • 在t分布中,t值与、的大小有关; • 在单侧时(尾部面积取单侧)t 界值表示为t, , 双侧时表示为t/2, ,其意义为
单个样本t检验——检验步骤
• 1. 建立检验假设,确定检验水准
H0:0,该地难产儿与一般新生儿平均出生
体重相同;
H1:0,该地难产儿与一般新生儿平均出生
体重不同;
0.05。
• 2. 计算检验统计量
在μ =μ 0成立的前提条件下,计算统计量为:
单个样本t检验——检验步骤
X 0 X 0 3.42 3.30 t 1.77 S SX 0.40 / 35 n
二、配对资料比较的t 检验 ( paired sample t test )
2、目的:判断不同的处理间是否有差别?
即:差值的总体均数为0
3、公式:
t
d 0 Sd
d Sd
ν = n-1
配对样本均数t检验原理
• 配对设计的资料具有对子内数据一一对应的特征, 研究者应关心是对子的效应差值而不是各自的效 应值。 • 进行配对t检验时,首选应计算各对数据间的差值d, 将d作为变量计算均数。 • 配对样本t检验的基本原理是假设两种处理的效应 相同,理论上差值d的总体均数μd 为0;现有的不 等于0差值样本均数可以来自μd = 0的总体,也可以 来μd ≠ 0的总体。
3. 确定P值,做出推断结论 本例自由度n-135-134,查附表C2,得
t0.05/2,34=2.032。 因为t t0.05/2,34,故P0.05,表明差异无统计 学意义,按 0.05水准不拒绝H0,根据现有样
本信息,尚不能认为该地难产儿与一般新生儿平 均出生体重不同。
第二节 配对资料比较的t检验
39, d
2
195。
配对样本均数t检验——检验步骤
– 先计算差数的标准差
Sd
d
2
d
n 1 n
2
392 195
12 12 1
2.4909
– 计算差值的标准误
2.4909 Sd 0.7191 n 3.464 Sd
– 按公式计算,得:
d 3.25 t 4.5195 Sd 0.7191
S 16.4574 Sd 5.2043 n 10
d 6.8 t 1.307 Sd 5.2043
3.确定
P 值,作出推断结论
自由度df =10-1= 9 , 查t 临界值(C2,p560)得:
0.20< P <0.40,按α=0.05水准 不拒绝H0,差异无统计学意义。 根据目前资料尚不能认为克矽平 对血红蛋白含量有影响。