第5讲t检验与u检验(2004).
u检验和t检验
u检验和t检验第三节 u检验和t检验2005-08-04 00:00 来源:医学教育网u检验和t检验可用于样本均数与总体均数的比较以及两样本均数的比较。
理论上要求样本来自正态分布总体。
但在实用时,只要样本例数n较大,或n小但总体标准差σ已知时,就可应用u检验;n小且总体标准差σ未知时,可应用t检验,但要求样本来自正态分布总体。
两样本均数比较时还要求两总体方差相等。
一、样本均数与总体均数比较比较的目的是推断样本所代表的未知总体均数μ与已知总体均数μ0有无差别。
通常把理论值、标准值或经大量调查所得的稳定值作为μ0.根据样本例数n大小和总体标准差σ是否已知选用u检验或t 检验。
(一)u检验用于σ已知或σ未知但n足够大[用样本标准差s作为σ的估计值,代入式(19.6)]时。
以算得的统计量u,按表19-3所示关系作判断。
表19-3 u值、P值与统计结论α|t|值P值统计结论0.05双侧单侧<1.96<1.645>0.05不拒绝H0,差别无统计学意义0.05双侧单侧≥1.96≥1.645≤0.05拒绝H0,接受H1,差别有统计学意义0.01双侧单侧≥2.58≥2.33≤0.01拒绝H0,接受H1,差别有高度统计学意义例19.3根据大量调查,已知健康成年男子脉搏均数为72次/分,标准差为6.0次/分。
某医生在山区随机抽查25名健康成年男子,求得其脉搏均数为74.2次/分,能否据此认为山区成年男子的脉搏高于一般?据题意,可把大量调查所得的均数72次/分与标准差6.0次/分看作为总体均数μ0和总体标准差σ,样本均数x为74.2次/分,样本例数n为25.H0:μ=μ0H1:μ>μ0α=0.05(单侧检验)算得的统计量u=1.833>1.645,P<0.05,按α=0.05检验水准拒绝H0,可认为该山区健康成年男子的脉搏高于一般。
(二)t检验用于σ未知且n较小时。
以算得的统计量t,按表19-4所示关系作判断。
表19-4 |t|值、P值与统计结论α|t|值P值统计结论0.05<t0.05(v)<0.05不拒绝H0,差别无统计学意义0.05≥t0.05(v)≤0.05拒绝H0,接受H1,差别有统计学意义0.01≥t0.01(v)≤0.01拒绝H0,接受H1,差别有高度统计学意义例19.4 若例19.3中总体标准差σ未知,但样本标准差已求出,s=6.5次/分,余数据同例19.3.据题意,与例19.3不同之处在于σ未知,可用t检验。
第九章t检验
确定P值,作出统计推断结论
以 =n-1=35-1=34,查t界值表, t0.05/2,34=2.032, t<t0.05/2,34, P>0.05, 按=0.05水准尚不拒绝H0,
两者的差异无统计学意义。据样本提供的信息,
还不能认为该地难产儿与一般新生儿平均出生
体重不同。
检验水准:α =0.05
(1) 建立检验假设,确定检验水准
H0:=0, 该地难产儿与一般新生儿平均出生体重相同 H1:≠0,该地难产儿与一般新生儿平均出生体重不同 =0.05
(2) 计算统计量
X X 3 . 4 23 . 3 0 0 0 t 1 . 7 7 S S / n 0 . 4 0 /3 5 X
H0:=0, 山区成年男子脉搏均数与一般成年男子的脉 搏均数相同 H1:>0, 山区成年男子脉搏均数高于一般成年男子的 脉搏均数 单侧=0.05
(2) 计算统计量
X X 7 4 . 27 2 0 0 t 1 . 8 3 3 S S / n 6 . 0 / 2 5 X
μ0=72 次 /分
μ =? 次 /分
山区人群 (未知总体)
假设:μ = μ0
1.711 2.492
~ X
n = 25 X ¯=74.2次/分 S = 6.0次/分
0
1.833
X 7 4 . 2 7 2 t 1 . 8 3 3 S/ n 6 2 5
t 1 . 7 1 1 , t 2 . 4 9 2 0 . 0 5 , 2 4 0 . 0 1 , 2 4
d 0 d 33.5 t 13.305 Sd Sd n 7.9617/ 10
以ν=n-1=10-1=9,查t界值表得:
医学统计学-t检验和u检验
统计学常见问题
在医学统计学研究中,常见的问题包括样本大小确定、假设检验的选择、结 果解释等。了解这些问题能够提高研究的可靠性和科学性。
统计学误差的分类
统计学误差可分为随机误差和系统误差。随机误差是由随机因素引起的结果 波动,而系统误差是由于观测方法、仪器校准等常规因素引起的偏差。
假设检验的基本原理
案例分析:t检验的应用
使用t检验分析两种治疗方法在疾病治愈率方面的差异,以指导临床决策和改 善患者疗效。
案例分析:u检验的应用
使用u检验比较两种不同药物治疗疾病的有效性,以指导合理用药和提高疗效。
数据处理软件
统计学常用的数据处理软件包括SPSS、R、Python等。它们提供了丰富的统计 分析函数和可视化工具,以帮助研究人员进行数据分析。
医学统计学-t检验和u检 验
介绍医学统计学中的t检验和u检验。包括基础概念、历史、优缺点、应用领 域等内容,以及与t检验的比较,以案例分析和数据处理软件为重点。
统计学的基础
统计学是研究如何收集、整理、分析和解释数据的科学。它是医学研究中不可或缺的工具,用于推断和验证假 设。
t检验的概念及历史
t检验是一种用于比较两个样本均值是否有显著差异的统计方法。它由英国统计学家威廉·塞特尔于1908年提出, 被广泛应用于医学研究中。
t检验的优缺点
1 优点
适用于小样本和正态分布的数据,能够比较 样本之间的差异。
2 缺点
对数据的要求较高,可能受到异常值的影响, 不适用于非正态分布的数据。
t检验的前提条件
独立样本t检验
两个样本之间独立且符合正态分布。
配对样本t检验
两个样本之间相关,如同一组受试者的前后观察。
方差分析中的t检验
T及u检验
用什么检验,依据的是中心极限定理.中心极限定理中说,如果能够满足简单随机抽样具备30个样本容量,那么样本均值的抽样分布就是近似正态概率分布(注意不管总体服从什么分布);如果总体是正态概率分布的,不管简单随机抽样的样本是多少,样本均值的抽样分布都是正态概率分布.因此在你决定用什么检验的时候,首要考虑的条件是样本量,其次是总体是服从什么分布,然后因为样本均值的标准误(即样本均值抽样分布的标准差)的公式中需要知道总体的标准差,如果总体标准差知道,(无论大小样本,只是如果是小样本须满足总体要近似正态概率分布)都用Z检验;如果是大样本(n大于等于30),并且总体标准差未知,要用样本标准差去估计总体标准差(因为满足简单随机抽样,样本标准差总是总体标准差的无偏估计),然后还是用z分布做区间估计和假设检验;当样本量小于30,如果满足总体近似服从正态概率分布,如果总体标准差未知,可以用样本标准差去估计总体标准差,由此可用t分布做区间估计和假设检验。
现在的软件简化了上述步骤,如果总体标准差已知(无论样本大小),都用z分布;只要总体标准差未知,全都用t分布。
第5讲 t检验与u检验(2004)
均数差异的假设检验假设检验的具体方法,通常是以选定的检验统计量来命名的,如t检验要用特定的公式计算检验统计量t值,u检验要用特定的公式计算检验统计量u值。
应用时首先要了解各种检验方法的用途、应用条件和检验统计量的计算方法。
一、单组完全随机化设计资料均数的t检验和u检验从一个总体中完全随机地抽取一部分个体进行研究,这样的设计称为单组完全随机化设计(completely randomized design of single group)。
例题1:根据大量调查,已知健康成年男子脉搏均数为72次/分,某医生在某一山区随机抽查了25名健康成年男子,求得其脉搏均数为74.2次/分,标准差为6.0次/分,能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数?这两个均数不等有两个可能:(1)由于抽样误差所致;(2)由于环境条件的影响。
如何作出判断呢?在统计上是通过假设检验来回答这个问题。
以下介绍建设检验(t检验)的思想方法与步骤。
1、建立检验假设和确定检验水准H0:μ1=μ0(=72次/分):H1:μ1≠μ0(=72次/分):α=0.05本例分析目的是比较山区成年男子脉搏样本均数与一般成年男子脉搏总体均数有无差别?μ是未知的,可以假设μ等于某一定值μ0,μ与μ0的差等于零,这样的假设称为无差异假设或零假设(null hypothesis) 记为H0:μ1=μ0表示该山区的环境条件对脉搏数无影响,他们之间的差异是由于抽样误差所致。
与零假设相对立的假设称为对立假设或备择假设(alternative hypothesis), 符号为H1,它是在拒绝H0的情况下而接受的假设。
假设检验所用的检验统计量一般都是建立在零假设的基础上,因为H0比较单纯明确,而H1却包含着各种情况。
检验水准(size of test )亦称显著性水准(significance level),符号为α,在实际工作中常取0.05 或0.01。
04t检验和u检验
TTEST过程执行成组设计的来自正态总体的两个样本均数比较的t检验。它具有对两样本方差齐性比较的的F检验功能,计算t值与t’值,并给出相应的p值。
1. TTEST过程的语句组成。
*PROC TTEST options;
*CLASS variable;
VAR variable;
M(Sign) 3.5 Pr>=|M| 0.0156
Sgn Rank 14 Pr>=|S| 0.0156
W:Normal 0.896401 Pr<W 0.3222
Quantiles(Def=5)
略
Extremes
略
从上面的结果来看:
正态性检验:W=0.896401,p<W=0.3222,说明d(d=x1-x2)服从正态分布,t检验适用条件满足。
第四章
数值资料的参数统计推断,按推断目的不同分为两大类:总体参数的区间估计及总体参数的假设检验。其中应用最广泛的是总体均数的区间估计及总体均数的假设检验。PROC MEANS过程可以进行总体均数的区间估计,而总体均数的假设检验,依据研究设计类型的不同分别由PROC MEANS过程和PROC TTEST过程完成。
t检验:T(Mean=0)=-2.01284,Pr>|T|=0.0750>0.05,按α=0.05水平,尚不能
拒绝总体均数为零的假设,即可认为装瓶机工作正常。
例4.3若上例仅已知n=10, =490.3,s=15.2392,及μ0=500,则SAS程序为:
DATA A;
N=10;MEAN=490.3;SD=15.2392;MU=500;赋初值
T=(MEAN-MU)/(SD/SQRT(N));DF=N-1;计算t统计量及其自由度
第五讲 t检验
中心极限定理告诉我们:不论x 中心极限定理告诉我们:不论x变量是连续 型还是离散型,也无论x服从何种分布, 型还是离散型,也无论x服从何种分布,一般只 要n>30,就可认为 x 的分布是正态的。 若 30, 的分布是正态的。 x的分布不很偏倚,在n>20时 , 的分布就近 的分布不很偏倚, 20时 似于正态分布了。 似于正态分布了。
上一张 下一张 主 页 退 出
在实际工作中,总体标准差σ 在实际工作中,总体标准差σ往往是未知 此时, 的,因而无法求得 σ x 。此时,可用样本标准差 S估计σ。于是,以 S n估计 σ x 。记 S n 估计σ 于是, 样本标准误或均数标准误。 为 S x ,称作样本标准误或均数标准误。样本标 称作样本标准误或均数标准误 准误 S x 是平均数抽样误差的估计值。若样本中 是平均数抽样误差的估计值。 各观测值为
σx = σ
n
(4—24) (4—
上一张 下一张 主 页
退 出
1. 若 随 机 变 量 x 服 从 正 态 分 布 N(µσ2) ; x x2 、…、 xn, 是由x 总体得 是由x 、 1 来的随机样本, =Σx 来的随机样本,则统计量 x =Σx/n的概率分 布也是正态分布, =µ, 布也是正态分布, 且有µx =µ, σ x = σ / n, 即服从正态分布N 即服从正态分布N(µ,σ2/n)。 2. 若随机变量x服从平均数是 µ,方差是 若随机变量x σ2的分布(不是正态分布); x, x2 …,由此总体得来的随机样本, 由此总体得来的随机样本,则 统 计 量 x =Σx/n的概率分布,当n相当大时逼近正态分 =Σx 的概率分布, 这就是中心极限定理。 布N(µ,σ2/n)。这就是中心极限定理。
医学统计学--t检验和u检验PPT课件
562500
7
3450
8
3050
2500 1750
550
302500
合计
—
—
1050 1102500
1. 建立假设,确定检验水准
H0:d 0 两种饲料喂养的大白鼠肝中维生素含量相等 ;
H1:d 0
两种饲料喂养的大白鼠肝中维生素含量不 等。
0.05
2. 选择检验方法,计算统计量 t d 0 812.5 4.207 sd n 546.25 / 8
代入公式,得:
2953.43 182.52 1743.16 141.02
SC2
12 12 13 2
13 17.03
S X1 X 2
17.03 1 1 1.652 12 13
– 按公式计算,算得:
t 15.2110.85 2.639 1.652
• 确定P值,作出推断结论 两独立样本t检验自由度为 =n1+n2-2 =12+13-2=23; 查t界值表,t0.05(23)=2.069,t0.01(23)=2.807.
四 u 检验
1、样本与总体的u检验
u X 0 0 n
u X 0
Sn
2、两样本的u检验
u
x1 x2
s12
s
2 2
n1 n2
σ0已知 σ0未知
第二节 第一类错误与第二类错误
假设检验是反证法的思想,依据 样本统计量作出的统计推断,其推断 结论并非绝对正确,结论有时也可能 有错误,错误分为两类。
n 1 81 7
3.确定P值,判断结果
查t界值表,P 0.005 ,按 0.05 水准,拒绝H0 ,接受H1,可认为两 组大白鼠肝中维生素A的含量不等,维 生素E缺乏饲料组的大白鼠肝中维生素 A含量低。
t检验和u检验 统计学
t检验和u检验统计学§9.4 t 检验和u 检验♦ 假设检验的方法通常是以选定的检验统计量而命名的,如t 检验和u 检验♦ t 检验(t -test )的应用条件: ①正态性 变量x 服从正态分布 ②方差齐性 两总体方差相等一、样本均数与总体均数的比较♦ 总体均数 是指已知的理论值或经大量观测所得到的稳定值,记作μ0例9-15 已知某小样本中含CaCO 3的真值是20.7mg/L 。
现用某法重复测定15次,CaCO 3含量(mg/L )如下,问该法测得的均数与真值有无差别?20.99 20.41 20.62 20.75 20.10 20.00 20.80 20.910 1 2 3 4 5-1-2-3-4-50.00.1 0.2 0.3 0.4ν=3 ν=1ν=∞ (标准正态分布)22.60 22.30 20.99 20.41 20.50 23.00 22.601.建立假设,确定检验水准H0:μ=μ0H1:μ≠μ0α=0.052.选定检验方法,计算检验统计量t值x=ΣX/n=316.98/15=21.13S=()122-∑-∑nnxx=()1151598.31698.67112--=0.98按公式9-16计算t=1598.07.2013.21-=1.703.确定P值,判断结果ν=n-1=15-1=14查表9-8 t界值表,t0.05,14=2.145现t=1.70,1.70<2.145,故P>0.05,按α=0.05水准,不拒绝H0,尚不能认为该法测得的均数与真值不同(统计结论)。
表9-8 t界值表自由度概率Pν双侧: 0.10 0.05 0.02 0.01单侧: 0.05 0.025 0.01 0.0051 6.314 12.706 31.821 63.6572 2.920 4.303 6.965 9.9253 2.353 3.182 4.541 5.8414 2.132 2.776 3.747 4.6045 2.015 2.571 3.365 4.0326 1.943 2.447 3.143 3.7077 1.895 2.365 2.998 3.4998 1.860 2.306 2.896 3.3559 1.833 2.262 2.821 3.25010 1.812 2.228 2.764 3.16911 1.796 2.201 2.718 3.10612 1.782 2.179 2.681 3.05513 1.771 2.160 2.650 3.01214 1.761 2.145 2.624 2.97715 1.753 2.131 2.602 2.94716 1.746 2.120 2.583 2.92117 1.740 2.110 2.567 2.89818 1.734 2.101 2.552 2.87819 1.729 2.093 2.539 2.86120 1.725 2.086 2.528 2.845单侧: 0.05 0.025 0.01 0.00521 1.721 2.080 2.518 2.83122 1.717 2.074 2.508 2.81923 1.714 2.069 2.500 2.80724 1.711 2.064 2.492 2.79725 1.708 2.060 2.485 2.78726 1.706 2.056 2.479 2.77927 1.703 2.052 2.473 2.77128 1.701 2.048 2.467 2.76329 1.699 2.045 2.462 2.75630 1.697 2.042 2.457 2.750 40 1.685 2.021 2.423 2.704 50 1.676 2.009 2.403 2.678 60 1.671 2.000 2.390 2.660 70 1.667 1.994 2.381 2.648 80 1.664 1.990 2.374 2.639 90 1.662 1.987 2.368 2.632 100 1.660 1.984 2.364 2.626200 1.653 1.972 2.345 2.601 500 1.648 1.965 2.334 2.586 ∞1.645 1.9602.326 2.576二、配对数据的比较♦ 配对设计 (要求基线情况相同) ①自身比较,是指处理前后比较②平行比较,每个样品同时用两种方法检验③成对比较,两个基本条件一致的个体构成一个对子,分别给予两种处理♦ 检验统计量t 值按公式9-24计算t =d S d 0-=n S d d, ν=n -1 (9-24)d:差值的均数d S :差值均数的标准误S d :差值的标准差 n :对子数S d =()122--∑∑n nd d例9-16 应用某药治疗8例高血压患者,观察患者治疗前后舒张压变化情况,如表9-9,问该药是否对高血压患者治疗前后舒张压变化有影响?表9-10 用某药治疗高血压患者前后舒张压(mmHg )变化 病人编号治疗前 治疗后 差值d ⑴ ⑵ ⑶ ⑷=⑵-⑶1 96 88 82 112 108 43 108 102 64 102 98 45 98 100 -26 100 96 47 106 102 4 81009281.建立假设,确定检验水准μd =0, H 0:μd =0 H 1:μd ≠0 α=0.05 2.选择检验方法,按公式9-24计算检验统计量t 值t =d S d 0-=dS dd =n d∑=836=4.50S d =()122--∑∑n nd d=188362322--=3.16d S =n S d=816.3=1.12t =dS d =12.150.4=4.023.确定P 值,判断结果自由度ν=n -1=8-1=7,查表9-8 t 界值表,t 0.05,7=2.365,今4.02>2.365,故P <0.05,故按α=0.05水准,拒绝H 0,接受H 1(统计推论),可以认为该药有降低舒张压的作用(实际推论)。
第5讲t检验.
假设检验:
▲ 建立假设: 检验假设:心肌梗塞病人血清 ß 脂旦白与正常人血 清 ß 脂旦白均数相同;
备择假设:心肌梗塞病人血清 ß 脂旦白与正常人血
清 ß脂旦白均数不同; ▲ 确定显著性水平( a ):0.05
26
▲ 计算统计量:t 统计量: t = 4.34;
自由度:25 + 23 –2 = 46
(1) 一个总体均数:3.30kg ;
(2) 一个样本均数:3.42kg ; (3) 可计算出样本标准误:0.42/ 5 (4) n =25 < 100;
14
假设检验:
▲ 建立假设:
检验假设:难产儿平均出生体重与一般 婴儿平均出生体重相同; 备择假设 :难产儿平均出生体重与一般 婴儿平均出生体重不同; ▲ 确定显著性水平( a ):0.05
(1) 一个样本: 均数491.4, 标准差138.5 (mg/100ml);
另一个样本:均数672.3, 标准差150.7 (mg/100ml);
(2) n1=25; n2=23
(3) 近似正态分布:138.5×2 < 491.4; 150.7×2 < 672.3
(4) 方差齐:25/23 < 2
31
例 5-5 表 5-2
国产与进口两药物治疗绝经后妇女
骨 质 疏 松 症 第 2-4 腰 椎 骨 密 度 改 善 值 (mg/cm2)
国产药 -5 64 63 77 74 25 38 n1=20, 68 45 29 9 77 -2 89 77 63 70 36 82 -14 -17 48 47 60 58 11 23 n2=19, 进口药 52 30 15 -4 60 -14 72 61 48 54 22 65
4.3t检验和u检验
当两样本均大于50,即使总体分布偏离正态,其 样本均数仍近似正态分布,可用 u 检验。
x1 x2 u Sx x
1 2
x1 x2
2 2 S1 S2 n1 n2
假设检验的注意事项
1. 严密的研究设计
这是假设检验的前提。包括随机抽样和组 间的可比性等。
2. 选择适宜的假设检验方法
① σ 未知但 n 较大(如 n > 100) ② n 较小但σ 已知。
1. 样本均数与总体均数比较的 t 检验
样本均数与已知总体均数(理论值、标准值或经过
大量观察所得的稳定值)比较的目的,是推断样本所
代表的未知总体均数 u 与已知总体均数 u0有无差别。
x u0 t S n
若 n 较大,则t . t . , 可按算得的 t 值用 v = ∞ 查 t 界值表( t 即为 u )得P值。
2 x1 2 2 x2 2 x1 x2 n1 n2 n1 1 n2 1
2 n1 1S12 n2 1S 2
2 Sc
n1 n2 2
4. 成组设计两样本均数比较的 u 检验 当n 较大或总体标准差已知时,t 分布与 标准正态分布很接近,此时可用 u 检验。
3. 成组设计两样本均数比较的 t 检验
x1 x2 t Sx x
1 2
v n1 n2 2
S x x 为两样本均数差值的标准误 1 2
1 1 S n n 2 1
2 c
Sx x
1
2
在两总体方差相等的条件下,可将两方差合并, 求合并方差(pooled variance) S
2. 配对设计均数比较的 t 检验(配对t 检验)
u检验和t检验 ppt课件
2.831 2.819 2.807 2.797 2.787
3.135 3.119 3.104 3.091 3.078
3.527 3.505 3.485 3.467 3.450
3.819 3.792 3.768 3.745 3.725
2020/12/15
15
t0.05,24=2.064
P =P ( |t| ≥2.064 )=0.05
总 体
α=0.05
2、选定检验方法,计算检验统计量t值。
n =25 ,X=17200Hz,s =650Hz, μ。=18000Hz
t x0 17200180006.154
s
650 25 统计量t表示,在标准误的尺度
n
下,样本均数与总体均数的偏
2520201/12/1524
离。这种偏离称为标准t离差13 (standard t deviation)
=24
0.025
0.025
-2.064
0
2.064
P=P(|t|≥5.4545)<0.05
2020/12/15
16
思路解析:
样本
X 17200 S 650
μ 总体
=
μ0=18000Hz
总体
未知总体
健康成年男子
μ0
2020/12/15
17
假设该样本来自已知总体
μ0=18000Hz
总体
样本
X 17200
2020/12/15
7
t 检验的分类:
单样本t检验 配对样本t检验
两个独立样本t检验
同源配对 异源配对
2020/12/15
8
t 假设检验的应用条件:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
均数差异的假设检验假设检验的具体方法,通常是以选定的检验统计量来命名的,如t检验要用特定的公式计算检验统计量t值,u检验要用特定的公式计算检验统计量u值。
应用时首先要了解各种检验方法的用途、应用条件和检验统计量的计算方法。
一、单组完全随机化设计资料均数的t检验和u检验从一个总体中完全随机地抽取一部分个体进行研究,这样的设计称为单组完全随机化设计(completely randomized design of single group)。
例题1:根据大量调查,已知健康成年男子脉搏均数为72次/分,某医生在某一山区随机抽查了25名健康成年男子,求得其脉搏均数为74.2次/分,标准差为6.0次/分,能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数?这两个均数不等有两个可能:(1)由于抽样误差所致;(2)由于环境条件的影响。
如何作出判断呢?在统计上是通过假设检验来回答这个问题。
以下介绍建设检验(t检验)的思想方法与步骤。
1、建立检验假设和确定检验水准H0:μ1=μ0(=72次/分):H1:μ1≠μ0(=72次/分):α=0.05本例分析目的是比较山区成年男子脉搏样本均数与一般成年男子脉搏总体均数有无差别?μ是未知的,可以假设μ等于某一定值μ0,μ与μ0的差等于零,这样的假设称为无差异假设或零假设(null hypothesis) 记为H0:μ1=μ0表示该山区的环境条件对脉搏数无影响,他们之间的差异是由于抽样误差所致。
与零假设相对立的假设称为对立假设或备择假设(alternative hypothesis), 符号为H1,它是在拒绝H0的情况下而接受的假设。
假设检验所用的检验统计量一般都是建立在零假设的基础上,因为H0比较单纯明确,而H1却包含着各种情况。
检验水准(size of test )亦称显著性水准(significance level),符号为α,在实际工作中常取0.05 或0.01。
2、选定检验方法和计算统计量本例:n=25, -x=74.2次/分,S=6.0次/分。
检验统计量公式为:1-n , 0=-=νμxs x t将以上数据代入公式,得:241-25 , 1.833 25/0.60.722.74===-=νt要根据研究类型和统计推断目的选用不同检验方法,不同检验方法有相应的检验统计量,本例的检验统计量t 服从 ν=n-1 的 t 分布。
建设检验方法通常是以检验统计量来命名的,故,本例检验称为t 检验。
3、确定P 值和作出推断结论查t 界值表, 得出结论为,按α=0.05水准,拒绝H 0 ,接受H 1 认为该山区的成年男子脉搏均数高于一般的成年男子脉搏均数。
关于检验水准是取0.05、0.01或其他数值,要根据不同的实验而定。
α取值较小,有利于提高“阳性”统计检验结果的可靠性;α取值较大,有利于发现研究总体可能存在的差异,但可靠性降低。
较好的做法是精确地计算出P 值, 这会对人们认识你所作的实验有很大的参考价值。
二、 随机化配对设计资料均数的t 检验配对设计资料分三种情况:(1)配成对子的同对受试对象分别给予两种不同的处理;(2)同一受试对象分别接受两种不同处理;(3)同一受试对象处理前后的比较。
同对或同一受试对象分别接受两种不同处理结果的比较,其目的是推断两种处理的效果有无差别;自身处理前后结果的比较,其目的是推断某种处理有无作用。
因此,应该首先计算出各对差值d 的均数。
当两种处理结果无差别或某种处理不起作用时,理论上差值 d 的总体均数μd =0。
故可将配对设计资料的假设检验视为样本均数与总体均数μd =0的比较,配对设计资料以小样本居多,故常用t 检验。
其计算公式为:1-n , /==-=νμnd dddd t s s例题2、将大白鼠配成8对,每对分别饲以正常饲料和缺乏维生素E 饲料,测得两组大白鼠肝中维生素A 的含量如下表,试比较两组大白鼠中维生素A 的含量有无差别。
表 不同饲料组大白鼠肝中维生素A 的含量(U/g )大白鼠 配对号 正常饲料组 维生素E 缺乏组 差数,dd 2 1 3550 2450 1100 1210000 2 2000 2400 -400 160000 3 3000 1800 1200 1440000 4 3950 3200 750 562500 5 3800 3250 550 302500 6 3750 2700 1050 1102500 7 3450 2500 950 902500 8 3050 1750 1300 1690000 合计----650073700001) H 0: μd =0, H 1: μd ≠ 0, α=0.05 2)计算统计量7 4.2070, 193.12980-812.5 /)/(1298.193)18(88/)6500(7370000)1(/)(dS (U/g)812.5 86500222d ===-==-⨯-=--=====∑∑∑νμnS d t g U n n n d n S nd d d dd3)确定P 值下结论查t 界值表(双側),t > t 0.01, 7 =3.499, P<0.01 结论:按 α=0.01 水准,拒绝H 0,接受H 1。
4)题目结论:可以认为两种饲料喂养的大白鼠肝中维生素A的含量有差别,正常饲料组比缺乏维生素E饲料组的含量要高。
例3:胃癌或巨型胃溃疡13人, 在实行全胃切除术前后的体重(kg )如下:试比较手术前后体重有无变化?时间 1 2 3 4 5 6 7 8 9 10 11 12 13术前 42.5 48.0 39.0 46.0 58.5 47.5 39.0 58.0 51.0 43.0 38.0 50.0 57.5 术后 52.0 51.5 45.0 52.5 49.0 55.0 52.0 52.0 50.5 50.0 41.0 51.5 72.2d 9.50 3.50 6.00 6.50 -9.50 7.50 13.0 –6.0 -0.5 7.00 3.00 1.50 14.70 1、H 0: μd =0, H 1: μd ≠ 0, α=0.05 2、计算统计量12, 2.27 1.9044.323)(1.904 S (kg)323.4132.56d ========∑νt kg nS nd d d3、确定P 值下结论查t 界值表(双側),t > t 0.05, 12 =2.179, P<0.05 结论:按 α=0.05 水准,拒绝H 0,接受H 1。
4、题目结论:可以认为术前后体重有显著性差别。
三、 两组完全随机化设计资料均数的t 检验与u 检验 1、t 检验将受试对象完全随机地分配到两组中,这两组分别接受不同的处理。
这样的设计称为两组完全随机化设计(completely randomized design of two groups )。
有些研究设计既不能作自身对比,也不便于配对。
如实验中只有把受试动物杀死后才能获得所需数据,则不可能对动物在处理前后各进行一次测定;再如比较两种治疗方法对同一疾病的疗效,每个患者一般只能接受一种方法的治疗,把受试患者配成若干对在实际工作中又非常困难,这时只能进行两组间均数的比较。
在两组比较的资料中,每个观察对象都应按照随机的原则进行分组,两组样本量可以相同,也可以不同,但只有在两组例数相同时检验效率才最高。
统计量计算公式为:2121x 212121S X)()(xxx X S X X t ---=---=μμ221-+=n n ν⎪⎪⎭⎫ ⎝⎛++-+-+-=+=∑∑∑∑-2121222221212121112/)(/)()11(221n n n n n X x n x xn n S S c x x)1()1()1()1(212222112-+--+-=n n S n S n S c例题 某医院研究乳酸脱氢同工酶(LDH )测定对心肌梗死的诊断价值时,曾用随机抽样方法比较了10例心肌梗死患者与10例健康人LDH 测定值的差别,结果如下,试问LDH 测定值在两组间有无差别?患者(X 1) 23.2 45.0 45.0 40.0 35.0 44.1 42.0 52.5 50.0 58.0 健康人(X 2) 20.0 31.0 30.5 23.1 24.2 38.0 35.5 37.8 39.0 131.0(1)、H 0:μ1=μ2 H 1:μ1≠μ2 α=0.05 本例:74.6S ,01.31X ,59.10025X ,10.310X ,1064.9S ,48.43X ,30.19742X ,80.434X ,10222222112111==========∑∑∑∑n n(2)、计算统计量:将上述数据代入公式,得:182-1010 ,3506.37217.301.3148.43(%)7217.3)101101(2101010/10.31059.1002510/8.434230.19742221=+==-==+-+-+-=-νt S x x(3)、确定P 界作出结论 本例 t > t 0.05,18 =3.197, P<0.05(4)、结论: 按α=0.05 水准,拒绝H 0,接受H 1。
可以认为乳酸脱氢同工酶测定值在心肌梗死与健康人之间有差别,心肌梗死患者的含量比健康人的要高。
如果例3用随机样本设计的t 检验计算得到如下结果:0875.7S 8615.51X 132585.7S 5385.47X 13222111======、、、、n n242-1313 ,536.18145.2323.48145.2861.51538.47)(8145.2)131131(213130875.71-135857.21-132221=+===-==+-++=-νt kg S x x )()(查t 界值表(双側),t < t 0.05, 24 =2.064, P > 0.05结论:按 α=0.05 水准,接受H 0, 可以认为术前后体重有显著性差别。
2、 U 检验(两大样本均数的假设检验)以两个正态或非正态总体独立地抽取含量分别为n 1 和 n 2 的样本,当n 1 和 n 2均较大时,比如均大于100时,那么样本均数的和与差的分布也服从正态分布,即:)n ( ),(~)(2221212121⎥⎦⎤⎢⎣⎡+-±σσμμn N X X故当两样本均数较多时,即使总体分布呈偏离正态,其样本均数的分布仍近似正态分布,且这时用S 估计σ的误差较小,故可用u 检验,即用正态分布的原理作两个均数间的假设检验。
关于非正态分布资料均数差别的检验医学上有许多资料是服从正态分布的,但有不少资料不是正态分布,例如血清抗体滴度、传染病潜伏期、动物对毒物的耐受量等。