统计学--第五章两均数差别的统计意义
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本均数代表的未知总体均数μ 和已知总 体均数μ 0(一般为理论值、标准值或经过大 量观察所得的稳定值) 若已知总体标准差,可用统计量u,如果总 体标准差σ 未知,只有从样本中获得的标 准差s,那么应该用t检验 P41例5-1:建立检验假设;选定和计算统 计量;查得临界值;确定P值,判断结果。
第三节 配对t检验paired t-test for dependent samples
三、W检验 (用于3≤n≤50时,且不需知道偏 离正态的类型),W越大(附表5-3),P越大。 四、D检验:用于不需知道偏离正态分布类 型,且样本含量50≤n≤1000时 计算统计量y,y值不在y0.025~y0.975之间为有 统计意义(附表5-4),拒绝原假设,认为不 符合正态分布
二、第一类错误与第二类错误 I型错误type I error:拒绝了实际上成立的H0, 这类“ 弃真”的错误称I型错误,其概率大 小用α 表示,α 可取单尾亦可取双尾。取 0.05时,表示当无效假设正确时,在100次 抽样中可以有5次推断是错误的。false positive error II型错误:“接受”〔不拒绝〕了实际不 成立的H0 ,这类“取伪”的错误,称type II error。其概率大小用β 表示,β 只取 单尾,其值的大小在进行检验时一般并不 知道。false negative error
CI不但能回答差别有无统计学意义,还能提示差 别有无实际专业意义。但并不意味着CI可完全替 代假设检验,因CI在预先确定概率情况下计算的, 而假设检验可获得精确的概率值,两者结合才是 完整的分析。
(1)
(2) (4)
有实际意 义的值
(3)
(5)
H0 有统计学意义 意有 义实 际 可 能 有 实 际 意 义
x1 x2 t' 1 n1 1, 2 n2 1 S '( x1 x2 ) S '( x1 x2 ) S S
2 x1 ' t 2 x2
S S n1 n2
2 1
2 2
S x21 .t , 1 S x22 .t , 2 S x21 S x22
例题:P46例5-5(合并方差combined/pooled v)
二、关于非正态分布资料均数差别的检验 当资料的分布与正态分布略有偏倚时,对结果影 响不会太大,仍可用t检验 当资料与正态分布偏倚较大时处理方法: 1、n较大时,样本均数仍可近似正态,且S估计σ 的误差较小(每组例数均大于100),用u检验
第四节 两样本均数差别的统计意 义检验
一、两样本均数差别的t检验 two-sample/group t-test for independent samples 又称成组t检验comparison for two means 适用于:完全随机设计两样本均数的比较 完全随机设计:指分别从两研究总体中随 机抽取样本,然后比较两组的平均效应
u
x1 x 2 S S
2 x1 2 x2
2、当n较小时,进行数据较换,近拟正态 后再作检验。是否符合正态分布应作正态 性检验 3、用非参数统计方法
第五节 方差不齐时两样本均数 差别的t’检验
总体方差不等时unequal variance situation 正态分布由位置参数μ 和变异度参数σ 两者所决定, t检验需方差齐性。可用F检验来判断
5、P值的正确理解:P<或=0.05时,作出 差别有统计意义的结论。理解:若无效假 设正确,从该总体抽样所得的样本,它们 能计算得这样的或比它更大的|t|值的可能性 小于或等于0.05。决不能把P <或=0.05理 解为两总体均数相同的可能性小于或等于 0.05。 6、统计“ 显著性”与医学/临床/生物学 “ 显著性”:统计“ 显著性”对应于统计 结论;医学/临床/生物学“ 显著性”对应于 专业结论。统计结论与专业结论有机结合, 才能得出恰如其分、符合实际的最终结论。 如体重、血压值的差异检验
Type I error
μ0
μ0
μ1 Type II error
两类错误示意图见P51图5-3 1- β 称为检验效能power of a test,过去 曾称为把握度。它的意义是当两总体确有 差异,按规定检验水准α 所能发现该差异 的能力。只取单尾, 1- β =0.90,意味着 两总体确有差别,理论上在100次检验中, 平均有90次能够得出有统计学意义的结论。 α 愈小,β 愈大,反之亦然。若要同时减 小I和II型错误,只有增加样本含量n。 注:拒绝H0只能犯I型错误,不可能犯II型 错误;“接受”„不拒绝‟H0,只可能犯II 型错误。
注意:当n1=n2=n时,ν 1=ν 2=ν ,t’=t tα ’=t α ν ;t和t’ 值Hale Waihona Puke Baidu用双尾概率时的 tα /2和t’α /2 ②Satterthwaite 法:对自由度进行校正 ③Welch 法:也是对自由度进行校正 重点介绍第一种方法,见书P48例5-6
第六节 两种检验与两类错误 一、单侧检验与双侧检验 1、若检验目的在于检验两总体均数是否相 等,两者谁大谁小都有可能,只要t的绝对 值大于0.05界值即认为均数差别有统计学意 义,称双侧检验(two-tailed test)或双尾检验 2、若已知一个均数不可能低于另一个均数, 检验时只需考虑一侧的临界值,称单侧 (one-tailed test)或单尾检验 单、双侧检验时界值间的关系见面积示意 图,图5-1、图5-2(p49-50)
假设检验种类
非等效性检验nonequivalence 优效性检验superiority 等效性检验equivalence 非劣效性检验noninferiority
第二节
样本均数和总体均数差别的统计 意义检验
inferences from means ( one sample/group u, t-test)
无 实 际 意 义
无统计学意义
样 本 过 小
可 接 受 零 假 设
第七节 正态性检验
一、正态概率纸法 :适用于小样本、大样本或分 组资料,粗略检验. 亦可用Proportion-proportion plot or quartile-quartile plot (PP or QQ plot) 将观察值从小到大排序,计算累计百分数,转换 成概率单位probability unit: probit〔查附表5-1 〕 , 以概率单位为纵坐标,以观察值单位为横坐标, 作点图,若点子基本在一直线上,即近似正态分 xm 布。 probit 5
医学科研中配对设计有:
– 同一批对象身体两个部位的数据 – 同一批对象实验(或处理)前后的配对数据 – 同一批样品用两种方法(两种仪器、两名化验员、 两种条件)检验的结果 – 配对试验的结果(两个同质受试对象分别接受两 种不同的处理)
一、同体比较(自身对照比较)的t检验:见 P43例5-2,计算差值d,并假设差值的总体 均数为0 二、配对实验的t检验:见P44例5-3 三、同一批对象两次检验结果差值的t检验
( x1 x1 ) 2 ( x 2 x 2 ) 2 n1 n2 2
2 ] [ x 2
( x1 ) 2
( x 2 ) 2 n2
] 联合估计的标准差的平 方
n1 n2 2
如先算出了S1和S 2,则可用下式计算 c2 S
2 (n1 1) S12 (n 2 1) S 2 S c2 (n1 1) (n 2 1)
significance, highly significant (P>0.05,P≤0.05,P≤0.01) – P>α ,结论为按α 检验水准,不拒绝H0,无统计学意义 (统计结论),还不能认为……不同或不等(专业结论)。 不拒绝H0不等于接受H0 。此时尚没有足够的证据认为 H0成立。从决策的观点:可认为暂时接受它,或阴性 待观察。 – 下结论时,对只能说拒绝H0或不拒绝H0 ;而对H1只能 说,接受H1 ,除此之外其他说法均不妥当
2、选定检验方法,计算检验统计量
3、确定统计意义的水平和检验用临界值
– level of significance:指无效假设是对的而被 拒绝的可能性,即第I类错误,用α 表示,常取 值0.05、0.01:significant at the 5% level –查表获得界值
4、统计判断:no statistical significance (NS), statistical
三、假设检验应注意的问题 1、要有严密的研究设计 2、不同变量或资料应选用不同的检验方法 3、正确理解“ 显著性” 一词的含义:差 别有统计学意义,亦称差别有“ 显著性”, 不能理解为差异大。假设检验的结果并不 指差异的大小,只能反映两者是否相同, 差异的大小只能根据专业知识予以确定。 4、作结论不能绝对化:因统计结论具有概 率性质,不宜用“ 肯定”、“ 一定”、 “ 必定‘”等词。报告中最好列出统计量 的值和P值确切范围。以便读者与同类研究
t值计算公式为:equal variance: the two-sample t test
t x1 x 2 S ( x1 x2 ) n1 n 2 S ( ) 差数的标准误 n1 n 2
2 c
S ( x1 x2 )
l11 l 22 2 Sc n1 n 2 2 [ x12 n1
x:正态曲线下左侧面积 等于 累积百分数时对应横轴 值 m: 为均数,为标准差
二、偏度与峰度检验(method of moment) 正态分布有一定的峰度kurtosis,用g2表示, 且左右对称,即偏度skewness,用g1表示, 不应太大 按P54~56计算峰度系数和偏度系数,再作 u检验 正态时两者都为0,g1为正时表示多数频数 集中在左边,少数较大数据向右延伸,曲线向 右偏(正偏,医学常见),为负时向左偏(负 偏,医学少见);g2为负时曲线较平坦(平阔 峰),为正时曲线峰度超出正态分布(尖峭 峰),即靠中心处数据过多。
第五章 两均数差别的 统计意义检验
test of statistical significance 又称test of hypothesis
第一节 假设检验的基本步骤
基本步骤:4 1、建立无效假设null hypothesis和确定检 验水准
– 如μ =μ 0,又称检验假设hypothesis under test, 零假设、原假设,用H0表示 –μ >μ 0:称备择假设或对立假设alternative hypothesis.用H1或HA表示 –一般取α =0.05和0.01
S12 (较大) F 2 S 2 (较小)
1 n1 1, 2 n2 1
P48例5-6 求得F值后查附表6-1 P550
1、近似t检验separate variance estimation t-test: t’-test(原版教材称统计量d)。有三种方法,前两 种常用 ①Cochran & Cox 法(1950) 教科书中介绍的方法:对临界值进行校正
四、可信区间与假设检验的区别和联系
可信区间用于说明量的大小 即推断总体均数的范 围,而假设检验用于推断质的不同即判断两总体 均数是否不同。
1、可信区间亦可回答假设检验的问题:算
得的可信区若包含了H0 ,则按α 水准不拒绝H0; 若不包含H0,则按α 水准,拒绝H0接受H1。
2、可信区间比假设检验可提供更多的信息: