统计学--第五章两均数差别的统计意义

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

样本均数代表的未知总体均数μ 和已知总体均数μ 0(一般为理论值、标准值或经过大量观察所得的稳定值) 若已知总体标准差，可用统计量u，如果总体标准差σ 未知，只有从样本中获得的标准差s，那么应该用t检验 P41例5-1：建立检验假设；选定和计算统计量；查得临界值；确定P值，判断结果。
第三节配对t检验paired t-test for dependent samples
三、W检验 (用于3≤n≤50时，且不需知道偏离正态的类型)，W越大(附表5-3)，P越大。四、D检验：用于不需知道偏离正态分布类型，且样本含量50≤n≤1000时计算统计量y，y值不在y0.025~y0.975之间为有统计意义(附表5-4)，拒绝原假设，认为不符合正态分布
二、第一类错误与第二类错误 I型错误type I error：拒绝了实际上成立的H0，这类“ 弃真”的错误称I型错误，其概率大小用α 表示，α 可取单尾亦可取双尾。取 0.05时，表示当无效假设正确时，在100次抽样中可以有5次推断是错误的。false positive error II型错误：“接受”〔不拒绝〕了实际不成立的H0 ，这类“取伪”的错误，称type II error。其概率大小用β 表示，β 只取单尾，其值的大小在进行检验时一般并不知道。false negative error
CI不但能回答差别有无统计学意义，还能提示差别有无实际专业意义。但并不意味着CI可完全替代假设检验，因CI在预先确定概率情况下计算的，而假设检验可获得精确的概率值，两者结合才是完整的分析。
(1)
(2) (4)
有实际意义的值
(3)
(5)
H0 有统计学意义意有义实际可能有实际意义
x1 x2 t' 1 n1 1, 2 n2 1 S '( x1 x2 ) S '( x1 x2 ) S S
2 x1 ' t 2 x2

S S n1 n2
2 1
2 2
S x21 .t , 1 S x22 .t , 2 S x21 S x22
例题：P46例5-5(合并方差combined/pooled v)
二、关于非正态分布资料均数差别的检验当资料的分布与正态分布略有偏倚时，对结果影响不会太大，仍可用t检验当资料与正态分布偏倚较大时处理方法： 1、n较大时，样本均数仍可近似正态，且S估计σ 的误差较小(每组例数均大于100)，用u检验
第四节两样本均数差别的统计意义检验
一、两样本均数差别的t检验 two-sample/group t-test for independent samples 又称成组t检验comparison for two means 适用于：完全随机设计两样本均数的比较完全随机设计：指分别从两研究总体中随机抽取样本，然后比较两组的平均效应
u
x1 x 2 S S
2 x1 2 x2
2、当n较小时，进行数据较换，近拟正态后再作检验。是否符合正态分布应作正态性检验 3、用非参数统计方法
第五节方差不齐时两样本均数差别的t’检验
总体方差不等时unequal variance situation 正态分布由位置参数μ 和变异度参数σ 两者所决定， t检验需方差齐性。可用F检验来判断
5、P值的正确理解：P<或=0.05时，作出差别有统计意义的结论。理解：若无效假设正确，从该总体抽样所得的样本，它们能计算得这样的或比它更大的|t|值的可能性小于或等于0.05。决不能把P <或=0.05理解为两总体均数相同的可能性小于或等于 0.05。 6、统计“ 显著性”与医学/临床/生物学 “ 显著性”：统计“ 显著性”对应于统计结论；医学/临床/生物学“ 显著性”对应于专业结论。统计结论与专业结论有机结合，才能得出恰如其分、符合实际的最终结论。如体重、血压值的差异检验
Type I error
μ0
μ0
μ1 Type II error
两类错误示意图见P51图5-3 1- β 称为检验效能power of a test,过去曾称为把握度。它的意义是当两总体确有差异，按规定检验水准α 所能发现该差异的能力。只取单尾， 1- β =0.90，意味着两总体确有差别，理论上在100次检验中，平均有90次能够得出有统计学意义的结论。 α 愈小，β 愈大，反之亦然。若要同时减小I和II型错误，只有增加样本含量n。注：拒绝H0只能犯I型错误，不可能犯II型错误；“接受”„不拒绝‟H0，只可能犯II 型错误。
注意：当n1=n2=n时，ν 1=ν 2=ν ，t’=t tα ’=t α ν ;t和t’ 值Hale Waihona Puke Baidu用双尾概率时的 tα /2和t’α /2 ②Satterthwaite 法:对自由度进行校正 ③Welch 法：也是对自由度进行校正重点介绍第一种方法，见书P48例5-6
第六节两种检验与两类错误一、单侧检验与双侧检验 1、若检验目的在于检验两总体均数是否相等，两者谁大谁小都有可能，只要t的绝对值大于0.05界值即认为均数差别有统计学意义，称双侧检验(two-tailed test)或双尾检验 2、若已知一个均数不可能低于另一个均数，检验时只需考虑一侧的临界值，称单侧 (one-tailed test)或单尾检验单、双侧检验时界值间的关系见面积示意图，图5-1、图5-2(p49-50)
假设检验种类
非等效性检验nonequivalence 优效性检验superiority 等效性检验equivalence 非劣效性检验noninferiority
第二节
样本均数和总体均数差别的统计意义检验
inferences from means ( one sample/group u, t-test)
无实际意义
无统计学意义
样本过小
可接受零假设
第七节正态性检验
一、正态概率纸法：适用于小样本、大样本或分组资料，粗略检验. 亦可用Proportion-proportion plot or quartile-quartile plot (PP or QQ plot) 将观察值从小到大排序，计算累计百分数，转换成概率单位probability unit: probit〔查附表5-1 〕，以概率单位为纵坐标，以观察值单位为横坐标，作点图，若点子基本在一直线上，即近似正态分 xm 布。 probit 5
医学科研中配对设计有：
– 同一批对象身体两个部位的数据 – 同一批对象实验(或处理)前后的配对数据 – 同一批样品用两种方法(两种仪器、两名化验员、两种条件)检验的结果 – 配对试验的结果(两个同质受试对象分别接受两种不同的处理)
一、同体比较(自身对照比较)的t检验：见 P43例5-2，计算差值d，并假设差值的总体均数为0 二、配对实验的t检验：见P44例5-3 三、同一批对象两次检验结果差值的t检验
( x1 x1 ) 2 ( x 2 x 2 ) 2 n1 n2 2
2 ] [ x 2
( x1 ) 2
( x 2 ) 2 n2
] 联合估计的标准差的平方
n1 n2 2
如先算出了S1和S 2，则可用下式计算 c2 S
2 (n1 1) S12 (n 2 1) S 2 S c2 (n1 1) (n 2 1)
significance, highly significant (P>0.05,P≤0.05,P≤0.01) – P>α ,结论为按α 检验水准，不拒绝H0，无统计学意义 (统计结论)，还不能认为……不同或不等(专业结论)。不拒绝H0不等于接受H0 。此时尚没有足够的证据认为 H0成立。从决策的观点：可认为暂时接受它，或阴性待观察。 – 下结论时，对只能说拒绝H0或不拒绝H0 ；而对H1只能说，接受H1 ，除此之外其他说法均不妥当
2、选定检验方法，计算检验统计量
3、确定统计意义的水平和检验用临界值
– level of significance：指无效假设是对的而被拒绝的可能性，即第I类错误，用α 表示，常取值0.05、0.01：significant at the 5% level –查表获得界值
4、统计判断：no statistical significance (NS), statistical
三、假设检验应注意的问题 1、要有严密的研究设计 2、不同变量或资料应选用不同的检验方法 3、正确理解“ 显著性” 一词的含义：差别有统计学意义，亦称差别有“ 显著性”，不能理解为差异大。假设检验的结果并不指差异的大小，只能反映两者是否相同，差异的大小只能根据专业知识予以确定。 4、作结论不能绝对化：因统计结论具有概率性质，不宜用“ 肯定”、“ 一定”、 “ 必定‘”等词。报告中最好列出统计量的值和P值确切范围。以便读者与同类研究
t值计算公式为：equal variance: the two-sample t test
t x1 x 2 S ( x1 x2 ) n1 n 2 S ( ) 差数的标准误 n1 n 2
2 c
S ( x1 x2 )
l11 l 22 2 Sc n1 n 2 2 [ x12 n1
x：正态曲线下左侧面积等于累积百分数时对应横轴值 m：为均数，为标准差
二、偏度与峰度检验(method of moment) 正态分布有一定的峰度kurtosis，用g2表示，且左右对称，即偏度skewness，用g1表示，不应太大按P54～56计算峰度系数和偏度系数，再作 u检验正态时两者都为0，g1为正时表示多数频数集中在左边,少数较大数据向右延伸,曲线向右偏(正偏，医学常见)，为负时向左偏(负偏，医学少见)；g2为负时曲线较平坦(平阔峰)，为正时曲线峰度超出正态分布(尖峭峰)，即靠中心处数据过多。
第五章两均数差别的统计意义检验
test of statistical significance 又称test of hypothesis
第一节假设检验的基本步骤
基本步骤：4 1、建立无效假设null hypothesis和确定检验水准
– 如μ =μ 0，又称检验假设hypothesis under test, 零假设、原假设，用H0表示 –μ >μ 0：称备择假设或对立假设alternative hypothesis.用H1或HA表示 –一般取α =0.05和0.01
S12 (较大) F 2 S 2 (较小)
1 n1 1, 2 n2 1
P48例5－6 求得F值后查附表6-1 P550
1、近似t检验separate variance estimation t-test: t’-test(原版教材称统计量d)。有三种方法，前两种常用 ①Cochran & Cox 法(1950) 教科书中介绍的方法：对临界值进行校正
四、可信区间与假设检验的区别和联系
可信区间用于说明量的大小即推断总体均数的范围，而假设检验用于推断质的不同即判断两总体均数是否不同。
1、可信区间亦可回答假设检验的问题：算
得的可信区若包含了H0 ，则按α 水准不拒绝H0；若不包含H0，则按α 水准，拒绝H0接受H1。
2、可信区间比假设检验可提供更多的信息：