小样本 的差异显著性检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
下面我们以实例来说明成组数据的比较
A、B 两厂生产某同类药物,现作 24 小时血液内残 留量检测,得如下数据,试分析哪一厂家的该类 药物的残留量大
A厂:49.3 48.1 49.8 51.2 50.0 50.7 49.9 48.5 50.4 51.6
B厂:48.3 49.7 48.2 48.8 47.3 47.7 50.4 49.2
显然,这两个厂家的药物是相互独立的,试验所用 动物也是独立的;样本较小
因此应使用成组数据的 t-test 进行分析 (同学们先行分析)
先做预备计算,将两个样本的平均值、方差等计算
出来:n1 10 x1 49.95
n 2 8 x2 48.70
s12 1.225 s22 1.074
sx1x2 1.1591108 10.51
2
2
x12
x1 n1
x22
x2 n2
11
n11n21
n1 n2
或:
s x1x2
n11s1 2n21s2 2 n11n21
11
n1 n2
t 公式中分母两样本差的标准误也可以这样写:
s x1x2
s2
1 n1
1 n2
其中:
s2
x12
2
x1 n1
x2 2
2
x2 n2
n1n22
在这种检验中,我们求 t 值时用的是合并均方,合 并均方只有在两总体方差(我们一般用样本均方 估计总体方差)相同,即两方差差异不显著的情 况下才能得到
这里我们总假定两个均方差异不显著,但如果两方 差差异显著,就不能合并,两均方是否相等,必 须用下一章的 F-test 进行检验才能知道
当两均方不等(称为方差不齐)时,用以下方法计
下面我们以实际例子来说明配对数据的差异性检验
研究V A 和V E 的关系,挑选体况基本相似的一对全同 胞小鼠,其中任意一只放入Ⅰ组,另一只放入Ⅱ 组,共挑选了8 对,分成了两组。一组饲喂正常 饲料,另一组饲喂缺乏 V E 的饲料。试验结束后检 测小鼠肝脏中 V A 的含量,得如下数据:
当两样本量相等时:n1 n2 n
则: sx1x2
n1 s12s2 2 nn1
s12s2 2 n
在小样本时,两样本平均数差的标准化
x1x212 是服从 t 分布的
sx1x2
因此: tx1x212
sx1x2
由于我们在之前的无效假设是:H0 :1 2 (备择假设是: HA:12 ) 因此这一式子可以简化为:t x1 x 2
x 40.239
t
4.71
sx 0.255
查附表4:t 分布表,得知:自由度为 df = 24 - 1 =
23 时的
t0.05,23 2.069 t0.01,23 2.807
本例中所得 t4 .7 1t0 .0 5,2 32 .0 6 9 所得 t 值的概率 p 0.05 因此,应否定无效假设,
下面我们用例子来说明这一类型的 t-test
例:猪的正常肛温为 39℃,今有一个猪场报告,怀 疑其猪群可能是发病了,某兽医在该场内随机抽 测了 24 头猪的体温,得到这 24 头猪的平均肛温
为 x = 40.2 ℃,标准差为 s = 1.25 ℃,试问该猪
场的猪犯病了吗?
该例仅有总体平均值 = 39 ℃,而无总体方差,且
设立无效假设: H0:12 v s HA:12
计算 t 值,并作比较: t4 9 .9 54 8 .7 01 .2 52 .4 5
t2.45t0.05,162.120
0 .5 1 0 .5 1
所得 t 值出现的概率 p 0.05
因此,否定无效假设,接受备择假设
即:A、B 两厂生产的该类药物的 24h 血液残留量 差异显著(下面应针对这一现象作出专业解释)
注意:对子内的两个个体应尽可能一样,但对子之 间应有较大的差异
2、选取若干个动物,每一个动物在试验前测定一 次,试验后测定一次,这样的两次记录就是配对 数据,如同一个人吃早饭前后各测一次血糖值, 这同一个人的两次血糖值就是一对数据,若干个 人就有若干个数据对
3、同一个体的不同部位可以配成一对,如一个兔 子的左右体侧,就可以配成一对,若干个兔子的 不同体表就是若干对
在第四章讨论 t- 分布时,我们已经知道,总体方差
未知、且样本较小时,可以用 s 2 代替 2 ,其统计
量 x 就不再服从标准正态分布,而是服从 t-
sx
分布:t x
sx
(请回忆一下 t- 分布曲线及其特点)
t- 分布曲线受自由度制约,不同自由度下的 t- 分布 曲线其形状是不同的,因此不同自由度下算得的 t- 值落在某一范围内的概率值也随自由度的不同 而不同
布计算实得差异由抽样误差造成的概率,所以称 u-test u- 检验(u-test)的方法和步骤见前一章内容 (请逐一回忆一下检验公式和检验步骤)
二、总体方差未知时单个样本平均数的假设 检验
(一)当总体方差未知、而样本较大时,可以使用 u- 分布计算实得差异由抽样误差造成的概率
因此,其检验还是 u-test
一定要注意其中的任意一组作处理,一组作对照, 而不能事先规定哪一组做处理,哪一组作对照
试验过程中注意记录资料,结束以后整理资料并进 行统计分析
这样得到的资料称为成组数据
这样的数据在组间、组内都是独立的
成组数据的 t-test 其公式是:t x1 x 2 s x1 x2
其中:
s x1x2
4、同一个动物的不同试验时期所施加的不同处理 形成一个对子,如一只猪在第一试验期施加 A 处 理,在第二试验期施加 B 处理;或第一试验期施 加处理,第二试验期作对照
凡此种种,都是配对试验,因此配对试验既有空间 上的配对,亦有时间上的配对,配对试验所得到 的数据,就称为配对数据
配对数据的比较方法不同于成组数据的比较方法
本章主要介绍总体方差未知、且样本较小时不同资 料类型的统计推断——差异显著性检验(假设检 验)的具体方法
第一节 单个平均数的假设检验
单个平均数的假设检验是检验一个样本所属的总体 平均数 0 与一个特定(已知)总体平均数 间是 否存在显著差异的一种统计方法,也可理解为检 验一个样本是否来自某一特定(已知)总体的统 计分析方法
接受备择假设
即:该猪群肛温与正常猪肛温差异显著,我们有 95% 以上的把握认为该猪群犯病了
由于所得 t 值远大于 t0.05,23 2.069 因此还应当作进一 步的检验: t4.71t0.01 ,232.807
所得 t 值出现的概率 p 0.01,因此更应该否定无效 假设而接受备择假设
即:该猪群肛温与正常猪肛温差异极显著,我们有 99% 以上的把握认为该猪群犯病了
根据统计假设检验的基本原理可知,假设检验的关 键是根据统计量的分布计算实得差异(即表面效 应)由抽样误差造成的概率
测验的统计量分布服从 u- 分布或 t- 分布,所以单 个平均数的假设检验可分为 u-test 和 t-test 两种
一、总体方差已知时单个平均数的假设检验
当总体方差 2 已知,不管样本多大,均可用 u- 分
首先计算平均数和标准差,得:
x59.35 s0.999
sx
s 0.9990.32 n 10
第一步,设立无效假设
设: H0:60 v s HA:60
t|59.3560|2.03 0.32
查 t 值表,得: t0.05,9 2.262
t2.03t0.05,92.262 即 p 0.05 接受无效假设,即该批次药物的总黄酮含量符合药
s x1 x2
得到成组数据所进行的试验称为完全随机设计法 (仅两个组)
两个组的样本量可以相等,也可以不等,但应尽量 接近
这种两个组是完全独立的试验,如: 一组用药,一组不用药 一组用试验药物,一组用常规药物 一组用试验剂量,一组用常规剂量 一组是引进品种(品系),一组是本地品种,等等 就称为完全随机设计试验 这里,前面的一组称为处理,后一组称为对照
(请回忆一下以上两种 u-test 的共同点和不同点; 公式的不同:哪里不同)
(二)总体方差未知,且样本较小时的单个 样本平均数的假设检验
实际上,在很多情况下,总体方差往往是未知的, 而由于各种条件的限制,试验的样本又不可能很 大,即只能用小样本来作试验,或调查时抽取的 样本较小
因此,总体方差未知、样本较小是试验中最常见的 一种情况
样本量不大(n = 24 < 30),因此符合总体方差 未知、且是小样本的情况,应使用 t-test 来进行 检验
已知: = 39 ℃,样本 x = 40.2 ℃,s = 1.25 ℃
检验步骤如下:
设 H0:39℃ v s HA 39 ℃
计算 s x 和 t 值:
s 1.25
sx
n
0.255 24
s 算 x1 x 2 和 t 值:
t x1 x2 s x1 x2
s x1x2
s12 s22 n1 n2
当n1 n2 n 用 df n1的 t 作判断的临界值
当 n1 n2 时须用 Cochran-cox 法:
首先计算在α水平上显著的临界值 t '
t'
t1
n2s1 2t2 n1s2 2 n2s1 2n1s2 2
其 t-test 的公式为:t
其中: n
di
d i1 n
x1 x2
d sd
sd
d
2
d
n
2
nn 1
而 di x1i x2i
而 n 是对子数,这里的样本量不是 2n,而是 n,因 此自由度不是 2(n-1),而是 n-1
在对配对资料进行统计分析时,首先要计算每一对 对子内两数据之差,即 d 值,然后对 d 值进行分 析
这种试验可以采用两种方法进行:
第一种方法是两个组的数据是相互独立的:一组是 处理,另一组是对照
第二种方法是两个组的数据是配对的
下面我们先讨论两个组是相互独立的情况 这种统计假设检验的方法称为成组数据的比较 一、成组数据的平均值比较 方法介绍: 在一个总体中,随机地抽取两个样本,在这两个样
本中,被抽取的个体是相互独立的,且基本条件 (如品种、日龄、性别、体况等)都应一致、均 匀,必要时须作适当的调整,尽可能使两个组在 样本量上一致,各组的基本情况一致 随机地指定一组作处理,另一组作对照
式中:t1 是 d f n 1 1 的 t值 ,t2 是 d f n 2 1 的 t值
若 | t | t '就否定 H 0 ,否则,就接受 H 0
由于t ' 处于 t1~t2 之间,因此,只有在实际计 算得到的 | t | 在 t1~t2之间时,才需要计算 t '
附:
两均方是否齐性的判别方法: F
第六章
小样本资料的 差异显著性检验
本章主要介Biblioteka Baidu 小样本时单个均数、两个均数的假设
检验 单个率、两个率间的假设检验 应重点掌握各种情况下的t检验方法 正确区分成组资料和配对资料
在上一章中,我们系统介绍了抽样分布和统计推断 的基本原理和基本方法,即通过随机抽样的方法 获得某一特定总体的随机样本,用这一样本进行 试验,并对试验后所得资料进行分析,通过统计 推断来定性或定量地分析研究总体的特征
再举一例: 药典规定,某药物每 100ml 中应含有 60mg 的总黄
酮,现对某药厂生产的某一批次的这种药进行检 测,得如下数据,试问该批次药物的总黄酮含量 合格吗?
58.3 59.2 58.6 60.6 60.3 59.5 59.1 58.0 61.0 58.9 n = 10
下面我们作统计分析 由于是小样本,且总体方差为未知 因此应使用 t-test 进行分析 (请同学们先自行立题、计算)
典规定 (试想一下,该题可以用一尾检验吗?)
我们有三个公式用于单个样本的统计假设检验:
u x x
u x sx
x t
sx
能说出这三个公式各自的使用场合和它们之间的区 别吗?
第二节 两个样本平均值相比较的 统计假设检验
很多情况下,我们不只是将样本平均数与总体平均 数相比较
而是做一个试验,这个试验中设置两个组,一个组 作试验,施加某种试验条件(即处理 ),另一个 组作对照,试验完了将这两个组的试验数据进行 比较
s
2 大
s
2 小
如果 FF,df1,df2 表示两均方齐性,否则就是不齐
(例题见P 52 该例实际是不需要计算 t ' 的,为什
么? )
二、配对数据的平均值比较
方法介绍:
配对数据来自于配对试验,配对试验根据具体试验 情况可以有好多种方法:
1、将两个品种、性别、日龄、体况等一致的动物 (最好是有血缘关系的同胞或半同胞)配成一对, 任意一只进入试验组,另一只进入对照组,配成 若干对,试验中做好记录,这种记录到的数据就 是配对数据