第三章 spss 生物统计学
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• •
对于接受不同处理的两个样本来说,则有:
x1 1 1 , x2 2 2
( x1 x2 ) ( 1 2 ) (1 2 )
两个样本均数之差
试验的处理效应
试验误差
样本平均数的差 ( x1 x2 ) 包含有试验误差, • 它不只是试验的表面效应。因此,仅凭 ( x1 x2 ) 就 对总体均数 、 是否相同下结论是不可靠的。
二、显著性检验的基本步骤
•
(一)首先对试验样本所在的总体作假设。
•
0 这里假设 1 2或1 2 ,即假设甲、乙两品 种猪经产母猪仔猪初生重的总体均数相等,其意 义是试验的表面效应 x1 x2 1.87kg 系试验误差, 处理无效,故称为无效假设(null hypothesis), 记作 。 H0
• •
• (二)显著水平α在显著性检验(t检验)中的应用 •
这时称“差异不显著”,记为“ns”或不标记; • 若 t0.05 t t0.01 ,则说明试验的表面效 应属于试验误差的概率 P 在 0.01 ~ 0.05 之间,即 0.01 < P < 0.05 ,亦即表面效应属于试验误差的 可能性较小,应否定 H 0,接受 H A ,这时称“差 异显著”,记为“*”;
•
若 t t0.01 ,则说明试验的表面效应 属于试验误差的概率 P 不超过 0.01 , 即P≤0.01 。 亦即表面效应属于试验误差的可能性更小,应否 HA 定 ,接受 H,这时称“差异极显著”,记为 0 “**”。
(三)两类错误
• 因为显著性检验是根据“小概率事件实际不 可能性原理”来否定或接受无效假设的,所以不 论是接受还是否定无效假设,都没有100%的把 握。也就是说,在检验一个假设时可能犯两类错 误。
•
离均差的平方和 ( x x ) 最小。说明样本平
2
均数与样本各个观察值最接近,平均数是资料的 代表数。
E( x ) 样本平均数是总体均数的无偏估计值,
• 统计学中心极限定理,样本平均数 x 服从或 逼近正态分布。
•
所以,以样本平均数作为检验对象,由两个 样本均数差异的大小去推断样本所属总体平均数 是否相同是有其依据的。
问题:能否仅凭这两个样本均数差值x1 x2 1.87kg • 立即得出甲、乙两品种母猪经产仔初生窝重不同 的结论呢?
•
统计学认为, 这样得出的结论是不可靠的。 这是因为试验指标既受处理因素的影响,又受试 验误差(或抽样误差)的影响。如果我们再分别随 机抽测10头甲、乙两品种猪母猪产仔初生窝重, 又可得到两个样本资料。两样本均数就不一定是 13.5kg和11.63kg,其差值也不一定是1.87kg。 怎样通过样本来推断总体呢?——这正是显著 性检验要解决的问题。
• (请联系上一章的内容思考如何得出该结论的??)
其中
S x1 x2 ( n1 1) s ( n2 1) s 1 1 ( ) ( n1 1) ( n2 1) n1 n2
2 1 2 2
•
S x1 x2 为均数差异标准误;
2 1 2 2
• n1、n2 , x1、x2 , s 、s 分别为两样本的含量、平均数、 均方。 • • 根据前面两个样本的数据,计算得:
在生物学研究中常以0.05和0.01两个概率作为 • 某事件是否是小概率事件的标准。 • 若 P 0.01或
0.01 P 0.05
小概率事件 不认为是小概率事件
•
本例中,按所建立的 H 0 ,表面效应为试验 误差的概率在0.01~0.05之间,即无效假设 H 0 属于小概率事件,根据小概率原理,故有理由否 定 H 0 : 1 2 ,从而接受 H A : 1 2 可以认为甲、 乙两品种经产母猪的仔猪初生窝重总体平均数不 相同。
x1 x2 13.5 11.63 1.87
S x1 x2 (10 1)1.812 (10 1)1.932 1 1 ( ) 0.837 (10 1) (10 1) 10 10
于是 • •
x1 x 2 1.87 t 2.234* S x1 x2 0.837
• 亦即存在处理效应,试验的表面效应除包含试 验误差外,主要的是含有处理效应在内。 • • (二)在无效假设成立的前提下,构造合适 的统计量,并研究试验所得统计量的抽样分布。 就我们的例子,研究在无效假设 H 0 : 1 2成立 的前提下,统计量 ( x1 x2 ) 的抽样分布。经统计 学研究,得到一个 df (n1 1) (n2 1) 的t分布。
• •
无效假设是被检验的假设,通过检验可能被 接受,也可能被否定。
提出 H 0 : 1 2 的同时, 相应地有一对应假 设,称为备择假设(alternative hypothesis), 记作 。 HA
备择假设是在无效假设被否定时准备接受的假设。
•
本例的备择假设是 : 甲、乙两品种猪经产母猪 仔猪初生窝重的总体均数不相等,记作 H A : 1 2
• 第一节 • 第二节 性检验
显著性检验的基本原理 样本均数与总体均数的差异显著
• 第三节 两样本平均数的差异显著性检验
• 第四节 • 第五节 显著性检验中应注意的问题 总体均数的区间估计
第一节
•
• • •
显著性检验的基本原理
一、显著性检验的意义
二、显著性检验的基本步骤 三、显著水平与两类错误 四、双侧检验与单侧检验
•
综上所述,显著性检验,从建立假设到最后 依概率的大小来决定接受还是否定假设,这一过 程实际上应用所谓“概率性质的反证法”对试验 样本所属总体所作假设的统计证明。
•
对于各种显著性检验的方法,除明确其应用 条件,掌握有关统计运算方法外,正确的逻辑推 理是不可忽视的。
三、显著水平与两类错误
•
(一)显著水平(Significance level) 在显著性检验中,否定或接受无效假设的依 据是“小概率事件实际不可能性原理”。 用来确定否定或接受无效假设的概率标准叫 显著水平,记作α。在生物学研究中常取 α=0.05 或 α=0.01。 若 t t0.05 ,则说明试验的表面效应属 于试验误差的概率P>0.05,即表面效应属于试 验误差的可能性大,不能否定 H 0 。
1 2
只有通过显著性检验才能从 ( x1 x2 ) 中提取结论。
• 对( x1 x2 ) 进行显著性检验就是要分析:
• ( x1 x2 ) 主要由处理效应 ( 1 2 ) 引起的,还是主 要由试验误差所造成? • 虽然处理效应 ( 1 2 ) 未知,但试验的表面效
应是可以计算的,借助数理统计方法试验误差又 是可以估计的。
由上所述,一方面我们有依据由样本均数 x1、x2 2 相同与否,另一方 的差异来推断总体均数 1 、 面又不能仅据样本均数表面上的差异直接作出结 论,其根本原因在于试验误差(或抽样误差)的不 可避免性。
•
(三)基本思想
•
我们所得到的观察值由两部分组成,即 xi i
• 若样本含量为n,则可得到n个观察值 x1 , x2 ,..., xn 。 于是样本平均数 x 。说明样本均数并非总 体均数,它还包含试验误差的成分。
P( t 2.101 ) P(t 2.101 ) P(t 2.101 ) 0.05 P( t 2.878 ) P(t 2.878 ) P(t 2.878 ) 0.01
•
由于根据两样本数据计算所得的t值为2.234, t0.05 2.234 t0.01 介于二个临界t值之间,
所以,|t|≥2.234的概率P介于0.01和0.05 • 之间,即: • 0.01<P<0.05
说明试验处理效 应不存在,即试验的 表面效应为试验误差 的可能性在0.01~ |t|≥2.234的两尾概率 0.05之间。 • (三)根据“小概率事件实际不可能性原理” 否定或接受无效假设。 • 当一事件发生的概率很小(例如小于0.05或 0.01)时,在一次试验中可以认为其实际上不可 能发生,这叫小概率事件实际不可能性原理。
因此,收集到正确、完整而又足够的资料是 通过显著性检验获得可靠结论的基本前提。
•
• 小结:
• (一)显著性检验要解决的问题——如何 通过样本来推断估计总体。 • (二)检验的对象及其依据——样本平均 数(根据有三条)。 • (三)显著性检验的基本思想——从试验 的表面效应与试验误差的权衡比较中间接 地推断处理效应是否存在。 • (四)通过检验获得可靠结论的基本前 提——收集到正确、完整而又足够的资料。
下面进一步估计出 t 2.234 的两尾概率,即 估计 P( t 2.234 ) 是多少。 查附表3 ,在 df (10 1) (10 1) 18时,两尾概率 为0.05的临界t值 t0.05(18) 2.101,两尾概率为 0.01的临界t值 t0.01(18) 2.878,即:
•
所谓统计推断是指根据样本以及问题的条件和假定 模型对未知事物(即总体)作出的以概率形式表述的推断, 它主要包括假设检验和参数估计两个内容。
•
假设检验又叫显著性检验,其方法很多,常用的有t 检验、F检验和χ2检验等。
• •
尽管这些检验方法的用途及使用条件不 同,但其检验的基本原理是相同的。 本章以平均数的差异显著性检验为例 阐明显著性检验的原理,介绍几种t检验的 方法, 然后介绍总体均数的区间估计。
•
(二)检验对象
• 设甲品种猪经产母猪产仔初生窝重的总体均 数为 1 ,乙品种的总体均数为 2 。
•
试验研究(本例为抽样比较)的目的,就是要 给 1 、 2 是否相同做出推断 ,由于总体均数 1、未 2 知,在进行显著性检验时只能以样本均数 x1、作 、x2 为检验对象,更确切地说,是以 ( x1 x2 ) 作为检验对 象。事实上,因为样本均数具有下述特征:
• 小结(显著性检验的基本步骤):
• • 首先对试验样本所在的总体作假设(无效 假设和备择假设)。 在无效假设成立的前提下,构造合适的统 计量,并研究试验所得统计量的抽样分布。(得 出无效假设成立的概率) • 根据“小概率事件实际不可能性原理”否 定或接受无效假设。(在一定的概率保证下,对 无效假设是否成立作出判断)
一、显著性检验的意义
•
• • • • • •
本节的内容主要是解决这样几个问题,即进 行显著性检验的目的、检验对象、基本思想和基 本前提是什么 ?下面结合具体例子来说明。 (一)为什么要进行显著性检验? 在某种猪场随机抽测了甲、乙两品种经产母 猪各10头的产仔初生窝重: 甲品种10头母猪产仔平均初生窝重 x1 13.50kg 标准差 S1 1.81kg ; 乙品种10头母猪产仔平均初生窝重 x1 11.63 , kg 标准差 S2 1.63kg 。
•
第一类错误是真实情况为 H 0 成立,却否定
了它,犯了“弃真”错误,也叫Ⅰ型错误 (type Ⅰ error)
•
犯Ⅰ型错误的概率不会超过α, Ⅰ型错误也叫 α错误,在医学上还称为假阳性错误。
第二类错误是 H 0 实际不成立,却接受了它, • 犯 了 “ 纳 伪 ” 错 误 , 也 叫 Ⅱ 型 错 误 (type Ⅱ error)。
•
所以,可从试验的表面效应与试验误差 的权衡比较中间接地推断处理效应是否存
在,这就是显著性检验的基思想。
(四)基本前提
• 为了通过样本对其所在的总体作出符合实际 的推断,要求合理进行试验设计,准确地进行试 验与观察记载,尽量降低试验误差,避免系统误 差,使样本尽可能代表总体。
•
只有从正确、完整而又足够的资料中才能获 得可靠的结论。若资料中包含有较大的试验误差 与系统误差,有许多遗漏、缺失甚至错误,再好 的统计方法也无济于事。
在生物学研究中常取005则说明试验的表面效应属于试验误差的概率p005即表面效应属于试验误差的可能性大不能否定则说明试验的表面效应属于试验误差的概率p在001005之间即001p005亦即表面效应属于试验误差的可能性较小应否定接受这时称差异显著记为
第三章 统计推断
•
前面第四章第六节讲了样本平均数抽样分布的问 题。抽样研究的目的是用样本信息来推断总体特征,这 就是我们将重点讨论的统计推断问题。