第五章 统计推断

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二、假设测验的步骤
(一)对未知或不完全知道的总体参数提出一些假设
1.
零假设 (Null hypothesis, Ho)
假设动物体重的总体平均数与原总体的平均数相等(没有显 著差异)。 Ho:μ=μ0=10g
2.
备择假设(Alternative hypothesis, HA)
与无效假设相对应的假设,一般与无效假设构成完全事件系。 HA: μ≠μ0
=P(Ⅰ型错误)=P(接受H0 | H0是正确的,μ=μ0)
如在单侧检验时所得到的结论是拒绝H0:μ=μ0 。 得到这样的结论是要冒一定风险的,因为在=0.05水平 上,拒绝H0。所以平均100次H0会有5次是错误的。或者 说,每次拒绝都要冒5%错误推断的风险。


假如在=0.01水平上拒绝H0。所冒的风险要小一些,即
第三章 统计推断 Statistical Inference
从样本 到总体


统计推 断(目的)
总体与 样本间 的关系
从总体 到样本

抽样分 布(基础)

总体——>样本
第 3、4 章
样本——>总体
统计推断(第 5、6 章)
试验所获资料均是样本的结果,而 需了解的却是抽得样本的总体。统计推 断是科研中十分重要的工具,对于试验 设计也有指导作用。
∴如果样本从总体具有μ =10.3 g 而不是μ 0=10 g 抽的,则在规定的 α =0.05 下,将有 23.3%的机会接 受 H0:μ 0=10 的错误结论。
换言之, 不能识别 H0:μ 0=10 为错误的概率 为 23.3%。
β :不能识别 H0 为错误的概率, 或接受一个错误 H0 的概率。
其他统计假设
1. 2. 3.
Ho: μ1=μ2 HA:μ1≠μ2 Ho: μ1≤μ2 HA:μ1>μ2 Ho: μ1≥μ2 HA:μ1<μ2
对Ho的要求
1. 2.
有专业意义 据之能算出因抽样误差而得到的样本结果 的概率。
(二)确定一个否定Ho的概率标准—显著水平
生物试验中常用的显著水平有两个:
1.
0
2)区间估计 x u / 2 x x u / 2 x
这两种不同的统计推断方法,在实践应用中可互相参照使用。
第一节 假设检验的步骤和原理
一、假设检验的定义
根据某种实际需要,对未知的和不完全知道的统计总体提 出一些假设(通常构成完全事件系),然后由样本的实际 结果,经过一定的计算,作出在概率意义上应当接受哪种 假设的检验。
4.
三、接受域和拒绝域
1.
接受域:在一定概率保证下接受Ho的 统计数的区间(范围)。
拒绝域:在一定概率保证下否定Ho的 统计数的区间(范围)。
2.
求接受域和拒绝域的原理方法
u >uα,p<α,否定H0 。u>uα 为否定H0的u 区间,根据u区间推出否定H0的x的区间,即 拒绝域。 u <uα , p>α,接受H0 。u < uα 为接受H0的 u区间,根据u区间推出接受H0的x的区间, 即接受域。
2.
3.
Ho:μ=μ0=10.00 HA: μ≠μ0 α=0.05,Uα=1.96 X=10,n=10, σ=0.4 σ x =σ/(n 1/2)=0.4/(10 1/2) u = (x-μx )/(σ x )=1.82 u > u 0.05 或 P<0.05 推断:否定Ho,接受HA:μ≠μo,即抽出的 动物的体重样本与体重总体间有显著差 异。
(三)在假设Ho为正确的前提下,算得样本结果由误差造成的概率
附表2 P327
(四)推断:根据“小概率事件实际不可能原理”, 来接受或否定Ho假设
小概率事件实际不可能原理:小概率(P< α)事件在一次试验中是不可能发生的。 本例推断:p <0.05 否定Ho,接受HA:μ≠μ0
假设测验步骤总结
1.
影响两类错误 概率的因素
μ1
μ2
影响两类错误概率的因素
2 X ~ N , n
3°减少试验误差或 增加样本含量, 可同时降低犯两 种类型错误的概 率α,β
μ1
μ2
注解: 在用μ 0 时,一旦接受 H0 就 犯了 II 型错误,而犯 II 型 错误的概率实际发生于有关 真实μ 的分布中。
备择假设的提出需视情况而定。

若已知μ不可能大于μ0 ,则HA:μ<μ0 。
若已知μ不可能小于μ0 ,则HA:μ>μ0 。


若考查的目的只是判断μ是否等于μ0 ,并不关
心究竟是μ>μ0 还是μ<μ0 ,或者并不知道μ不 可能大于 μ0 或是 μ 不可能小于 μ0 ,这时的 HA : μ≠ μ0 。
bμ1 =P(Ⅱ型错误)=P(接受H0 | H0是错误的,μ=μ1 )
二、两种类型的错误
统计推断 事实上
H0正确 拒绝H0 I类错误 推断正确 接收H0 推断正确 II类错误
H0错误
P(I类错误)=P(统计推断拒绝H0|事实上H0正确) P(II类错误)=P(统计推断接受H0|事实上H0错误)
已知总体: X 0 ~ N 0 , 2
假设——→试验

总体参数
区分符合与否的界限?
样本资料 ←→ 检查符合? ↓

⒈ 2.
假设 小概率原理 (假设检验的基础)

假设
总体平均数是未知的,为了得到对 总体平均数的推断,可以假设总体平均 数μ等于某一给定的值 零假设
H0:μ=μ0
备择假设记为HA
HA:μ>μ0 、HA:μ<μ0 及HA:μ≠μ0 。
平均每拒绝100次H0,会有1次是错误的。或者说,每次
拒绝都要冒1%推断错误的风险。
另一方面,接受H0也不能说H0一定是正确的。当事实
上μ不等于μ0而等于另外的值μ1 时,也有落入接受域的可能。 当μ≠μ0 但错误地接受了μ=μ0 的假设时所犯的错误称为Ⅱ 型错误(type Ⅱerror)。犯Ⅱ型错误的概率记为b,可以表 示为:
未知总体: X ~ N , 2
n x
事实上H0正确


0
事实上H0错误


u
α
n
推断
相等? 0
H0:μ=μ0 HA:μ>μ0
u
α
n
0

已知总体: X 0 ~ N 0 , 2
未知总体: X ~ N , 2
n x


事实上H0正确
例题解
X=10-1.96×0.4=9.216 X=10+1.96×0wenku.baidu.com4=10.784
接受域: 9.216 ≤x≤ 10.784 (概率保 证:95%) 拒绝域(两尾): x≤10.784 或 x≥9.216 (概率:显著水平)
四、单侧检验(one-sided test)和双侧检验
(two-sided test)
统计推断:根据抽样分布规律和概率由样本结果(统计数)来推论总体特
征(参数)。
统计推断前提:
1)资料必须是来自随机样本 2)统计数的分布律必须已知
对总体作推断的途径: a)假设测验(test of hypothesis) b)参数估计(estimation of parameter) 1)点估计
H0:μ =μ
根据上述原理所建立起来的检验方法称为显著
性检验( significance test )。究竟概率小到什么
程度算是小概率,要根据实际情况或实验要求而
定。计算生物工作中,通常规定 0.05 或 0.01 以下
为小概率 0.05 或 0.01 或其它的值)称为显著性水
平(significance level),记为“”。
2. 小概率原理 小概率的事件,在一次试验中, 几乎是不会发生的。若根据一定的 假设条件计算出来该事件发生的概 率很小,而在一次试验中,它竟然 发生了,则可以认为假设的条件不 正确。因此,否定假设。
如何用小概率原理?
标准化的样本平均数
u
x 0
n
服从标准正态分布N(0,1),即P(U>u)或P(U<-u)或P (| U |>u)的值。或者说,可以得到抽自平均数为μ0 的总体的概 率。如果得到的概率值很小,则抽自平均数为 μ0 的总体的事件是 一个小概率事件。根据小概率原理,它在一次试验中几乎是不会 发生的,但实际上它发生了,说明假设的条件不正确,即μ并不等 于μ0 ,拒绝零假设而接受备择假设。
影响两类错误α、β大小的因子有哪些?
两类错误小结:
1) n 固定、提高显著水平,如从 5%变为 1%,增大犯 II 型错误的概率β
2)
α 已固定,则合理的试验设计、正确的试验技术和增加样本容量可有效降低 犯 II 型错误的概率。因此,不良的试验设计(如观察值太少等)和粗放的试 验技术是使试验不能获得正确结论的极重要原因。因为在这样的条件下,容 易接受任一个假设,而不论这假设是正确的或错误的。
3)
n 和α 固定的条件下,真实总体平均数μ 和假设平均数μ 0 的相差(以标准误 为单位)愈大,β 愈小。 (但这不能主观控制! ! ! )
4)
为了降低犯两类错误的概率,需采用一个较低的显著水平,如α =0.05,同时 适当增大 n(样本容量) ,或适当减少总体方差,或两者兼而有之。
上述类错误小结对于其它统计 2 数如 t、χ 、F 分布的假设测 验也都适用。


0
P(I类错误)
u
α α
n
推断
相等? 0
H0:μ=μ0 HA:μ>μ0
=P(检验拒绝H0|事实上H0正确)

已知总体: X 0 ~ N 0 , 2
未知总体: X ~ N , 2
n x


P(II类错误)
=P(检验接受H0|事实上H0错误)
1.

否定区间在一尾的为单侧检验。

Ho: μ1≤μ2 HA:μ1>μ2(上尾检验) Ho: μ1≥μ2 HA:μ1<μ2(下尾检验)
2.
否定区间在两尾的为双侧检验。 Ho: μ1=μ2 HA:μ1≠μ2
选择做单侧检验或双侧检验,应根据问题的要求而定。

假若问题只要求判断μ是否等于μ0 ,而不是大于μ0 或小 于μ0 时,应做双侧检验。 如果事先可以判断μ不可能大于μ0 ,或μ不可能小于μ0
第二节 单个样本显著性检验程序
x x和u 的分布, x P[( 1.96 x ) x ( 1.96 x )] 0.95 x P( 1.96) 0.25, x x P( 1.96) 0.25, x
因之可写为
P[ x ( 1.96 x )] 0.025 P[ x ( 1.96 x )] 0.025

时,则可做单侧检验。因单侧检验的辨别力更强些,所
以在可能情况下尽量做单侧检验。
单侧检验与双侧检验的关系
五.两种类型的错误
在H0 是真实的情况下,由于随机性仍然有可能落 在拒绝域内,根据小概率原理,这时将拒绝 H0 。这样
的拒绝是错误的。如果假设是正确的,却错误地拒绝了
它,称为犯Ⅰ型错误(typeⅠerror)。犯Ⅰ型错误的概 率不会超过。
因此,在样本平均数的抽样分布中,
x落在( 1.96 x , 1.96 x )区间内的概率有95% x落在( 1.96 x , 1.96 x )区间外的概率只有5%
如以 5%概率作为接受或否定 H0 的界限,则
( 1.96 x , 1.96 x )为接受H 0区域 x 1.96 x 和 x 1.96 x 为否定 (或拒绝) H 0的两个区域



事实上H0错误
推断
相等? 0
H0:μ=μ0 HA:μ>μ0
u
β α
n
0

1°当μ2愈接近μ1时, 犯Ⅱ型错误的概率 愈大, 反之,则犯Ⅱ型错 误的概率愈小, 但对Ⅰ型错误概率 没有影响;
影响两类错误概率 的因素
μ1
μ2
μ1
μ2
μ2
2°对于两个确定的 总体,降低犯Ⅰ型 错误的概率,必然 增加犯Ⅱ型错误的 概率; 反之β↘,α↗.
α=0.05(测验有否显著差异 *)
2.
α=0.01(测验有否极显著差异 **)
Figure 5. The hFOB proliferation (a) and Alizarin Red-S staining of mineral deposition (b) on the electrospun CTS, electrospun nanocomposite HAp/CS, and control TCP. (*P < 0.05, **P < 0.001).
相关文档
最新文档