第五章 统计推断

合集下载

第五章 统计推断 PPT课件

第五章 统计推断 PPT课件

(点估计)
置信区间
置信下限 ˆ 1
置信上限 ˆ 2
一般地,如果将构造置信区间的步骤重复多次, 置信区间中包含总体参数真值的次数所占的比率, 称为置信水平(概率保证程度)。
即区间包含总体参数真实值的可信度.
通常用1- 表置信水平,其中称为显著性水平。 比较常用的置信水平:90%,95%和99%。
第五章 统计推断
第一节 总体参数估计 第二节 总体参数检验
统计推断在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
大学生每周上网花多少时间?
为了解学生每周上网花费的时间,某校4名 本科生对全校部分本科生做了问卷调查。调 查的对象为本校在校本科生,调查内容包括 上网时间、途径、支出、目的、关心的校园 网内容,以及学生对收费的态度,包括收费 方式、价格等。
例如,抽取了1000个样本,根据每一个样本均构 造了一个置信区间,这1000个置信区间中,有95% 的区间包含了总体参数的真值,而5%的置信区间则 没有包含。这里,95%这个值被称为置信水平(或置 信度)。
两个需要注意的问题
如果用某种方法构造的所有区间中有95%的 区间包含总体参数的真值,5%的区间不包含 总体参数的真值,那么,用该方法构造的区 间称为置信水平为95%的置信区间。
点估计完全正确的概率通常为0。因此, 我们更多的是考虑用样本统计量去估计总 体参数的范围 区间估计。
(一)总体参数的区间估计概述
1.基本概念
(1)区间估计:在点估计的基础上,给出总体参数 估计的一个范围,并给出区间估计成立的概率值。


p(1 2 ) 1 样本统计量
P(X )
均值的抽样分布

第五章统计推断

第五章统计推断
2014-8-16 版权所有 BY 统计学课程组 32
一、假设检验的一般性问题(6)

(三) 单、双侧检验问题
2014-8-16
版权所有 BY 统计学课程组
33
一、假设检验的一般性问题(7)
(四)假设检验中的两类错误
2014-8-16
版权所有 BY 统计学课程组
34
一、假设检验的一般性问题(8)
2014-8-16 版权所有 BY 统计学课程组 6
一、点估计


总体的参数估计按是否考虑估计误差及发生概率的大小, 可分为点估计和区间估计两大类。 1.点估计的定义和分类

点估计不考虑估计误差的大小,故不需确定估计量的概 率分布。点估计的基本方法包括矩估计法和最大似然估 计法,其主要作用是寻找参数的最佳估计量。
9

(2)有效性
2014-8-16
版权所有 BY 统计学课程组
10

(3)一致性 (相合性)
2014-8-16
版权所有 BY 统计学课程组
11
二、区间估计(1)


1.区间估计的含义
ˆ #q 1 在概率意义下计算参数 q 的变化范围,即 P {q ˆ = 1- a q 2
}

2014-8-16
版权所有 BY 统计学课程组
16
二、区间估计(6)--总体成数的区间估计

只讨论大样本情形
2014-8-16
版权所有 BY 统计学课程组
17
二、区间估计(7)--总体方差的区间估计
2014-8-16
版权所有 BY 统计学课程组
18
二、区间估计(8)--单侧置信区间
2014-8-16

统计推断

统计推断
(2)选取显著水平 =0.05。 (3)检验计算: 1.58 0.158 X n 100
0。
u
x

X
7.65 7.25 2.532 0.158
0.05 1.96 (4) 推断:u分布中,当 =0.05时, 。实 得 u 1.96, P 0.05 ,故可在0.05显著水平 上否定H0,接受HA,认为新育苗方法的一月 龄体长与常规方法有显著差异。
x1 x 2 u sx1 x 2
例3.某杂交黑麦从播种到开花的天数的标 准差为6.9天,现在相同试验条件下采取 两种方法取样调查,A法调查400株,得 出从播种到开花的平均天数为69.5天;B 法调查200株,得出从播种到开花的平 均天数为70.3天,试比较两种调查方法 所得黑麦从播种到开花的天数有无显著 差别。
1 2
x1 x 2
2 12 2 2
n1
n2
1 1 x1 x2 n1 n2 n1 n2 n
x x
1 2
2 12 2
n
2 n
2 12 2 2 , n1 n2 n
x x
1 2
x x u值的计算公式: 假设H0: 1 2 , u x1 x 2 x x
例1.某鱼场按常规方法所育鲢鱼苗一月龄 的平均体长为7.25cm,标准差为1.58cm, 为提高鱼苗质量,现采用一新方法进行 育苗,一月龄时随机抽取100尾进行测 量,测得其平均体长为7.65cm,试问新 育苗方法与常规方法有误显著差异?
这里 1.58 , 2 为已知,故采用u检验,又新育苗 方法的鱼苗体长可能高于常规方法,也可能低 于常规方法,故进行双侧检验(双尾检验), 检验步骤: 0 7.25cm ,即新育苗方法与 (1)假设H0: 常规方法所育鱼苗一月龄体长相同。对HA:

第05章 统计推断

第05章  统计推断

单侧检验 α=0.05或0.01 统计推断 第五章
§5.1 单个样本的统计假设检验
5.1.2 单个样本的显著性检验程序
统计假设检验的三步曲: 1、建立零假设(null hypothesis)——假设差异不显著或无关; 2、计算统计量(u-检验,t-检验,x2-检验,F-检验);
3、判断假设。 对于带备择假设的零假设:需根据备择假设的拒
F
s , df n 1, df n 1 s
下侧临界点F1-α的 值,按右式计算
解释: F< F0.05,或P>0.05,接受H0; F> F0.05,或P<0.05,拒 Fdf1,df2,α,df 1附表7中没有给出 df 2为分母自由度 为分子自由度, 1 绝H0, ② F < F 1-α
s ③HA:μ≠μ0,包括μ>μ0和μ<μ0 此时相应各备择假设的H0的拒绝域分别为:
①t > tα解释: t<t0.05,接受H0; t>t0.05,拒绝H0 ②t < -tα ③|t| > tα/2,或表示为|t| > tα(两侧)
t n 1
n
第五章 统计推断
§5.1 单个样本的统计假设检验
379.2 377.2 u 1.82 3. 3 n 9 由于u 1.82 u0.05 1.645 ,所以拒绝H0假设、接受HA。
即栽培条件的改善显著地提高了豌豆籽粒重量。
x 0
第五章 统计推断
§5.1 单个样本的统计假设检验
5.1.4 σ未知时平均数的显著性检验——t 检验(t-test) 检验的程序: (1)零假设H0:μ=μ0 备择假设:①HA:μ>μ0,若已知μ不可能小于μ0 (2)计算统计量: x 0 (3)判断统计量: ②HA:μ<μ0,若已知μ不可能大于μ0

《统计学原理》第5章:抽样推断

《统计学原理》第5章:抽样推断

σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理

第五章 统计推断-1

第五章  统计推断-1

解:
H0:μ=μ0 已知这批动物实际饲养的时间比根据以往 经验所需饲养的时间长的多,因此,μ不可 能小于μ0 (10.00g) H1:μ>μ0 ,为单侧检验
取α=0.05,查表得临界值uα=u0.05=1.645
拒绝域:u>1.645
根据样本计算统计量
x 0 10.23 10.00 u 1.82 / n 0.4 / 10
t检验-2 (t-test for pooled data) 成组设计的两样本均数比较
前提条件:从σi 未知的两个正态或近似 正态总体中,独立地抽取含量分别为n1 和n2的样本
H0:μ1=μ2 H1: 1 2 ,若已知μ1不可能小于μ2 or: 1 2 ,若已知μ1不可能大于μ2 or: 1 2 ,包括μ1>μ2和μ1<μ2
比较:u=0.57<μα ,落入拒绝域外,应在 0.05的显著性水平下接受H0 结论:第一号渔场的马面鲀体长并不显著 高于第二号渔场的
四、t检验(t-test)-1 在σ未知的情况下,单样本均数检验
前提条件:从σ未知的正态或近似正态总 体中,随机抽取含量为n的样本 H0:μ=μ0
H1:
or:
( x x
1
称为平均数差数的标准误差 2)
U检验应用举例2
问题:调查两个不同渔场的马面鲀体长, 每一渔场调查20条。
平均体长分别为 x1 19.8cm, x 2 18.5cm
已知
1 2 7.2cm
问在α=0.05水平上,第一号渔场的马面 鲀体长是否显著高于第二号渔场的马面鲀 体长?
0 ,若已知μ不可能小于μ0
0 ,若已知μ不可能大于μ0
or:
0 ,包括μ>μ0和μ<μ0

应用统计学(第五章 统计推断)

应用统计学(第五章 统计推断)
差与已知总体的方差存在显著差异
检验统计量: χ2 (n 1) s2 σ02
例题5 已知某农田受到重金属污染,抽样测定其镉含量
(μg/g)分别为:3.6、4.2、4.7、4.5、4.2、4.0、3.8、
3.7,试检验污染农田镉含量的方差与正常农田镉含量的方 差0.065是否相同。
解:假设 H0:σ 2 σ02 , H A:σ 2 σ02
P(μ-1.960 σ x ≤ x < μ+1.960 σ x)=0.95
否定区
接受区
否定区
左尾
0.025
μ-1.960σ x
0.95
0.025
0 μ+1.960σ x
右尾
临界值: ± uσ x= ± 1.960σ x
双尾检验 = 0.01
P(μ-2.576 σ x ≤ x < μ+2.576 σ x)=0.99
解: 假设: H0: μ ≤ μ0, HA : μ > μ0 确定显著水平:α=0.05 检验统计量:u x μ0 379.2 377.2 1.818 σ n 3.3 9 u0.05=1.645,计算得:u=1.818>u0.05,P<0.05
推断:否定H0,接受HA。
即:栽培条件的改善,显著提高了豌豆籽粒重量。
4)推断
接受/否定H0(HA,实际意义)
例题1 正常人血钙值服从的正态分布,平均值为2.29 mM,标准差为 0.61mM。现有8名甲状旁腺减退患者经治疗后,测得其血钙值平均为 2.01mM,试检验其血钙值是否正常。
1)提出假设 2)确定显著水平 3)计算概率 4)推断
1)提出假设
H0
零假设 /无效假设
对 /检验假设

第5章 统计推断

第5章 统计推断

第 5 章 统计推断5.1 统计推断概述统计推断就是利用样本的数据,对总体的数量特征作出具有一定可靠程度的估计和判断。

统计推断的基本内容有参数估计和假设检验两方面。

概括地来讲,参数估计是指研究一个随机变量,推断它的数量特征和变动模式。

而假设检验是检验随机变量的数量特征和变动模式是否符合我们事先所作的假设。

参数估计和假设检验的共同特点是它们对总体都不很了解,都是利用部分样本所提供的信息对总体的数量特征作出估计或判断。

所以,统计推断的过程必定伴有某种程度的不确定性,需要用概率来表示其可靠程度,这是统计推断的一个重要特点。

5.1.1 参数估计参数估计是以样本统计量作为未知总体参数的估计量,并通过对样本各单位的实际观察取得样本数据,计算样本统计量的取值,把它作为总体参数的估计量。

参数估计包括点估计和区间估计。

点估计是直接以样本统计量作为相应总体参数的估计量。

例如,用样本均值作为总体均值的点估计量,用样本方差作为总体方差的点估计量。

点估计的优点在于它能提供总体参数的的具体估计值,可以直接作为决策的数量依据。

但是,点估计事实上几乎不可能做到完全准确,更谈不上有多大的置信度。

而区间估计是估计总体参数以某种概率保证程度(置信度)落入某一区间,这样就有把握多了。

对总体被估计参数θ作区间估计,就是要给出区间的下限1ˆθ和上限2ˆθ,使被估计参数落在(1ˆθ,2ˆθ)内的概率为1α−,即 12ˆˆ()1P θθθα≤≤=− 其中,1α−就是置信度,α被称为显著性水平,如图 5-1。

ˆθ12图 5-1 区间估计在SPSS 中没有专门的参数估计命令。

参数的点估计值可以在Descriptives 命令中得到,例如用统计量mean 作为总体均值的点估计,用统计量variance 作为总体方差的点估计等。

参数的区间估计可以通过Explore 命令得到(参见4.4节的内容),也可以在各种假设检验的过程中可以得到(参见本节后面的内容)。

第五章统计推断-精品

第五章统计推断-精品
25袋食品的重量
112.5
101.0
103.0
102.0
100.5
102.6
107.5
95.0
108.8
115.6
100.0
123.5
102.0
101.6
102.2
116.6
95.4
97.8
108.6
105.0
136.8
102.8
101.5
98.4
93.3
总体均值的区间估计(例题分析)
解:已知X~N(,102),n=25, 1- = 95%,z/2=1.96。根
2.区间估计中的两个基本要求:
{ } Pqˆ1# q qˆ2 =1- a
3.Neyman原则
即在保证置信度的前提下,尽可能提高估计的精确度。
2020/8/2
版权所有 BY 统计学课程组
13
区间估计中的一些概念
2020/8/2
版权所有 BY 统计学课程组
14
当总体服从正态分布N(μ,σ2)时,(σ2已知)来自该总体
2020/8/2
版权所有 BY 统计学课程组
3
重点与难点
1.参数区间估计的统计思想 2.估计的可靠程度、平均误差及极限误差的关
系 3.临界值检验法的统计思想 4.P值的计算方法及其含义的理解 5.参数检验中的两类错误及其关系
2020/8/2
版权所有 BY 统计学课程组
4
第一节 总体参数估计
24
总体成数的区间估计 p126
2020/8/2
版权所有 BY 统计学课程组
17
区间估计基本表达 (以估计 为例):STAT
区间估计的数学表达方式:

f第五章 统计推断

f第五章 统计推断
双侧检验:在拒绝H0之后,接受HA:μ≠μ0 的检验称为双侧检验。 由专业知识确定单、双侧检验。
【例5.1-1b】
用 实 验 动 物 做 实 验 材 料 , 要 求 动 物 平 均 体 重 μ=10.00g, 若 μ<10.00g需再饲养,若μ>10.00g则应淘汰。已知总体标准差 σ=0.40g。从实验动物群体中,随机抽取含量n=10的样本, 样本平均数y=10.23g。这批动物实际饲养的时间比根据以往 经验所需饲养的时间长。问这批动物能否用于实验。
n 10
若假设成立,则得到实际样本这一事件为小概率事件。 假设不成立,拒绝零假设,接受备择假设。
在假设H0正确的情况下,计算样本实际发 生的概率P,若P>α,接受H0 ;若P<α, 拒绝H0 ,接受HA 。在实际应用时,并 不直接求出具体的概率值,而是建立在α 水平上H0的拒绝域和接受域。
拒绝域(rejection region):在上尾、或下尾、 或双侧检验中,U > uα、或U < -uα、或|U| > uα/2的区域,称为在α水平上H0的拒绝域。 接受域(acceptance region):相应的U < uα, 或U > -uα ,或-uα/2 < U < uα/2的区域,称为 在α水平上H0的接受域。 临界值(critical value):接受域的端点称为 临界值。
用实验动物做实验材料 , 要求动物平均体重 μ=10.00g,若 μ<10.00g需再饲养,若μ>10.00g则应淘汰。已知总体标准 差σ=0.40g。从实验动物群体中,随机抽取含量n=10的样本, 样本平均数y=9.77g。这批动物实际饲养时间比根据以往经 验所需饲养的时间短。问这批动物能否用于实验。

《chap5统计推断》PPT课件

《chap5统计推断》PPT课件
4
假设(hypothesis)
关于总体的某些未知或不完全知道性质的待证明 的声明(assertion)
两类
研究假设(research hypothesis)是研究人员根据以前 的研究结果、科学文献或者经验而提出的假设,
统计假设(statistical hypothesis)往往是根据研究假 设提出的,描述了根据研究假设进行试验结果的两种统 计选择
20
显著水平的选择
如果接受H0,则或者得出正确结论,或者犯概率为的第二类错误 如果结论为拒绝H0,则可能得出正确结论,也可能犯概率为 的第一类错误。 当假设检验结果为拒绝H0时,我们知道犯第一类错误的概率,因此我们进行
假设检验时,总是希望结论为拒绝H0 推荐的显著水平为0.05?为什么
21
பைடு நூலகம்第五章 假设检验
张豪 博士
1
第一节 引言
2
一、基本知识
3
统计推断(statistical inference)
统计推断 指的是根据样本和假定模型对总体做出的概率形式结论的过程
推断统计学主要包括 假设检验(hypothesis testing, test of hypothesis) 参数估计(parametric estimation)
11
计算
u发生的概率:
12
案例2:测验销售商是否是一个骗子
假设为: H0: 10 kg,HA: < 10 kg
检验统计数u = 1.8
13
案例3: 销售商不知道每袋含量到底有多少
假设为 H0: = 10 kg,HA: 10 kg
统计数u = 1.8
14
二、假设检验的基本步骤
6
假设检验

《统计学原理》第5章:抽样推断

《统计学原理》第5章:抽样推断
lim P( x X ) 1
n
抽样推断的基本原理
统计推断的理论基础—样本的概率分布
按一定方法随机抽取样本时,所有可能样本的 特征值及其所对应的概率分布情况
学生 A B C D E F G 成绩 30 40 50 60 70 80 90
按随机原则考虑顺序重复抽样抽选出4名学生。
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示.
考虑顺序的不重复抽样 考虑顺序的重复抽样
M N! (N n)!
M Nn
不考虑顺序的不重复抽样 不考虑顺序的重复抽样
M N! n!(N n)!
全及指标与样本指标
•根据全及总体中各单位的标志值或标志属性计算得 来,反映总体某种特征的指标 •根据样本总体中各单位的标志值或标志属性计算得 来的综合指标.
抽样推断的一般问题
抽样方法
•重复抽样和不重复抽样
•考虑顺序的抽样和不考虑顺序的抽样
抽样推断的一般问题
抽样方法—重复抽样
从总体N个单位中随机抽取一个容量为n的样本,每 次抽取一个单位,把结果登记后再放回到总体中,重新 参加下一次的抽取.
抽出个体
登记特征
放回总体
继续抽取
抽样推断的一般问题
抽样方法—不重复抽样
从总体N个单位中随机抽取一个容量为n的样本, 每次抽取一个单位,把结果登记后不再放回到 总体参加下一次的抽取.
抽出 个体
登记 特征
继续 抽取
抽样推断的一般问题
抽样方法—考虑顺序的抽样
从总体N个单位中抽取n个单位构成样本,不但考虑样本 各单位成分的不同,而且还要考虑样本各单位的中选顺 序.

统计推断是根据样本和假定模型对总体作出的以概率形式

统计推断是根据样本和假定模型对总体作出的以概率形式
上一张 下一张 主 页 退 出
若|t|< t0.05 ,则说明试验的表面效应属于试验误差的概率P>0.05,即表面效 应属于试验误差的可能性大,不能否定 : = ,统计学上把这一检验结果表 述为:“两个总体平均数 与 差异不显著”,在计算所得的t值的右上方标记 “ns”或不标记符号;
H 0 1 2
(n1 1) (n2 1)
n1 n2
S x1x2
上一张 下一张 主 页 退 出
所得的统计量 t服从自由度 df =(n1-1)+(n2-1)的t分布。 根据两个样本的数据,计算得: - =11-9.2=1.8;
x1 x2
S x1x2
(x1 x1 )2 (x2 x2 )2 ( 1 1 )
平均数
xi i
ቤተ መጻሕፍቲ ባይዱ
i
x1 x2 xn
x xi n ( i)/ n
上一张 下一张 主 页 退 出
说明样本平均数并非总体平均数,它还包含试验 误差的成分。
对于接受不同处理的两个样本来说,则有:
x1 1 =1 +x2 ,2 =2 +
x1 x2 (1 2 ) (1 2 )
这说明两个样本平均数之差( x1 - x2 )也包括了两
对( - )进行显著性检验就是要分析:
x x 试1验的表2面效应( - )主要由处理效应(1
要 由试验误差所造成。
- 2 )引起的 ,还 是 主
x1 x2 x1 x2
1 2
x1 x2
上一张 下一张 主 页 退 出
虽然处理效应( - )未知,但试验的表面效应是可以计算的,借助数理
统计方法可以对试验误差作出估计。所以1 ,可从2 试验的表面效应与试验误差的权衡比

第五章 统计推断

第五章 统计推断

2019/4/2
22
本章习题
3. 某种产品生产过程设计规格为每批平均生产 120 个,超过或低于这个标准都是不合理的。有10批 产品组成的样本中,每批生产的产品数量如下: 108 118 120 122 119 113 124 122 120 123。 检验样本结果能否表示该生产过程运作正常? (假定总体服从正态分布,α=0.05。)
6
1、假设检验问题
【例5.1】 在超市上出售的某种品牌方便面,按规定每
包净重少于 100 克的比例不得超过 1%。技术监督部门 从某超市的货架上任意抽取 200包该种品牌的方便面, 经检验发现有 3包(1.5%)重量少于 100克,试问:超 市出售的这种方便面是否符合质量标准?
在本例中,超市上出售的这种方便面的不合格率是未 知的,我们关心的问题是:如何根据这 200 包方便面 (样本)的不合格率 p=1.5% 来判断超市上出售的这种 品牌的方便面(总体)的不合格率 P≤1% 是否成立?
并非因为它存在逻辑的绝对错误,只是因为它存
在的可能性很小。
2019/4/2 14
6、假设检验的一般步骤
( 1 )根据所研究的问题,提出原假设 H0 和备择 假设H1;
(2)构造检验统计量;
( 3 )计算检验统计量的值和检验统计量观测值 发生的概率; (4)给定显著性水平α(即发生第一类错误的最 大允许概率),并做出统计决策。
2019/4/2
15
5.2 单样本 t 检验
单样本的 T 检验,是一个正态总体在方差未知时,总体 均值与某一已知数是否有显著性差异的假设检验;检验 统计量为(该统计量服从自由度为n-1的t分布):
t
x 0 s/ n
x 0

第五章统计推断:参数估计

第五章统计推断:参数估计
112.5 102.6 100.0 116.6 136.8 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105.0 93.3
2 2 (n 1) 0 ) 39.364 .025(24
45
【例】根据以往 的生产统计,某 种产品的合格率 约为 90% ,现要 求边际误差为 5%,在求95%的 置信区间时,应 抽取多少个产品 作为样本?
应抽取的样本容量为
n0
n0 0.05 N
n0 n n0
n0 n n0 1 N
53
2016年4月28日星期四
2016年4月28日星期四
112.5 102.6 100.0 116.6 136.8
101.0 107.5 123.5 95.4 102.8
103.0 95.0 102.0 97.8 101.5
102.0 108.8 101.6 108.6 98.4
100.5 115.6 102.2 105.0 93.3
【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中 随机抽取 16 只,测得其使用寿命 ( 小时 ) 如下。建立该批灯泡 平均使用寿命95%的置信区间
1510 1450 1480 1460
1520 1480 1490 1460
1480 1510 1530 1470
1500 1520 1510 1470
【例】一家食品生产企业以生产袋装食品为主,现从某 天生产的一批食品中随机抽取了 25袋,测得每袋重量如 下表7所示。已知产品重量的分布服从正态分布。以95% 的置信水平建立该种食品重量方差的置信区间

第五章 统计推断

第五章   统计推断

为研究电渗处理对草莓果实中钙离子含量的影响, 选用10个草莓品种来进行电渗处理与对照的对比试验, 结果如下,问电渗处理对草莓钙离子含量是否有影响?
电渗处理草莓果实钙离子含量
品种号
1
2
3
4
5
6
7
8
910电渗ຫໍສະໝຸດ 理22.2323.42
23.25
21.38
24.45
22.42
24.37
21.75
19.82
三,假设测验的基本方法 ①对所研究的总体首先提出一个无效假设 ②规定测验的显著水平α(一般α=0.05有时α=0.01) ③在承认上述无效假设正确的前提下,获得平均数的抽样分布,计 算假设正确的概率 ④根据"小概率事件实际上不可能发生"的原理接受或否定无效假 设 如小麦品种 旧品种:0=300kg/亩 σ=75kg 新品种:1=330kg/亩 y=330kg 第一步:首先提出假设: HA:1≠0 第二步:平均数的抽样分布,计算概率: = 15 ( kg ) σ y = σ / n = 75 / 25 样本容量n=25 H0:1=0=300kg
135.2
135.2
133.5
(二),成对资料平均数的假设测验
若试验设计是将性质相同 若试验设计是将性质相同的两个供试单位配成一对, 性质相同的两个供试单位配成一对 配成一对, 并设多个配对,然后对每一配对的两个供试单位分别随机 成对数据. 地给予不同处理,所得的观察值为成对数据 地给予不同处理,所得的观察值为成对数据.
1.提出假设.H0:1-2=0,即两条生产线的平均日产量无显著 差异.对HA:1-2≠0,即两条生产线上的平均日产量有显著差 异. 2.确定显著水平.α=0.01. .确定显著水平.α 0.01. 3.检验计算. y1 = 65 . 83 S 2 = 59.7299 y 2 = 59 .77 S 2 2 = 42.8747

第五章 统计推断5-2 - 新

第五章  统计推断5-2 - 新

第五章 统计推断统计推断的意义和内容统计推断是据统计数的分布和概率理论,由样本统计数推论总体参数的方法。

先根据试验目的,对试验总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的估算,做出在概率意义上应接受那种假设的推断。

由于种测验首先对总体提出假设又叫统计假设测验。

统计推断的前提条件:资料必须来自随机样本;统计数的分布规律必须已知。

&5.1 统计假设测验概述统计假设:在科学研究中,往往首先要提出一个有关某一总体参数的假设。

这种假设称为统计假设。

一、数据结构从服从正态分布N(μ0=300,σ=75)的原品种总体中,随机抽取n 个个体构成样本,则样本观察值可表示为 xi = μ0 + εi (i=1,2 ,… ,n)而从新品系总体中随机抽取的样本观察值,则为 xi = μ + εi (i=1,2 ,… ,n) (5.2) 新品系与原品种的产量差异为τ = μ - μ0 (5.3) 将(5.3)代入(5.2)得xi = μ0 + τ + εi (i=1,2 ,… ,n) (5.4) 二、统计假设测验的基本原理 对一个样本的n 个观察值xi 求平均数因x i = μ0 + τ + εi (i=1,2 ,… ,n)iix x εμμμετμ+-=-++=∴)()(0上式说明,x 与 μ0的表面差异(x - μ0)是由真实差异(μ- μ0 )和试验误差εi 构成。

小机率原理:概率很小的事件,在一次试验中是不至于发生的。

统计假设测验:是指据某种需要,对末知的或不完全清楚的总体提出一些假设,由样本实际结果经过一定的概率测验,作出接受或否定假设的推论。

三、统计假设测验的基本步骤例5.1 设某地区的当地小麦品种一般亩产300kg ,多年种植结果获得标准差为75kg 。

现有某新品种n=25,平均数330kg ,问新品种样本所属总体与当地品种这个总体是否差异显著。

第一步 统计假设H0:0μμ=第二步 计算统计量225/75300330/0=-=-=n x u σμu=2> u0.05=1.96,即对应的概率p <0.05。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章统计推断•总体与样本之间的关系-从总体到样本的研究。

-由样本推断总体:样本统计量的分布规律一般是正态分布、t 分布、χ2分布和F分布。

•对总体做统计推断的两种途径–先对所估计的总体做一假设,然后通过样本数据推断这个假设是否接受,这种途径称为统计假设检验(statistical test of hypothesis)–通过样本统计量估计总体参数,称为总体参数估计(estimation of population parameter)•本章重点讲解统计推断的一般原理以及对总体平均数及标准差的推断。

一、假设检验假设检验就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种被此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。

如果抽样结果使小概率发生,则拒绝假设,如抽样结果没有使小概率发生,则接受假设。

小概率原理在一次试验中,某事件几乎是不会发生的,若根据一定的假设条件计算出来的该事件发生的概率很小,而在一次试验中它竟然发生了,则可认为原假设条件不正确,给予否定。

在生物统计的显著性检验中,通常取5%或1%小概率为显著性水平,记为“α”例5.1 根据以往的经验,用一般疗法治疗某种疾病,其死亡率为40%,治愈率为60%。

今用一种新药治疗染上该病的6名患者,这6人均治愈了,问该新药是否显著优于一般疗法?小概率原理用于显著性检验例5.2用实验动物作实验材料,现从一批动物(σ= 0.4)中抽取含量n = 10的样本并已经计算出平均值为10.23 g。

已知这批动物饲养时间较长,不可能小于10g,问此批动物材料是否是抽自于μ=10的总体中?解:1 样本平均数满足何种分布?2 从正态分布表查出P = 0.03438< 0.05,这是一个小概率事件,该样本几乎不可能抽自μ = 10.00 g的总体。

单侧检测(one-sided test)•上尾检验(upper tailed test):拒绝H0后,接受μ > μ0,如下左图。

•下尾检验(lower tailed test):拒绝H0后,接受μ < μ0 ,如下右图。

•双侧检验(two-sided test):拒绝H0后,接受μ≠μ0,如下图。

•由于单侧检验时利用了已知有一侧是不可能的这一条件,从而提高了它的辨别力,所以单侧检验比双侧检验的辨别力更强些。

•实际应用时,要尽量选用单侧检验,但要根据实际情况而定。

二、假设检验中的两类错误是真实的,却否定了它,又叫弃真错误。

1. Type Ⅰ error (α错误),如果H是错误的,却接受了它,又叫纳伪错误。

2. Type Ⅱ error (β类错误),如果H例5.3 用实验动物作实验材料,现从一批动物( = 0.4)中抽取含量n = 10的样本并已经计算出平均值为10.20 g。

已知这批动物饲养时间较长,不可能小于10g,问此批动物材料是否是抽自于μ=10的总体中?方法1方法2图 5-2 两种类型的错误样本抽自HA:u=10.3 g,但却错误的接受H0:u=10.0 g的概率为0.2327。

关于两种类型错误的三点解释•当μ1越接近于μ0时,犯Ⅱ型错误的概率愈大;当μ1越远离μ0时,犯Ⅱ型错误的概率愈小。

•在样本含量和样本平均数都固定时,为了降低犯Ⅰ型错误的概率α(就应将图5-2中的竖线右移),必然增加犯Ⅱ型错误的概率。

•为了同时降低α和β就需增加样本含量。

三、假设检验的步骤●对样本所属总体提出假设,无效假设记作H0,备择假设,记作H A。

●确定显著水平在进行无效假设和备则假设之后,要确定一个否定H0的概率标准,这个标准叫显著水平或概率水平。

●在H0正确的前提下,根据抽样分布的统计数,进行假设检验的概率计算。

●根据显著水平α的统计数(如u值)的临界值,进行差异是否显著的推断。

四、均值检验5.1 单个样本的统计假设检验5.1.1 σ已知单个平均数显著性检验:u检验例5.5 母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为116、115、113、 112、114、117、 115、 116、 114、 113(天),试检验所得样本的平均数与总体平均数114天有无显著差异?根据题意,本例应进行双侧t检验。

1、提出无效假设与备择假设2、计算u值3、建立H0的拒绝域:因HA:μ> μ0,故为上尾单侧检验,当μ> μ0.05时拒绝H0,α=0.05的上侧分位数μ0.05=1.645。

4、结论:因为μ> μ0.05所以拒绝H0,接受HA.上述样本很可能不是抽自N (377.2,3.32)的总体,抽出样本的那个总体的平均数是大于377.2的某个值,即栽培条件的改善显著提高了豌豆籽粒重量。

5.1.2 σ未知时平均数显著性检验:t检验例5.5 母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为116、115、113、 112、114、117、 115、 116、 114、 113(天),试检验所得样本的平均数与总体平均数114天有无显著差异?根据题意,本例应进行双侧t检验。

1、提出无效假设与备择假设2、计算t值3、查临界t值,作出统计推断由df=9,查t值表(附表3)得t0.05(9)=2.262,因为|t|<t0.05,P>0.05,故不能否定H0:μ= 114,表明样本平均数与总体平均数差异不显著,可以认为该样本取自母猪怀孕期为114天的总体。

5.1.3 变异性的显著性检验:χ2检验例5.6 一个混杂的小麦品种,株高标准差σ0=14cm,经提纯后随机抽取10株,它们的株高为:90, 105, 101, 95, 100, 100, 101, 105, 93, 97, 考察提纯后的群体是否比原群体整齐?1、小麦株高是服从正态分布的随机变量2、提出假设关于备择假设的说明:小麦经提纯后只能变得更整齐,绝不会更离散,即σ只能小于σ0,因此HA:σ< σ0。

3、显著性水平规定α=0.054、统计量的值:5、建立的拒绝域:因H A:σ < σ0,故为下尾单侧检验,当χ2<χ21-α时拒绝H0,从附表6中可以查出χ29,0.99 = 2.09,拒绝H0,接受H A,提纯后株高比原株高整齐。

6、结论,因χ2<χ29,0.99EX5.1某鱼场按常规方法所育鲢鱼苗一月龄的平均体长为7.25 cm,标准差为1.58cm,为提高鱼苗质量,现采用一新方法进行育苗,一月龄时随机抽取100尾进行测量,测得其平均体长为7.65cm,试问新育苗方法与常规方法有无显著差异?解题过程EX5.2某鱼塘水中的含氧量,多年平均为4.5mg·L-1,现在该鱼塘设10个点采集水样,测定水中含氧量分别为:4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48.4.26 mg·L-1,试检验该次抽样测定的水中含氧量与多年平均值有无显著差别。

解题过程小结5.2 两个样本的显著性差异检验•单个样本的显著性检验需要事先能够提出合理的参数假设值和对参数有某种意义的备择值。

然而,实际工作中很难提出,故限制了实际应用。

•在实际应用时,常常选用两个样本,一个作为处理,一个作为对照,在这两个样本之间作比较,判定它们之间的差异是否用偶然性解释,若不能用偶然性解释时,则认为它们之间存在足够显著的差异,从而判断这两个样本来自两个不同的总体。

5.2.1 两个方差的检验(方差齐性分析)—F检验1 假定从两个正态总体中,独立地抽取含量分别为n1和n2的两个随机样本,计算出s12和s22.总体平均数可以相等也可以不等.2 零假设H0:σ1= σ2.备择假设HA: σ1 >σ2 若已知σ1不可能小于σ2 。

HA: σ1 <σ2 若已知σ1不可能大于σ2 。

HA: σ1 ≠σ2 包括σ1 >σ2和σ1 <σ2 。

3 显著性水平:经常用α=0.05和α=0.01两个水平。

4 统计检验量:F df1,df2=s12/s22, df1=n1-1 df2=n2-1 。

5 建立H0的拒绝域:σ1>σ2,上尾单侧检验,F >Fα时拒绝σ1 <σ2,下尾单侧检验,F < F1-α时拒绝σ1≠σ2,,双侧检验, F >Fα/2及F < F1-α/2时拒绝。

6 作出结论并解释。

例5.7 测定了20位青年男子和20位老年男子的血压值(收缩压mmHg)如下表所示。

问老年人血压值个体间的波动是否显著高于青年人?解:根据检验的基本程序:(1)人类血压值是服从正态分布的随机变量,而且上述两样本是独立获得的。

(2)假设:H:σ1=σ2HA:σ1<σ2(由于老年人的血压值波动只会大于青年人,单侧)(3)显著性水平:根据问题的要求(是否显著),选α=0.05。

(4)统计量的值:Fdf1,df2=S12/s22,根据表中数据计算可得S12=193.4,s22=937.7,故F=0.206。

(5)建立H0的拒绝域:由于HA :σ1<σ2,故为下尾单侧检验,当F<F0.95时拒绝H。

查表可得F19,19,0.95=1/ F19,19,0.05=0.459(6)结论:F<F0.95,所以结论是拒绝H,接受HA。

即老年人的血压值在个体间的波动高于青年人。

5.2.2 标准差(σi)已知时,两个平均数间差异显著性的检验—u检验例5.8 调查两个不同渔场的马面鲀体长,每一渔场调查200条。

平均体长分别为19.8cm和18.5cm。

σ1=σ2=7.2cm。

问在α=0.05水平上,第一渔场的马面鲀体长是否显著高于第二渔场的?解:(1)假设:H0:μ1=μ2, HA:μ1>μ2(2)确定显著性水平:α=0.05。

(3)计算统计量。

(4)建立H0的拒绝域:因HA:μ1>μ2,故为上尾单侧检验。

当u>u0.05时拒绝H0,由附表查出u0.05=1.645。

5.2.3 标准差(σi)未知,但相等时,两个平均数间差异显著性的检验—成组数据t检验检验程序与5.2.2基本相同,只是所使用的统计量不同,当两个总体的标准差相等时,检验统计量t由下式给出:•在H0:μ1=μ2下变为在平均数检验中应用最为广泛。

先做方差齐性检验(F-双侧检验)判断σi 是否相等;按上式计算统计量t,进行t检验以判断两个平均数之间差异是否显著。

例 5.9 研究两种激素类药物对肾组织切片的氧消耗的影响,结果是:研究第一种药物的样本数为9,平均数为27.92,样本方差为8.673。

研究第二种药物的样本数为6,平均数为25.11,样本方差为1.843。

问两种药物对肾组织切片氧消耗的影响差异是否显著?解:第一步,做方差齐性检验:H0:σ1=σ2,HA:σ1≠σ2,α=0.05F8,5=8.673/1.843=4.71,F8,5,0.025=6.757F8,5,0.975=1/4.817=0.208, F8,5,0.975<F<F0.025,结论是接受H0(σ1=σ2)第二步,做平均数之间差异的显著性检验:H0:μ1=μ2, HA:μ1≠μ2,α=0.05;计算统计量t=2.168。

相关文档
最新文档