第五章 统计推断(1)

合集下载

生物统计学教案(5)

生物统计学教案(5)

生物统计学教案第五章统计推断教学时间:5学时教学方法:课堂板书讲授教学目的:重点掌握两个样本的差异显著性检验,掌握一个样本的差异显著性检验,了解二项分布的显著性检验。

讲授难点:一个、两个样本的差异显著性检验统计假设检验:首先对总体参数提出一个假设,通过样本数据推断这个假设是否可以接受,如果可以接受,样本很可能抽自这个总体,否则拒绝该假设,样本抽自另外总体。

参数估计:通过样本统计量估计总体参数。

5.1 单个样本的统计假设检验5.1.1 一般原理及两种类型的错误例:已知动物体重服从正态分布N(μ,σ2),实验要求动物体重μ=10.00g。

已知总体标准差σ=0.40g,总体平均数μ未知,为了得出对总体平均数μ的推断,以便决定是否接受这批动物,随机抽取含量为n的样本,通过样本平均数,推断μ。

1、假设:H0: μ=μ0或H0: μ-μ0=0H A: μ>μ0 μ<μ0 μ≠μ0三种情况中的一种。

本例的μ0=10.00g,因此H0: μ=10.00H A: μ>10.00或μ<10.00或μ≠10.002、小概率原理小概率的事件,在一次试验中几乎是不会发生的,若根据一定的假设条件计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而拒绝假设。

从动物群体中抽出含量为n的样本,计算样本平均数,假设该样本是从N(10.00,0.402)中抽取的,标准化的样本平均数服从N (0,1)分布,可以从正态分布表中查出样本抽自平均数为μ的总体的概率,即P (U >u ), P (U <-u ), 以及P (|U |>u )的概率。

如果得到的值很小,则x 抽自平均数为μ0的总体的事件是一个小概率事件,它在一次试验中几乎是不会发生的,但实际上它发生了,说明假设的条件不正确,从而拒绝零假设,接受备择假设。

显著性检验:根据小概率原理建立起来的检验方法。

第05章 统计推断

第05章  统计推断

单侧检验 α=0.05或0.01 统计推断 第五章
§5.1 单个样本的统计假设检验
5.1.2 单个样本的显著性检验程序
统计假设检验的三步曲: 1、建立零假设(null hypothesis)——假设差异不显著或无关; 2、计算统计量(u-检验,t-检验,x2-检验,F-检验);
3、判断假设。 对于带备择假设的零假设:需根据备择假设的拒
F
s , df n 1, df n 1 s
下侧临界点F1-α的 值,按右式计算
解释: F< F0.05,或P>0.05,接受H0; F> F0.05,或P<0.05,拒 Fdf1,df2,α,df 1附表7中没有给出 df 2为分母自由度 为分子自由度, 1 绝H0, ② F < F 1-α
s ③HA:μ≠μ0,包括μ>μ0和μ<μ0 此时相应各备择假设的H0的拒绝域分别为:
①t > tα解释: t<t0.05,接受H0; t>t0.05,拒绝H0 ②t < -tα ③|t| > tα/2,或表示为|t| > tα(两侧)
t n 1
n
第五章 统计推断
§5.1 单个样本的统计假设检验
379.2 377.2 u 1.82 3. 3 n 9 由于u 1.82 u0.05 1.645 ,所以拒绝H0假设、接受HA。
即栽培条件的改善显著地提高了豌豆籽粒重量。
x 0
第五章 统计推断
§5.1 单个样本的统计假设检验
5.1.4 σ未知时平均数的显著性检验——t 检验(t-test) 检验的程序: (1)零假设H0:μ=μ0 备择假设:①HA:μ>μ0,若已知μ不可能小于μ0 (2)计算统计量: x 0 (3)判断统计量: ②HA:μ<μ0,若已知μ不可能大于μ0

《统计学原理》第5章:抽样推断

《统计学原理》第5章:抽样推断

σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理

计数资料的统计描述与统计推断

计数资料的统计描述与统计推断

2 nnARn2C 1
(一) 多个样本率的比较:
表3.8 三种药物治疗高血压的疗效
处理
有效
无效
合计
有效率%
复方哌唑嗪 35
5
40
87.50
复方降压片 20
10
30
66.67
安慰剂
7
25
32
21.88
合计
62
40
102
60.78
38
H0:三种处理方法的有效率相等, 即π1= π2= π3 H1:三种处理方法的有效率不等或不全相等
某类死因构某 成同 年 比年 某死 类亡 死总 因人 死 1数 亡 0% 0人数
8
(二)疾病统计指标
某 病 发病 一率 定 该时 期期 间内 新可 病 发能 的 生 例发 平 的 数生 均 某 某 人 K病
某病患病率 某该时时点点某受病检现人患口病 K数例数


病死同 因率期 某某 病
死亡人数 病病 10人 % 0 数
29
31
(三)四格表χ2检验的专用公式
2
(ad b)c2n
(ab)c(d)a (c)b (d)
两组人群尿棕色素阳性率比较
组别
阳性数
阴性数
合计
铅中毒病人 对照组
29(a) 9(c)
7(b) 28(d)
36(a+b) 37(c+d)
合计
38(a+c)
35(b+d)
73(n)
阳性率(%) 80.56 24.32 52.05
712 142 185
61
1100
4
0.6
9
6.3

应用统计学(第五章 统计推断)

应用统计学(第五章 统计推断)
差与已知总体的方差存在显著差异
检验统计量: χ2 (n 1) s2 σ02
例题5 已知某农田受到重金属污染,抽样测定其镉含量
(μg/g)分别为:3.6、4.2、4.7、4.5、4.2、4.0、3.8、
3.7,试检验污染农田镉含量的方差与正常农田镉含量的方 差0.065是否相同。
解:假设 H0:σ 2 σ02 , H A:σ 2 σ02
P(μ-1.960 σ x ≤ x < μ+1.960 σ x)=0.95
否定区
接受区
否定区
左尾
0.025
μ-1.960σ x
0.95
0.025
0 μ+1.960σ x
右尾
临界值: ± uσ x= ± 1.960σ x
双尾检验 = 0.01
P(μ-2.576 σ x ≤ x < μ+2.576 σ x)=0.99
解: 假设: H0: μ ≤ μ0, HA : μ > μ0 确定显著水平:α=0.05 检验统计量:u x μ0 379.2 377.2 1.818 σ n 3.3 9 u0.05=1.645,计算得:u=1.818>u0.05,P<0.05
推断:否定H0,接受HA。
即:栽培条件的改善,显著提高了豌豆籽粒重量。
4)推断
接受/否定H0(HA,实际意义)
例题1 正常人血钙值服从的正态分布,平均值为2.29 mM,标准差为 0.61mM。现有8名甲状旁腺减退患者经治疗后,测得其血钙值平均为 2.01mM,试检验其血钙值是否正常。
1)提出假设 2)确定显著水平 3)计算概率 4)推断
1)提出假设
H0
零假设 /无效假设
对 /检验假设

统计学第五章课后题及答案解析

统计学第五章课后题及答案解析

第五章一、单项选择题1.抽样推断的目的在于( )A.对样本进行全面调查 B.了解样本的基本情况C.了解总体的基本情况 D.推断总体指标2.在重复抽样条件下纯随机抽样的平均误差取决于( )A.样本单位数 B.总体方差C.抽样比例 D.样本单位数和总体方差3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差( )A.一年级较大 B.二年级较大C.误差相同 D.无法判断4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将( )A.高估误差 B.低估误差C.恰好相等 D.高估或低估5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本容量( )A.扩大到原来的2倍 B.扩大到原来的4倍C.缩小到原来的1/4 D.缩小到原来的1/26.当总体单位不很多且差异较小时宜采用( )A.整群抽样 B.纯随机抽样C.分层抽样 D.等距抽样7.在分层抽样中影响抽样平均误差的方差是()A.层间方差 B.层内方差C.总方差 D.允许误差二、多项选择题1.抽样推断的特点有()A.建立在随机抽样原则基础上 B.深入研究复杂的专门问题C.用样本指标来推断总体指标 D.抽样误差可以事先计算E.抽样误差可以事先控制2.影响抽样误差的因素有( )A.样本容量的大小 B.是有限总体还是无限总体C.总体单位的标志变动度 D.抽样方法E.抽样组织方式3.抽样方法根据取样的方式不同分为( )A.重复抽样 B.等距抽样 C.整群抽样D.分层抽样 E.不重复抽样4.抽样推断的优良标准是( )A.无偏性 B.同质性 C.一致性D.随机性 E.有效性5.影响必要样本容量的主要因素有( )A.总体方差的大小 B.抽样方法C.抽样组织方式 D.允许误差范围大小E.要求的概率保证程度6.参数估计的三项基本要素有()A.估计值 B.极限误差C.估计的优良标准 D.概率保证程度E.显著性水平7.分层抽样中分层的原则是( )A.尽量缩小层内方差 B.尽量扩大层内方差C.层量扩大层间方差 D.尽量缩小层间方差E.便于样本单位的抽取三、填空题1.抽样推断和全面调查结合运用,既实现了调查资料的_______性,又保证于调查资料的_______性。

第五章统计推断的理论基础

第五章统计推断的理论基础

(三)F分布
• F分布是由两个卡方分布构造而成的一个新 的分布。若随机变量,F=S12/S22,则F函数 的分布规律称为 F(n1,n2) 分布,其中参数 n1、n2是两个自由度,任意一个自由度不同 就是另一个F分布。
• F分布在一象限内,呈正偏态,随着两个自 由度的增大,趋近于正态分布。
F分布图
• 概率分布就是描述随机变量统计规律的重要工具。
一个赌博实例
• 口袋中有8黑8白共16个玻璃球,从中 随机抽取8个玻璃球,如果刚好抽到4 黑4白,庄家赢,其他任何情况,庄家 都会不同程度的输。
经过计算,找规律
X
w8
w7b w6b2 w5b3 w4b4 w3b5 w2b6 wb7
b8
P(X) 1/12870 0.5% 6%
T分布图
T分布概率表(附表2)
• 查T分布概率表时,按自由度及相应的概率 去找到对应的 t 值。例如T0.05(8)的查表方 法就是,在第一列找到自由度8这一行,在 第一行中找到概率0.05这一列,行列的交 叉处即是2.306。
(二)卡方(χ2)分布
1. 若n个相互独立的随机变量ξ1,ξ2,…, ξn ,均服从标准正态分布,则这n个服从 标准正态分布的随机变量的平方和∑ξ2i构 成一新的随机变量,其分布规律称为χ2(n) 分布,其中参数 n 称为自由度,自由度不 同就是另一个χ2分布。
区间
例题2
• 已知一项考试的成绩服从平均数82,标准差为8的正态分布, 问成绩落在80~90分之间考生占多大比例?
• 解:此题实质上求成绩落在80分和90分之间的概率。必须
先把原始分转化成标准分:Z1=-0.25, Z2=1

通过画示意图,可以发现我们所求的是两块可查表面

05第五章 抽样推断

05第五章 抽样推断

置信水平
(confidence level)
1.
2.
将构造置信区间的步骤重复很多次,置信区间 包含总体参数真值的次数所占的比例,也称置 信度 表示为 (1 - 为是总体参数未在区间内的比例
3.
常用的置信水平值有 99%, 95%, 90% 相应的 为0.01,0.05,0.10
总体参数估计就是以样本统计量来估 计总体参数。 参数估计要求:
1. 精确性—适当的极限误差范围;
2. 可靠性—估计结果正确的概率。
参数估计—点估计和区间估计。
2014-3-30 第五章 抽样推断 20
2.2 点估计(point estimate)
点估计就是根据总体参数与样本统计 量之间的内在联系,直接以样本统计量 作为相应总体参数的估计值,点估计又 称为定值估计。 常用的点估计量有:
第五章
抽样推断
第一节 抽样推断及其特点
第二节 总体参数估计 第三节 假设检验概述
统计名言
不象其他科学,统计从来不打算使自 己完美无缺,统计意味着你永远不需 要确定无疑
—— Gudmund R.Iversen
参数估计在统计方法中的地位
统计方法
描述统计 推断统计
参数估计
2014-3-30 第五章 抽样推断
ˆ x X
2014-3-30
2 ( x x )
ˆp ˆ 2 S2 P
n1

21
第五章 抽样推断
估计量与估计值
(estimator & estimated value)
1. 2.
3. 4.
参数估计 (parameter estimation) 就是用样本统计量去估 计总体的参数 估计量:用于估计总体参数的统计量的名称 如样本均值,样本比例,样本方差等 例如: 样本均值就是总体均值 的一个估计量 参数用 表示,估计量用 表示 ˆ 估计值:估计参数时计算出来的统计量的具体值 如果样本均值 x =80,则80就是 的估计值

f第五章 统计推断

f第五章 统计推断
双侧检验:在拒绝H0之后,接受HA:μ≠μ0 的检验称为双侧检验。 由专业知识确定单、双侧检验。
【例5.1-1b】
用 实 验 动 物 做 实 验 材 料 , 要 求 动 物 平 均 体 重 μ=10.00g, 若 μ<10.00g需再饲养,若μ>10.00g则应淘汰。已知总体标准差 σ=0.40g。从实验动物群体中,随机抽取含量n=10的样本, 样本平均数y=10.23g。这批动物实际饲养的时间比根据以往 经验所需饲养的时间长。问这批动物能否用于实验。
n 10
若假设成立,则得到实际样本这一事件为小概率事件。 假设不成立,拒绝零假设,接受备择假设。
在假设H0正确的情况下,计算样本实际发 生的概率P,若P>α,接受H0 ;若P<α, 拒绝H0 ,接受HA 。在实际应用时,并 不直接求出具体的概率值,而是建立在α 水平上H0的拒绝域和接受域。
拒绝域(rejection region):在上尾、或下尾、 或双侧检验中,U > uα、或U < -uα、或|U| > uα/2的区域,称为在α水平上H0的拒绝域。 接受域(acceptance region):相应的U < uα, 或U > -uα ,或-uα/2 < U < uα/2的区域,称为 在α水平上H0的接受域。 临界值(critical value):接受域的端点称为 临界值。
用实验动物做实验材料 , 要求动物平均体重 μ=10.00g,若 μ<10.00g需再饲养,若μ>10.00g则应淘汰。已知总体标准 差σ=0.40g。从实验动物群体中,随机抽取含量n=10的样本, 样本平均数y=9.77g。这批动物实际饲养时间比根据以往经 验所需饲养的时间短。问这批动物能否用于实验。

统计推断原理

统计推断原理

统计推断原理统计推断是指根据样本数据对总体特征进行推断的一种统计方法。

它是基于概率理论和数理统计学的基本原理,通过对样本数据的分析和推断,来对总体的特征进行估计和推断。

统计推断在科学研究、社会调查、经济预测等领域都有着广泛的应用,是一种非常重要的统计方法。

统计推断的原理可以分为参数估计和假设检验两个方面。

参数估计是指根据样本数据对总体参数进行估计,常见的参数包括总体均值、总体方差等。

而假设检验则是根据样本数据对总体特征进行检验,判断某种假设是否成立。

在进行参数估计和假设检验时,我们通常会使用一些统计量来进行推断,如样本均值、标准差、t 值、F值等。

统计推断的原理主要包括抽样理论、估计理论和假设检验理论。

抽样理论是统计推断的基础,它研究如何从总体中抽取样本,并对样本数据进行分析和推断。

估计理论则是研究如何根据样本数据对总体参数进行估计,包括点估计和区间估计两种方法。

假设检验理论则是研究如何根据样本数据对总体特征进行检验,判断某种假设是否成立。

在统计推断中,我们通常会使用一些统计分布来进行推断,如正态分布、t分布、F分布等。

这些统计分布在进行参数估计和假设检验时起着非常重要的作用,它们可以帮助我们进行推断,并且在一定条件下具有一定的稳定性和可靠性。

统计推断的原理在实际应用中有着广泛的应用。

在医学研究中,我们可以通过对样本数据的分析和推断,来对某种药物的疗效进行评估;在市场调查中,我们可以通过对样本数据的分析和推断,来对市场需求进行预测;在质量控制中,我们可以通过对样本数据的分析和推断,来对产品质量进行检验。

统计推断的原理为我们提供了一种科学的方法,来对未知总体特征进行推断,它具有着重要的理论和实际意义。

总之,统计推断的原理是一种基于概率理论和数理统计学的推断方法,它通过对样本数据的分析和推断,来对总体特征进行估计和推断。

统计推断的原理包括参数估计和假设检验两个方面,它在实际应用中有着广泛的应用,为我们提供了一种科学的方法,来对未知总体特征进行推断。

第五章 T检验

第五章 T检验
i
=44 ±1.1
42.9<μ<45.1
2) 从总体上看,男女年龄是否有差异? 解:比较男女平均年龄的总体参数的区间, μ男
(43.8,46.1)
μ女
(42.9,45.1)
二者有交集,故总体年龄在95%的置信度上 没有差异。
3 比例数的参数估计:
当样本的统计量不是平均数,而是以比例的形式出
现时,比如,共青团员在调查中占9.4%,也可以用
x m Z s n
i
来直接计算出|Zxi|是否大于Z95%。
解:1) 确定有关总体参数的假设
H0 : m =800; H1 : m 800;
2) 确定检验此假设的概率标准: 置信度为95%,显著度为5%,即Z=1.96 3)计算Zxi
xi 790 800 z xi 2 S .E 5
5.2 MEANS 过程
• 功能:分组计算、比较指定变量的描述统计量。包括均值、标准差、
总和、观测数、方差等等,还可以给出方差分析表和线性检ompare Means->Means

Dependent List:因变量(分析变量,一般为定距或定序变量)
Independent List:自变量(分组变量,为分类变量,注意可分层)
4)判定:Zxi=-2,绝对值大于Z95%,因此在5%
的显著水平上否定原假设m =800。
接受区95%
样本2:X2= 790;S=10 样本1:X1=795; 假设 m =800 S=10
拒绝区5%
m!1.96S. E
5.均值比较与T检验
• 5.1 均值比较与均值比较的检验过程 • 5.2 MEANS 过程 • 5.3 单一样本的T检验 • 5.4 独立样本的T检验 • 5.5 配对样本T检验

《统计学原理》第5章:抽样推断

《统计学原理》第5章:抽样推断
lim P( x X ) 1
n
抽样推断的基本原理
统计推断的理论基础—样本的概率分布
按一定方法随机抽取样本时,所有可能样本的 特征值及其所对应的概率分布情况
学生 A B C D E F G 成绩 30 40 50 60 70 80 90
按随机原则考虑顺序重复抽样抽选出4名学生。
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示.
考虑顺序的不重复抽样 考虑顺序的重复抽样
M N! (N n)!
M Nn
不考虑顺序的不重复抽样 不考虑顺序的重复抽样
M N! n!(N n)!
全及指标与样本指标
•根据全及总体中各单位的标志值或标志属性计算得 来,反映总体某种特征的指标 •根据样本总体中各单位的标志值或标志属性计算得 来的综合指标.
抽样推断的一般问题
抽样方法
•重复抽样和不重复抽样
•考虑顺序的抽样和不考虑顺序的抽样
抽样推断的一般问题
抽样方法—重复抽样
从总体N个单位中随机抽取一个容量为n的样本,每 次抽取一个单位,把结果登记后再放回到总体中,重新 参加下一次的抽取.
抽出个体
登记特征
放回总体
继续抽取
抽样推断的一般问题
抽样方法—不重复抽样
从总体N个单位中随机抽取一个容量为n的样本, 每次抽取一个单位,把结果登记后不再放回到 总体参加下一次的抽取.
抽出 个体
登记 特征
继续 抽取
抽样推断的一般问题
抽样方法—考虑顺序的抽样
从总体N个单位中抽取n个单位构成样本,不但考虑样本 各单位成分的不同,而且还要考虑样本各单位的中选顺 序.

统计推断——精选推荐

统计推断——精选推荐

统计推断第五章统计推断所谓统计推断就是根据抽样分布率和概率理论,由样本结果(统计数)来推断总体特征(参数)。

试验实践中所获得的资料,通常都是样本的结果;⽽我们希望了解的却是抽得样本的总体。

统计推断:统计假设测验参数估计统计假设测验是根据某种实际需要对未知的或不完全知道的统计总体提出⼀些假设,然后由样本的实际结果,经过⼀定的计算,做出在概率意义上应当接受哪种假设的测验。

例如在相同的栽培管理条件下种植了甲、⼄两个⽟⽶品种各15个⼩区,如果测得甲品种平均亩产为1x =650 kg ,⼄品种平均亩产为2x =670 kg ,亩产相差20 kg ,这究竟是由于甲品种的总体平均数µ1的确不同于⼄品种的总体平均数µ2呢?还是由于随机抽样误差(µ1和µ2并⽆不同)?这不能通过简单的⽐较来下结论,必须通过概率计算做出选择,这就是统计假设测验要研究的问题。

参数估计是指由样本统计数对总体参数做出点估计和区间估计。

点估计是指由样本统计数估计相应参数。

区间估计是指以⼀定的概率保证总体参数位于某两个数值之间。

第⼀节统计假设测验的基本原理⼀、统计假设测验的基本⽅法就是试验⼯作者提出有关某⼀总体参数的假设。

例如假设某批产品符合标准。

但是如何确切地证实假设是正确的还是错误的呢?当然可以把全部产品逐个检验,这种研究总体中全部个体的⽅法当然是很准确的,但往往是⾏不通的。

我们不得不采⽤另⼀种⽅法,即研究样本。

也就是从全部产品中抽取样本进⾏检验,然后推断这批产品是否合格。

这种利⽤样本以测验假设是否正确或错误的过程,称为⼀个假设正确性(或不正确性)的统计证明。

如果通过测验证明假设与试验结果相符,则该假设就被接受;反之,如果假设与试验结果不相符,则该假设就被否定。

对统计总体⼀般作两个假设,⼀个是假设总体参数与某⼀指定值相等或假设两个总体参数相等,即假设其没有效应,这⼀假设称为⽆效假设,记作H 0;和⽆效假设相对应的另⼀统计假设,叫对应假设或备择假设,记作H A 。

第五章 统计推断

第五章 统计推断

2019/4/2
22
本章习题
3. 某种产品生产过程设计规格为每批平均生产 120 个,超过或低于这个标准都是不合理的。有10批 产品组成的样本中,每批生产的产品数量如下: 108 118 120 122 119 113 124 122 120 123。 检验样本结果能否表示该生产过程运作正常? (假定总体服从正态分布,α=0.05。)
6
1、假设检验问题
【例5.1】 在超市上出售的某种品牌方便面,按规定每
包净重少于 100 克的比例不得超过 1%。技术监督部门 从某超市的货架上任意抽取 200包该种品牌的方便面, 经检验发现有 3包(1.5%)重量少于 100克,试问:超 市出售的这种方便面是否符合质量标准?
在本例中,超市上出售的这种方便面的不合格率是未 知的,我们关心的问题是:如何根据这 200 包方便面 (样本)的不合格率 p=1.5% 来判断超市上出售的这种 品牌的方便面(总体)的不合格率 P≤1% 是否成立?
并非因为它存在逻辑的绝对错误,只是因为它存
在的可能性很小。
2019/4/2 14
6、假设检验的一般步骤
( 1 )根据所研究的问题,提出原假设 H0 和备择 假设H1;
(2)构造检验统计量;
( 3 )计算检验统计量的值和检验统计量观测值 发生的概率; (4)给定显著性水平α(即发生第一类错误的最 大允许概率),并做出统计决策。
2019/4/2
15
5.2 单样本 t 检验
单样本的 T 检验,是一个正态总体在方差未知时,总体 均值与某一已知数是否有显著性差异的假设检验;检验 统计量为(该统计量服从自由度为n-1的t分布):
t
x 0 s/ n
x 0

第五章 统计推断

第五章   统计推断

为研究电渗处理对草莓果实中钙离子含量的影响, 选用10个草莓品种来进行电渗处理与对照的对比试验, 结果如下,问电渗处理对草莓钙离子含量是否有影响?
电渗处理草莓果实钙离子含量
品种号
1
2
3
4
5
6
7
8
910电渗ຫໍສະໝຸດ 理22.2323.42
23.25
21.38
24.45
22.42
24.37
21.75
19.82
三,假设测验的基本方法 ①对所研究的总体首先提出一个无效假设 ②规定测验的显著水平α(一般α=0.05有时α=0.01) ③在承认上述无效假设正确的前提下,获得平均数的抽样分布,计 算假设正确的概率 ④根据"小概率事件实际上不可能发生"的原理接受或否定无效假 设 如小麦品种 旧品种:0=300kg/亩 σ=75kg 新品种:1=330kg/亩 y=330kg 第一步:首先提出假设: HA:1≠0 第二步:平均数的抽样分布,计算概率: = 15 ( kg ) σ y = σ / n = 75 / 25 样本容量n=25 H0:1=0=300kg
135.2
135.2
133.5
(二),成对资料平均数的假设测验
若试验设计是将性质相同 若试验设计是将性质相同的两个供试单位配成一对, 性质相同的两个供试单位配成一对 配成一对, 并设多个配对,然后对每一配对的两个供试单位分别随机 成对数据. 地给予不同处理,所得的观察值为成对数据 地给予不同处理,所得的观察值为成对数据.
1.提出假设.H0:1-2=0,即两条生产线的平均日产量无显著 差异.对HA:1-2≠0,即两条生产线上的平均日产量有显著差 异. 2.确定显著水平.α=0.01. .确定显著水平.α 0.01. 3.检验计算. y1 = 65 . 83 S 2 = 59.7299 y 2 = 59 .77 S 2 2 = 42.8747

统计推断

统计推断

平均身高:X=173cm 标准差: S=3cm
统计学的目标:利用样本信息推断总体的性质
3
样本统计量

有以下常用的样本统计量 衡量中心位置的: 衡量离散程度的: 偏差 平方和 均方差(方差) 标准差
自由度df指的是独立偏差 的个数。
4
对总体参数进行估计

样本统计量的目的是对总体参数进行估计,存在 以下两类估计方法: 点估计
发电机A和B产出的样本统计量 样本量 平均值 标准差 A 10 84.24 2.90 B 10 85.54 3.65 两组数据平均值的差异δ=1.30

A和B之间样本平均值的差异δ =1.30是显著的差 异还是仅仅是偶然的差异?
假设检验可以回答这个问题
23
假设检验的思想
顾名思义,假设检验先对某个主张进行假设,然后 寻找答案去证明或者推翻这个主张(一般都是去推 翻原来的主张)。 假设检验的一般步骤: 阐述假设 寻找证据 作出结论 例如:当某人极力向你辩护他/她没有说谎时, 你会说 寻找证据 假设

“好,我先相信你没有说谎,以后要是我知道了你真
的说谎了,我再也不相信你了”
作出结论
24
假设检验的术语
备择假设(Alternative Hypothesis) 原假设(Origin Hypothesis) 我们预先假定的状态; 我们希望的状态; 发电机的例子中,原假设就 发电机的例子中,我们希望经过 是A和B的产出没有差异; 投资改造,B的产出会增加; 寻找证据是为了推翻这种假 寻找证据是为了证明这种假设; 设; 统计学上用符号Ho表示(H: 统计学上用符号Ha表示(H: Hypothesis;o:origin) Hypothesis;a:alternative) 统计学对原假设的描述: 统计学对原假设的描述:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2检验是根据s判断抽出该样本的总体 其标准差是否等于
某一给定值。
检验程序:
(a) 确定假设H 0和H A: H 0:= 0;H A 有三种可能的形式: ( 1 ) 0 (2) 0 (若已知不可能小于 0 ) (3) 0 (若已知不可能大于 0 )
(b)计算检验的统计量:
1. 单个样本平均数检验
在实际研究中,常常要 检验一个样本平均数 x与已知的总体 平均数0是否有显著差异,即检 验该样本是否来自某一 已知 的总体。
已知的总体平均数一般 为一些公认的理论数值 。如畜禽正常 的生理指标、怀孕期、 生产性能指标等,都可 以样本平均数 与之比较,检验差异显 著性。
1.1 在σ已知的情况下,单个平均数的显著性 检验-u检验 检验程序:
• 两类错误之间的关系如何?
二者的区别是I型错误只有在否定H0的情况下发生,而 II型错误只有在接受H0时才会发生。 二者的联系是,在样本容量相同的情况下,I型错误减 小,II型错误就会增大;反之II型错误减小,I型错误就 会增大。比如,将显著性水平α从0.05提高到0.01,就 更容易接受H0,因此犯I型错误的概率就减小,但相应 地增加了犯II型错误的概率。
第一节 假设检验的基本步骤及原理
1. 假设检验的基本步骤
我们通过一个例子来介绍假设检验的基本步骤:
例一,已知某品种玉米 单穗重X ~ N (300,9.52 ),即单穗重 总体平均数0 300g,标准差 9.5 g。在种植过程中喷洒 了某种药剂的植株中随 机抽取9个果穗,测得平均单穗 重 x 308g,试问这种药剂对该品 种玉米的平均单穗重 有无真实影响?
• (一)提出假设
首先对样本所在的总体 作一假设。假设喷洒了 药剂的玉米单穗重 总体平均数与原来的玉米单穗重总 体平均数0之间没有真实差异, 即=0。也就是说表面差异( x 0)是由抽样误差造成的 。
0被称为零假设或无效假 设,记为 H0 : 0 .
所谓“零”就是指处理(药剂) 没有效果
3 双侧检验与单侧检验
在例一里,备择假设是 H A : 0。H A实际上包含了 0 或 0这两种情况,此时 水平的拒绝域为 (, u / 2 ] 和[u / 2 , )。
这种利用两个尾部进行 的检验称作双侧检验。 双侧检验的目的 在于判断与0有无差异,而不考虑 与0谁大谁小。
H 0是待检验的假设,它有 可能被接受,也有可能 被否定。 因此,需要设定一个对 立的假设,称为备择假 设。
所谓备择假设就是在零 假设被否定时,准备接 受的假设, 记为 H A : 0 .
• (二)计算概率
在假定零假设成立的前提下,根据检验统计量的分 布(第四章的内容),来计算现有样本发生的概率。
(a ) 确定假设H 0和H A: H 0:= 0;H A 有三种可能的形式: ( 1 ) 0 (2) 0 (若已知不可能小于 0 ) (3) 0 (若已知不可能大于 0 )
x 0 (b)计算检验的统计量: u / n
(c)求临界值并确定拒绝域 。相对于H A的不同形式,拒绝域为
(c)求临界值并确定拒绝域 。相对于H A的不同形式,拒绝域为
(1)
t / 2
t / 2
( 2)
t
(3)
t
(d )下结论
2 解:由于总体方差 0 未知,且新品种的千粒 重可能高于
也可能低于汕优 63 的千粒重,故采用双侧 t检验法。
(1)提出假设 H0 : 0 27.5 ; H A : 27.5
(2)计算检验统计量的值 s2 x
2
( x ) 2 / n n 1
2
97635 (987) 2 / 10 24.23 9

2
(n 1) s
2
9 24.23 1.11 196
(3)求出临界值,确定拒绝 域。
2
(n 1) s 2

2
, 它服从自由度为 n 1
的卡方分布
(c)求临界值并确定拒绝域 。相对于H A的不同形式,拒绝域为
(1)
12 / 2
2 /2
( 2)
2
(3)
(d )下结论
12
解:由于这是单样本变 异性检验,故采用 2检验法。
(1) 提出假设 H0 : 0 14 ; H A : 0 14
(1)
u / 2
u / 2
( 2)
u
(3)
u
(d )下结论
2 解:由于总体方差 0 已知,且新品种的鲜果 穗重可能高于
也可能低于原品种,故 采用双侧u检验。
(1)提出假设 H0 : 0 216.5 ; H A : 216.5
(2)计算检验统计量的值 x 255.0 185.0 278.5 x 227.9( g ) n 8
但在有些情况下,双侧 检验不一定符合实际情 况。如采用 某种新的配套技术措施 以提高鸡的产蛋量,已 知此种技术 不会降低产蛋量。此时 ,若进行新技术与常规 技术的比较, 零假设仍为H 0 : 0,而备择假设应为 H A : 0,即新 技术提高产蛋量。
• 双侧检验与单侧检验的选择:应根据专业 知识在试验设计时就确定。
II型错误的概率记为β ,其数值依据真实差异的程 H0不正确
否定H0
接受H0
I型错误(α)
推断正确(1-α)
推断正确(1-β ) II型错误(β )
• 如何降低两类错误的概率?
一般通过增加样本含量n,获得更多的关于总体的信 息,从而降低推断中可能出现的错误的概率。
(2)计算检验统计量的值 x 32.5 28.6 29.7 x 29.255( g ) n 9
s
x
2
( x) 2 / n n 1
(32.52 29.7 2 ) (263.3) 2 / 9 2.587 9 1
x 0 29.255 27.5 t 2.036 s/ n 2.587/ 9
x 0 227.9 216.5 u 0.712 0 / n 45.2 / 8
(3)求出双侧临界值,确定 拒绝域。=0.05
u u0.025 1.96
2
(4)下结论。因统计量 u 0.712没有落在拒绝域内,我 们不否定 H 0,因此新品种与苏玉糯 1号鲜果穗重差异不显著 。
第五章 统计推断
由样本推断总体得过程叫统计推断。统计推断能排 除试验误差得影响,揭示事物的内在规律。
假设检验
对总体的参数预先提出 一个假设, 如=3.6, 2=4.5等,然后通过样本 数据去推断这个假设是 否可以接受。

(显著性检验)



参数估计
通过样本统计量去直接 估计参数, 如用样本平均数 x去估计等。 这在下一章里讨论。
1.2 在σ未知的情况下,单个平均数的显著性 检验-t检验 检验程序:
(a ) 确定假设H 0和H A: H 0:= 0;H A 有三种可能的形式: ( 1 ) 0 (2) 0 (若已知不可能小于 0 ) (3) 0 (若已知不可能大于 0 )
x 0 (b)计算检验的统计量: t s/ n
u / 2
u / 2
• 注意:假设检验选用的显著性水平应根据 实验的要求而定。
• 如果实验中难以控制的因素很多,试验精度不是很高,则 显著性水平α的值可稍大点; • 如果实验的精度很高,真实差异不容易被误差所掩盖,处 理的作用容易被检验出来,这时显著性水平α可适当取小 些。
• 无论如何,显著性水平α的值必须在实验开 始前就已经确定下来。
• 一般若事先不知道所比较的两个处理效果谁好谁 坏,分析的目的在于推断两个处理之间有无显著 差异,则选用双侧检验;
• 若根据理知识或实践经验判断甲处理的效果不会 比乙处理的效果差,分析的目的在于推断甲处理 是否真的比乙处理号,这时应用单侧检验
4 两类错误
假设检验可能发生两类错误:I型错误与II型错误。
从第(二)步概率计算中得到,在H0成立的假设下,观察到现有样本 的概率是0.014。如果我们把小概率标准定为0.05(也称为显著性水 平),那么现有样本的发生是小概率事件,根据小概率事件实际不可 能原理,是不可能得到现有样本的。
但是,在我们的实验中确实得到了现有的样本,这只能说明H0成立 的前提是错误的。因此,我们在显著性水平为0.05的情况下,否定 H0,而接受HA。所以这种药剂对玉米单穗重有显著的影响。
(3) 求出双侧临界值,确定 拒绝域。 df n 1 8时, =0.05的双侧临界值 t / 2 2.306
查表 4 a
2.306
2.306
(4)下结论。因统计量 t 2.036没有落在拒绝域内,我 们不否定 H 0,因此新品种的千粒重 与汕优63没有显著差异。
2 单个样本的方差检验-χ2检验
本例的u的尾区概率: P(| u | 2.526) 2P(u 2.526) 2 0.00570 0.0114 1.14%
• (三)统计推断(下结论)
若随机事件的概率很小,例如小于0.05或0.01,称之为小概率事件
小概率事件不可能原理:小概率事件在一次试验中 实际上是不可能发生的。
I型错误:H0实际上是正确的,但假设检验的结果却 否定H0。通俗地讲,就是没有差异说成了有差异。
以例一为例。假如H0是正确的,由于抽样的随机性, 仍有一部分样本的u值会落在拒绝域内,利用这些样本 作假设检验就会拒绝H0,从而犯下I型错误。 由于拒绝域的面积为α,所以I型错误的概率约为α。
II型错误:H0实际上是错误的,但假设检验的结果却 接受H0。通俗地讲,就是有差异说成了没有差异。
本例是在假定 H 0 : 0 300 的前提下,研究得到这 个样本的 概率。从样本平均数的 抽样分布入手。
相关文档
最新文档