工程统计学 第五章统计推断

合集下载

第五章统计推断

第五章统计推断
术的比较试验,则无效假设应为 H0:12 ,即假设新技术 与常规技术药效是相同的 ,备 择 假设应为 HA: 12,即新
配套技术的实施使药效有所提高。
第五章 统计推断
第一节 概述
检验的目的在于推断实施新技术是否提高了药效,这时H0的
否定域在正态曲线的右尾。在α水平上否定域为 U2,,右
侧的概率为α,如图4-15A所示。
第一节 概述
解决方法
假设十年来男孩子身高没有明显增长,即121.5米 1
再看从这样一个总体中抽出一个均值 x =1.53米、标准差
S=0.073米的样本的可能性有多大?
如果这个可能性很大,只能认为1、2 差别不大,即 1 2 很可能成立;反之若可能性较小,则说明在假设成立的
条件下,抽出这样一个样本的事件是一个小概率事件。
由于显著性检验是根据 “小概率事件实际不可能性原理”来否定 或接受无效假设的, 所以不论是接受还是否定无效假设,都没有 100%的把握。也就是说,在检验无效假设时可能犯两类错误。
第一类错误是真实情况为H0成立,却否定了它,犯了“弃真”错 误,也叫Ⅰ型错误。Ⅰ型错误,就是把非真实差异错判为真实差
对应假设,记为HA :μ≠ μ0,即假设试验结果的差异是由于总体
参数不同引起的。
H0和HA是相互对立的,如果检验结果拒绝H0,就要接收HA; 反之亦然。
第五章 统计推断
三、统计假设检验的基本步骤
第一节 概述
例:如果某排污口的废水,经长期监测,其含油浓度为
8mg/L,标准差为2mg/L,服从正态分布。现随机对该排污口 废水取样16次,测定含油浓度,平均值为9mg/L,问该排污口 废水中的含油浓度是否有显著性变化?
由上可以看出,若对同一资料进行双侧检验也 进行单侧检验 ,那么在 α水平上单侧检验显著, 只 相当于双侧检验在 2α水平上显著。 所以,同一资 料双侧检验与单侧检验所得的结论不一定相同。

第五章统计推断课件(1)

第五章统计推断课件(1)

2020/8/1
版权所有 BY 统计学课程组
28
一、假设检验的一般性问题(5)
上述的判断实际上体现着反证法的思想。判断的基础是样本
信息,判断的理论依据是小概率原理,即小概率事件在一次试验
(或抽样)中几乎不发生。直观来想,在所做假设是正确的情况
下,那么一次试验(或抽样)中人们期望的结果出现的概率应该
2020/8/1
版权所有 BY 统计学课程组
11
二、区间估计(3)
5.区间估计时应考虑的一些具体问题 在对总体均值进行区间估计时,
常常需要考虑总体是否为正态总体、 总体方差是否已知、用于构造估计量 的样本是大样本(n≥30)还是小样本(n< 30)等几种情况。
2020/8/1
版权所有 BY 统计学课程组
2. 解决问题的统计思想 4. 单、双侧检验问题 6. 统计检验的显著性
二、几种常用、具体的参数检验方法
1. Z检验法 3. c 2 检验法
2. T检验法 4. F检验法
2020/8/1
版权所有 BY 统计学课程组
23
一、假设检验的一般性问题(1)
(一) 问题的提出
2020/8/1
版权所有 BY 统计学课程组
12
二、区间估计(4)--总体均值的区间估计
1.正态总体、总体方差已知;或非正态总体、大样本
2020/8/1
版权所有 BY 统计学课程组
13
二、区间估计(5)--总体均值的区间估计
2.正态总体、总体方差未知、小样本
2020/8/1
版权所有 BY 统计学课程组
14
二、区间估计(6)--总体成数的区间估计
第五章
统计推断
2020/8/1

【VIP专享】第五章 统计推断(1)

【VIP专享】第五章  统计推断(1)
为了确定这个偏误的程度和总体参数的所在,我 们可以进行区间估计。
区间估计: 是指以一定的概率保证总体参数位于某两 个数值之间。
如,某一水稻品种的亩产量 落在(700kg-800kg)区间的概率为95%。
二、统计假设测验的基本步骤
进行统计假设测验,首先要对统计总体提出假设,
统计假设(statistical hypothesis): 就是试验工作者提出有关某一总体参数的假设。
(1)计算概率的方法
在 H 0 : 0 的假设下可算得: 查附表2,
uu xx00 551155550000 22..55
xx
1188// 99
P(u 2.5) 20.0062 0.0124
在 0 500 的总体中,如以n=9作随机抽样,抽得 一个与500kg相差达15kg以上的的概率为0.0124。
【例5·1】
设一水稻地方品种一般亩产为500kg,方差为 324kg,现有一新品种对其抽查了 9个试验小区, 测得样本平均亩产为515kg,问:这样本是否从 亩产为500kg的总体中随机抽出的?差数15kg究 竟是抽样误差造成的? 还是确实有差异?
1.提出统计假设
无效假设必须是有意义的,即在假设的前提下可以 确定试验结果的概率的。
第五章 统计推断
5.1 统计假设测验的基本原理
一、统计推断的意义和内容
第四章我们学到从总体到样本的方向,即抽样分 布问题,讲述从理论分布中抽出的样本统计数的变 异特点。
本章将讨论从样本到总体的方向,就是从一个样 本或一系列样本结果去推断其总体结果,即统计推 断问题。
统计推断(statistical inference):
测验前提出无效假设的目的在于,可从假设的总 体里推论其平均数的随机抽样分布,从而算出某一 样本平均数指定值出现的概率,进而研究样本与总 体的关系,作为假设测验的理论依据。

第五章 统计推断 PPT课件

第五章 统计推断 PPT课件

(点估计)
置信区间
置信下限 ˆ 1
置信上限 ˆ 2
一般地,如果将构造置信区间的步骤重复多次, 置信区间中包含总体参数真值的次数所占的比率, 称为置信水平(概率保证程度)。
即区间包含总体参数真实值的可信度.
通常用1- 表置信水平,其中称为显著性水平。 比较常用的置信水平:90%,95%和99%。
第五章 统计推断
第一节 总体参数估计 第二节 总体参数检验
统计推断在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
大学生每周上网花多少时间?
为了解学生每周上网花费的时间,某校4名 本科生对全校部分本科生做了问卷调查。调 查的对象为本校在校本科生,调查内容包括 上网时间、途径、支出、目的、关心的校园 网内容,以及学生对收费的态度,包括收费 方式、价格等。
例如,抽取了1000个样本,根据每一个样本均构 造了一个置信区间,这1000个置信区间中,有95% 的区间包含了总体参数的真值,而5%的置信区间则 没有包含。这里,95%这个值被称为置信水平(或置 信度)。
两个需要注意的问题
如果用某种方法构造的所有区间中有95%的 区间包含总体参数的真值,5%的区间不包含 总体参数的真值,那么,用该方法构造的区 间称为置信水平为95%的置信区间。
点估计完全正确的概率通常为0。因此, 我们更多的是考虑用样本统计量去估计总 体参数的范围 区间估计。
(一)总体参数的区间估计概述
1.基本概念
(1)区间估计:在点估计的基础上,给出总体参数 估计的一个范围,并给出区间估计成立的概率值。


p(1 2 ) 1 样本统计量
P(X )
均值的抽样分布

第五章 统计推断 《试验设计与统计分析》PPT课件

第五章 统计推断  《试验设计与统计分析》PPT课件

则( x1 x 2 ) ~ N ( ( x1 x2 ) , ......
2 ( x1 x 2 )
)。
统计推断
总体 ——从样本到总体
样本
通过一个或多个样本统计数推断总体相应参数
第一节 统计推断的含义和内容
一、统计推断的概念
按照一定的抽样方法,从所研究的总体中,随机抽 出一个样本或一系列样本,并研究样本的特征,然后根 据对样本特征的研究结果去推断总体的特征 。
拿 3棵 拿 4棵 拿 5棵

推断:一次就猜对5棵的概率是0.03125,概率很小, 亦即猜100次只有5次能把5棵麦苗属何品种全猜对, 在一次试验中几乎不可能发生,所以,他若能一次 就说对,不是凭猜的,是确有鉴别能力。
这里有一个概率标准的问题,这个概率标准
称为显著水平(a)一般为0.05或0.01。 我们是依据“小概率实际不可能性原理”进 行推断的。这个原理是说:概率很小的事件, 在一次试验中几乎不可能发生或可以认为不 可能发生。如果我们假设了一些条件,并在 假设的条件下能够准确地算出事件A出现的 概率很小,但在一次试验中,事件A竟出现 了,那么,我们就可以认为这个假设不正确, 从而否定这个假设。
四、统计假设检验的两类错误

1、第一类错误(first kind error)或I型错误(type I error)。––如果H0是真实的,我们通过检验却否定 了它,就犯了一个否定真实假设的错误。第一类错
误只有在否定H0时才会发生。由于规定显著水平为
a ,故H0为真而被否定的概率最多为a ;因而这类
实际上包括了 0 (或1 2 )和 0 (或1 2 )两种情况, 要在 a显著水平否定无效假设 H 0 : 0 (或1 2 ), 必须 否定区,分别位于 水平 a u ua 或u ua,因而这种检验有两个 表示的概率在曲线两尾

第5章 统计推断

第5章  统计推断

1. 2. 3. 4. 5.
解:
1. 计算样本指标 p 0.85
2. 计算抽样平均误差 3. 查表得统计量
p
p(1 p) 0.85 0.15 0.0252 n 200
x
第五章 参数估计
第一节参数估计的一般问题
• 估计量与估计值
– 抽样估计/参数估计:用样本统计量估计总体参数的特征值; – 估计量:用来估计总体参数的统计量的名称; – 估计值:用来估计总体参数是计算出来的估计量的具体数值。
• 点估计与区间估计
– 点估计:用样本估计量的值直接作为总体参数的估计值; – 区间估计:在点估计的基础上,给出总体参数估计的一个范围。
1.
2. 3. 4. 5.
计算样本指标
计算抽样平均误差 查表得统计量 计算抽样极限误差 计算置信区间
解:正态总体、方差未知、小样本
1. 计算样本指标
x s
x 789 806 791.1
n 10
2 x x
n 1
17.136
2. 计算抽样平均误差
x
行耐用性能检查,抽查
资料分组如下表,要求 估计该批电子元件的平 均耐用时数的置信区间 (置信度95%)。
1. 2. 3. 4. 5. 计算样本指标 计算抽样平均误差 查表得统计量 计算抽样极限误差 计算置信区间
解:正态总体、方差未知、大样本
1. 计算样本指标
X Xf 1055.5(小时) f
5 17.136 5.419 n 10
3. 查表得统计量 1 0.95
t (n 1) t 0.025 (9) 2.262
2
4. 计算抽样极限误差 x t 2 (n 1) x 2.2622 5.419 12.26 5. 计算置信区间 x x x x

《统计学》课件 第五章统计推断

《统计学》课件 第五章统计推断

三、 样本容量的确定

p152
一、问题的提出 二、处理问题的原则 三、简单随机抽样下,调查成本既定时样本容 量确定的方法 1. 估计总体均值时样本容量的确定
2. 估计总体比例时样本容量的确定
2014-1-1
版权所有 BY lazhenx
37
样本容量的确定
一、问题的提出

从推断来看,要达到估计所要求的精确程度,
对置信区间的理解注意:
②总体参数是固定的、未知的,而用样本构造的区间则是不 固定的。若抽取不同的样本,用该方法可以可到不同的区 间,从这个意义上说置信区间是随机区间,会因样本的不 同而不同,而且不是所有的区间都包含总体参数的真值。 ③在实际问题中,进行估计时往往只抽取一个样本,此时所 构造的是与该样本相联系的一定置信水平(比如95%)下的 置信区间。由于用该样本所构造的区间是一个特定的区间 ,而不再是随机区间,所以无法知道这个样本所产生的区 间是否包含总体参数的真值。我们只能希望这个区间是大 量包含总体参数真值的区间中的一个,但它也可能是少数 几个不包含参数真值的区间中的一个。
1.
ˆ P q1 #q
{
ˆ q2 = 1- a
}
置信区间
置信水平1-α
样本统计量 (点估计)
置信下限
置信上限
当总体服从正态分布N(μ,σ2)时,(σ2已知)来自该总体 的所有容量为n的样本的均值x也服从正态分布,x 的数 学期望为μ,方差为σ2/n 即x~N(μ,σ2/n) 置信水

p(
x
原点矩存在,若不存在则无法估计;矩估计法不能充分地利 用估计时已掌握的有关总体分布形式的信息。
2.最大似然估计法
基本思想:当我们经一次抽样取得一些观测数据(样本值) 后,应给未知参数选取一些数值,使得所观测得到的样本值 出现的概率最大。

理解统计推断学习如何进行统计推断

理解统计推断学习如何进行统计推断

理解统计推断学习如何进行统计推断统计推断是统计学中的一个重要分支,旨在通过对样本数据的分析和推断,推断总体参数的性质和规律。

统计推断的学习过程中,我们需要掌握一些基本的理论知识和方法,并且能够灵活运用这些知识和方法解决实际问题。

一、统计推断的基本概念统计推断是建立在概率论和数理统计学的基础上的一种统计学方法。

它的核心思想是通过对样本数据的收集与分析,对总体参数进行推断。

总体是指我们研究的对象的全体,而样本则是从总体中抽取的一部分观察结果。

在统计推断中,我们通常关注两个问题:参数估计和假设检验。

参数估计是指通过样本数据,利用各种统计方法对总体参数进行点估计或区间估计。

假设检验是指根据样本数据,通过构造合适的检验统计量和拒绝域,对关于总体的某个参数或参数的假设进行判断和推断。

二、参数估计参数估计是统计推断中的一个重要问题,它关注的是如何通过样本数据对总体参数进行估计。

参数估计通常可以分为点估计和区间估计两种方法。

1. 点估计点估计是通过样本数据,利用某个统计量来估计总体参数的值。

常见的点估计方法有最大似然估计和矩估计。

最大似然估计是寻找使得样本观测概率最大的总体参数值作为估计值,矩估计则是利用样本矩与总体矩的关系进行参数估计。

2. 区间估计区间估计是通过样本数据,构建一个区间来估计总体参数的范围。

常见的区间估计方法有置信区间和可信区间。

置信区间是指在一定置信水平下,给出总体参数的一个区间估计,可信区间则是在一定可信水平下给出总体参数的一个区间估计。

三、假设检验假设检验是统计推断中的另一个重要问题,它关注的是通过样本数据对总体参数的假设进行判断和推断。

在假设检验中,我们通常关注两类假设:原假设和备择假设。

1. 原假设原假设是对总体参数的一个假设,通常表示为H0。

在进行假设检验时,我们需要先提出一个关于总体参数的猜测,即原假设。

原假设通常是默认为真的假设。

2. 备择假设备择假设是对总体参数的另一个假设,通常表示为Ha。

统计推断教案

统计推断教案

统计推断教案引言:统计推断是一门应用广泛的统计学分支,用于根据样本数据推断总体特征并进行决策。

本教案旨在解释统计推断的基本原理和方法,使学生能够理解并应用这些知识在实际问题中进行推断和判断。

一、概述统计推断是在数据收集和分析的基础之上,利用样本信息对总体进行估计、假设检验和置信区间构造的过程。

通过统计推断,我们可以得出关于总体特征的合理推断,从而为决策提供依据。

二、基本原理1. 总体和样本:统计推断的基本概念是总体和样本。

总体是我们研究的对象的全体,而样本是从总体中选出的一部分个体。

2. 随机性:统计推断的关键在于随机性。

我们通过随机抽样来获取样本,以保证样本对总体的代表性和一致性。

三、统计推断方法1. 点估计:点估计是用样本数据估计总体参数的方法,其中最常用的估计量是样本均值和样本比例。

通过点估计,我们可以得到总体参数的一个单一估计值。

2. 区间估计:区间估计是用来估计总体参数的范围。

通过构造一个置信区间,我们可以以一定的置信水平来估计总体参数的区间范围。

3. 假设检验:假设检验是用来检验关于总体参数的假设是否成立。

通过设定一个显著性水平,我们可以根据样本数据判断是否拒绝原假设。

四、统计推断的应用统计推断在各个领域都有广泛的应用,包括医学、经济、市场调研等。

以下是一些实际应用案例:1. 医学研究:统计推断可以用于评估新药的疗效,通过对医学实验数据的分析,得出关于药物治疗效果的结论。

2. 市场调研:统计推断可以用于评估市场需求和消费者行为,通过对调查样本进行分析,得出关于产品市场份额和用户满意度的结论。

3. 教育评估:统计推断可以用于评估教育政策和教学效果,通过对学生考试成绩和问卷调查数据的分析,得出关于教学质量和学生表现的结论。

结论:统计推断是一项重要的统计学方法,可帮助我们从样本数据中推断总体特征并进行决策。

通过掌握统计推断的基本原理和方法,我们可以更好地理解和应用统计学知识,提高数据分析的准确性和可靠性。

统计学第5章

统计学第5章
ˆˆ
E(U , L )
(误差范围) 越小越好
总体参数区间估计的方法:
• 根据给定的置信度要求,来推算抽样极限误差的可能范围
步骤:抽取样本,计算样本指标——计算标准差,抽样平均
误差——根据F(z)查出z值——计算极限误差——求出 估计总体指标的上下限,作区间估计
• 根据已经给定的抽样误差范围,求概率保证程度。
所以,总体比例的置信度为1- α 的置信区间为:
pp P pp
例题分析
[例] 某厂对一批产成品按不重复抽样方法随机抽选200件
进行质量检测,其中一等品160件,试以90%的概率估计
一等品率的范围。
已知: p 16,01- 8=09%0%, =200
4、统计推断的内容
1)参数估计:从总体中抽取一部分单位进行调查, 进而利用样本提供的信息来推断总体的未知参数 和数值特征的方法和过程。
2)假设检验:先对总体的状况作某种假设,然后 再根据抽样推断的原理,根据样本观察资料对所 作假设进行检验,来判断这种假设的真伪,以决 定我们行动的取舍。
5、有关抽样的基本概念
[例] 某厂生产的零件长度服从正态分布,从该厂生产的零件 中随机抽取25件,测得它们的平均长度为30.2厘米。已知总 体标准差 =0.45厘米。
要求:(1)计算抽样平均误差和抽样允许误差。
(2)估计零件平均长度的可能范围( =0.05)。
已知: X ,~ N(), 0.=43502 .2, =2X5,
=(4.14,5.86)
即我们可以以95%的把握保证该市高中生每周平 均看电视时间在4.14到5.86小时之间。
三、总体成数的区间估计
**在大样本下,样本比例的分布趋近于均值为p

第5章 统计推断

第5章 统计推断

第 5 章 统计推断5.1 统计推断概述统计推断就是利用样本的数据,对总体的数量特征作出具有一定可靠程度的估计和判断。

统计推断的基本内容有参数估计和假设检验两方面。

概括地来讲,参数估计是指研究一个随机变量,推断它的数量特征和变动模式。

而假设检验是检验随机变量的数量特征和变动模式是否符合我们事先所作的假设。

参数估计和假设检验的共同特点是它们对总体都不很了解,都是利用部分样本所提供的信息对总体的数量特征作出估计或判断。

所以,统计推断的过程必定伴有某种程度的不确定性,需要用概率来表示其可靠程度,这是统计推断的一个重要特点。

5.1.1 参数估计参数估计是以样本统计量作为未知总体参数的估计量,并通过对样本各单位的实际观察取得样本数据,计算样本统计量的取值,把它作为总体参数的估计量。

参数估计包括点估计和区间估计。

点估计是直接以样本统计量作为相应总体参数的估计量。

例如,用样本均值作为总体均值的点估计量,用样本方差作为总体方差的点估计量。

点估计的优点在于它能提供总体参数的的具体估计值,可以直接作为决策的数量依据。

但是,点估计事实上几乎不可能做到完全准确,更谈不上有多大的置信度。

而区间估计是估计总体参数以某种概率保证程度(置信度)落入某一区间,这样就有把握多了。

对总体被估计参数θ作区间估计,就是要给出区间的下限1ˆθ和上限2ˆθ,使被估计参数落在(1ˆθ,2ˆθ)内的概率为1α−,即 12ˆˆ()1P θθθα≤≤=− 其中,1α−就是置信度,α被称为显著性水平,如图 5-1。

ˆθ12图 5-1 区间估计在SPSS 中没有专门的参数估计命令。

参数的点估计值可以在Descriptives 命令中得到,例如用统计量mean 作为总体均值的点估计,用统计量variance 作为总体方差的点估计等。

参数的区间估计可以通过Explore 命令得到(参见4.4节的内容),也可以在各种假设检验的过程中可以得到(参见本节后面的内容)。

第五章 统计推断 《统计学》 ppt课件

第五章 统计推断 《统计学》 ppt课件
必要抽样数目愈多;值愈小,必要抽样数目愈少。 (2)允许误差(极限误差)Δ,即Δ的数值。Δ值大可以
少抽些样本单位,Δ值小则要多抽一些样本单位。Δ是调查 前规定的,是根据调查目的确定的。 (3)概率度t 。t值愈大,要求把握程度愈高,则要多抽 些单位;t值愈小,要求把握程度低,则可少抽些单位。把 握程度也是在抽样之前根据抽样的目的和要求来规定的。 (4)抽样方法。在同等条件下,重置抽样需要多抽一些单 位,不重置抽样可少抽一些样本单位。 (5)抽样的组织方式。简单随机抽样,类型随机抽样, 等距随机抽样,整群随机抽样,阶段随机抽样等都是抽样 的组织方式,由于采用的组织方式不同,必要抽样数目也 不相同。
二、统计推断的几个基本概念
1.总体和样本 在统计推断中存在全及总体和样本总体。
全及总体也叫母体,简称总体,是所要认识的研究对象的 全体,它由具有某种共同性质或特征的单位组成。全及总 体的单位数用N表示。
全及总体按其各单位标志的性质不同可分为变量总体和 属性总体。
样本总体又叫抽样总体、子样,简称样本,是从全及总 体中随机抽选出来的单位所组成的小总体。
样本平均数的抽样分布是由样本平均数的可能取值和与 之相应的概率组成。
例5.3
在不重复抽样时,样本平均数的抽样分布有数学期望
E(x) a
即样本平均数的平均数等于总体平均数
X
在不重复简单随机抽样时,样本平均数的抽样分布有方 差,即
2 x
2
n
(
N N
n) 1
在不重复抽样条件下,用
x
表示抽样平均误差(也称抽样标准误差),则

方差σ2 )。
设总体N个单位中,有N1个单位具有某种属性,N0个单 位不具有某种属性,且N1十N0=N ,则: P N1 N

f第五章 统计推断

f第五章 统计推断

1.82
n
10
PU 1.82 0.03437
P 0.05
若假设成立,则得到实际样本这一事件为小概率事件。 假设不成立,拒绝零假设,接受备择假设。 幻灯片 14 在假设 H0 正确的情况下,计算样本实际发生的概率 P,若 P>α,接受 H0 ;若 P<α,拒绝 H0 ,接受 HA 。在实际应用时,并不直接求出具体的概率值,而是建立在α水平上 H0 的拒 绝域和接受域。 幻灯片 15 拒绝域(rejection region):在上尾、或下尾、或双侧检验中,U > uα、或 U < -u α、或|U| > uα/2 的区域,称为在α水平上 H0 的拒绝域。 接受域(acceptance region):相应的 U < uα,或 U > -uα ,或-uα/2 < U < uα/2 的 区域,称为在α水平上 H0 的接受域。
则1. H0 : 0 (null hypothesis,零假设或无效假设,检验假设) 2. HA:备Hμ1择>:μ假0设,的或提0 (H出aAl是:tμe根r<n据μat具0iv体,e 情或hy况HpA而o:μt定h≠e的sμi。s0,备。择假设;或 research hypothesis,研究假设)
本平均数 y=10.23g。这批动物实际饲养的时间比根据以往经验所需饲养的时间长。问这批
动物能否用于实验。
解: H0: μ=10.00g HA: μ>10.00g 幻灯片 9 (二)统计假设检验原理——小概率原理 小概率的事件(P≤0.05 或 P≤0.01) ,在一次试验中几乎是不会发生的。若根据一定的假 设条件计算出来该事件发生的概率很小,而在一次试验中它竟然发生了,则可以认为假设 的条件不正确,从而否定假设。 幻灯片 10 (二)小概率原理 小概率事件(P≤0.05 或 P≤0.01) ,在一次试验中几乎是不会发生的。若根据一定的假设 条件计算出来该事件发生的概率很小,而在一次试验中它竟然发生了,则可以认为假设的 条件不正确,从而否定假设。 若在 H0 成立的前提下,样本统计量对应的概率很小,如小于等于 0.05,则认为事件在某一 次试验中不会发生,此时拒绝 H0,有足够证据推断差异有统计学意义。 幻灯片 11 显著性检验(significance test):根据小概率原理建立起来的检验方法称为显著性检验。 显著性水平(significance level):拒绝零假设所使用的概率。 生物统计工作中, 通常 规定 5%或 1%以下为小概率, 5%或 1%或其它值称为显著性水平,记为“α”。

工程统计学 第五章统计推断

工程统计学   第五章统计推断

2016/6/16
28
第二节 样本容量的确定 (3)

三、简单随机抽样下、调查成本既定时,样本容量的 确定方法 1. 总体均值估计情形
2016/6/16
29
第二节 样本容量的确定 (4)
2016/6/16
30
其他抽样组织方式的抽样误差

常见的抽样组织形式主要有:纯随机抽样、机 械抽样、类型抽样、整群抽样、多阶段抽样。
2016/6/16
5
抽样平均误差与抽样极限误差
x 抽样平均误差 x 样本配合总数 2 重复抽样 x n n

不重复抽样

x

2 N n
n N 1
抽样平均误差 2和 未知时,可用下面方法解决: (1)用过去资料或同类地区资料代替; (2)用 s 2 代替。
2016/6/16 8
第一节 总体参数估计

一、点估计 1.点估计的定义 2.点估计量的优良标准 二、区间估计 1.区间估计的定义 2.总体均值的区间估计
2016/6/16
9
一、点估计(1)


1.参数估计按是否考虑估计误差的大小及发生的 概率,估计方法分为点估计和区间估计两大类。 2.点估计的定义
ˆ #q P q 1
{
ˆ = 1- a q 2
}

2.区间估计中的两个基本要求
2016/6/16
16
二、区间估计(2)

3.Neyman原则

4.区间估计中的一些名词
2016/6/16
17
二、区间估计(3)

5.区间估计时应考虑的一些具体问题

统计推断

统计推断

平均身高:X=173cm 标准差: S=3cm
统计学的目标:利用样本信息推断总体的性质
3
样本统计量

有以下常用的样本统计量 衡量中心位置的: 衡量离散程度的: 偏差 平方和 均方差(方差) 标准差
自由度df指的是独立偏差 的个数。
4
对总体参数进行估计

样本统计量的目的是对总体参数进行估计,存在 以下两类估计方法: 点估计
发电机A和B产出的样本统计量 样本量 平均值 标准差 A 10 84.24 2.90 B 10 85.54 3.65 两组数据平均值的差异δ=1.30

A和B之间样本平均值的差异δ =1.30是显著的差 异还是仅仅是偶然的差异?
假设检验可以回答这个问题
23
假设检验的思想
顾名思义,假设检验先对某个主张进行假设,然后 寻找答案去证明或者推翻这个主张(一般都是去推 翻原来的主张)。 假设检验的一般步骤: 阐述假设 寻找证据 作出结论 例如:当某人极力向你辩护他/她没有说谎时, 你会说 寻找证据 假设

“好,我先相信你没有说谎,以后要是我知道了你真
的说谎了,我再也不相信你了”
作出结论
24
假设检验的术语
备择假设(Alternative Hypothesis) 原假设(Origin Hypothesis) 我们预先假定的状态; 我们希望的状态; 发电机的例子中,原假设就 发电机的例子中,我们希望经过 是A和B的产出没有差异; 投资改造,B的产出会增加; 寻找证据是为了推翻这种假 寻找证据是为了证明这种假设; 设; 统计学上用符号Ho表示(H: 统计学上用符号Ha表示(H: Hypothesis;o:origin) Hypothesis;a:alternative) 统计学对原假设的描述: 统计学对原假设的描述:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


3.点估计不考虑估计误差的大小,故不需确定估 计量的概率分布。点估计的主要作用是寻找参数 的估计量。
2016/6/16
10
一、点估计(2)


点估计量的评价标准 1.无偏性
2016/6/16
11


一般来说,无偏估计量并不唯一,甚至可以是无限多 个。 如果 是参数θ的无偏估计量,但 g ( ) 通常不是 g( θ )的无偏估计量。如:

2016/6/16
6
抽样平均误差与抽样极限误差

抽样极限误差
x X
x



极限误差除以抽样平均误差得到的相对数t,我们称 之为概率度。
t

x

t
x
x
x

与置信度密切相关。
问题是:我们希望得到一个精确度较高的样本, 同时又希望置信度较高。当然,这是不可能的。
3
重点与难点


1.参数区间估计的统计思想 2.估计的可靠程度、平均误差及极限误差的关 系 3.临界值检验法的统计思想 4.P值的计算方法及其含义的理解 5.参数抽样检验中的两类错误及其关系
2016/6/16
4
抽样平均误差与抽样极限误差



抽样平均误差是指所有可能出现的样本指标 (样本平均数或样本成数或样本方差、标准差 等)的标准差,也可理解为所有样本指标和总 体指标之间的平均离差。 抽样实际误差是指某一次具体抽样的过程中所 得样本指标值与总体指标数值之差。 抽样极限误差:样本统计量与总体参数之间的 抽样实际误差的可允许范围。
80
20 100
7200
5625 -
600
1000 35
解:平均层内方差:

2 2 i ni
n
6002 80 10002 20 488000 100
采用重复抽样方法计算抽样误差,则:

x


488000 69.86 n 100
2 i
所以,抽样误差为69.86公斤。
2016/6/16 7
例1:某商场从一批袋装食品中随机抽取10袋, 测得每袋重量(单位:克)分布为: 789/780/794/762/802/813/770/785/810/80 6。假设每袋重量服从正态分布,以95%的 把握程度估计这批产品的平均每袋重量时, 允许误差是多少? 解:样本平均数=791.1(克) 样本标准差=17.136 (克) 抽样平均误差=5.42 (克) 已知把握程度为95%,查表得t=2.2622 所以允许误差=2.2622×5.42=12.26 (克)
2016/6/16 8
第一节 总体参数估计

一、点估计 1.点估计的定义 2.点估计量的优良标准 二、区间估计 1.区间估计的定义 2.总体均值的区间估计
2016/6/16
9
一、点估计(1)


1.参数估计按是否考虑估计误差的大小及发生的 概率,估计方法分为点估计和区间估计两大类。 2.点估计的定义

1.正态总体、总体方差已知;或非正态总体、大样本
2016/6/16
19
二、区间估计(5)--总体均值 的区间估计

2.正态总体、总体方差未知、小样本
2016/6/16
20
二、区间估计(6)--总体成数的区间估计

只讨论大样本情形
2016/6/16
21
二、区间估计(7)--总体方差 的区间估计
s 2是总体方差的无偏估计量,但s不是的无偏估计量。
X 是总体均值的无偏估计量,但 X 不是的无偏估计量。
2
2016/6/16
12
一、点估计(3)

2.有效性
2016/6/16
13


无偏估计量使用方差作为评判标准。 E 作为优劣 有偏估计量使用均方误差 MSE 的评判标准,即总体参数θ的两个点估计量 、 满
2016/6/16
22
二、区间估计(8)


根据上述例子,区间估计的步骤可归纳为: (1)依题意确定待估参数; (2)依题设条件构造与待估参数相对应的估 计量; (3)确定估计量的抽样分布; (4)依估计量的抽样分布,由给定的置信度 计算待估参数置信区间的上、下限。
2016/6/16
23
32
2016/6/16
分层抽样,即类型抽样或分类抽样,是指将 总体各单位按主要标志加以分层,而后在各 层中按随机原则抽取若干个样本单位,由各 层的样本单位组成一个样本。 先分层,再在各层总体中随机抽取一定的 单位数。 特点:1)能提高样本的代表性;2)能降低总 体方差对抽样平均误差的影响。 等比例抽样就是从各层中按相同的比例抽取 不等比例抽样就是从方差较大的组抽取较多 适用对总体有一定认识的情况。 样本单位数。样本单位在各层的分配比例同 的样本单位数,反之少抽一些。目的是减少 总体单位在各层的分配比例相同。 抽样误差,提高样本指标的代表性。 从各层抽取样本单位时,可以根据各层的单位 数等比例抽样,也可以是不等比例抽样。
2016/6/16
5
抽样平均误差与抽样极限误差
x 抽样平均误差 x 样本配合总数 2 重复抽样 x n n

不重复抽样

x

2 N n
n N 1
抽样平均误差 2和 未知时,可用下面方法解决: (1)用过去资料或同类地区资料代替; (2)用 s 2 代替。
2016/6/16
24
例:军队战士的身高服从正态分布。经抽取100 个战士,测得平均身高175cm,标准差40cm。 现在军服厂要裁制1万套军服,问身高在 171~179cm之间应裁制多少套?
解:抽样平均误差=4cm
身高在171~179cm的概率度t=4/4=1
查表,得 1-α=0.8413+(1-0.8413)=0.6826
ˆ #q P q 1
{
ˆ = 1- a q 2
}

2.区间估计中的两个基本要求
2016/6/16
16
二、区间估计(2)

3.Neyman原则

4.区间估计中的一些名词
2016/6/16
17
二、区间估计(3)

5.区间估计时应考虑的一些具体问题
2016/6/16
18
二、区间估计(4)--总体均值的区 间估计
应裁制0.6826×10000=6826(套)
2016/6/16
25
第二节 样本容量的确定

一、问题的提出 二、处理问题的原则 三、简单随机抽样下,调查成本既定时样本容 量确定的方法
2016/6/16
26
第二节 样本容量的确定 (1)
一、问题的提出

从推断来看,要达到估计所要求的精确程度, 自然要求样本容量越大越好;但从抽样来看, 增大样本容量,势必增加人力、物力,从而导 致调查成本增大,这无疑是不经济的做法。于 是在抽样推断中,势必要在统计推断的精确度 与调查成本这一对矛盾间进行权衡。

2016/6/16
34
例题:某地全部粮食耕地5000公顷,按平原和山区 面积比例抽取样本容量100公顷,各层平均每公顷 产量和标准差如表。试用重复抽样方法计算抽样误 差。
单位:公顷,公斤
地形
全部面积
抽样面积
抽样平均 每公顷产 量
每公顷产 量标准差
平原
山区 合计
2016/6/16
4000
1000 5000
第五章 抽样推断
2016/6/16
1
第五章 统计推断

第一节 总体参数估计 第二节 样本容量的确定 第三节 总体参数检验
2016/6/16
2
学习目标



1.掌握估计量的优良标准 2.参数区间估计的思想与方法 3.参数假设检验的临界值法与P值法 4.一定条件下,样本容量确定的方法
2016/6/16
例:某企业生产某种产品的工人有500人,为了 了解工人生产产品的日产量资料,随机抽取了 36人进行调查。调查结果,人均日产量为25 件,标准差为3件。试问:有多大的把握程度 可推断该企业日总产量在12000件~13000件 之间。 解:抽样平均误差=0.5 工人日均产量:24~26件 t=1/0.5=2 查表得:1-α=0.9545

2016/6/16 33
分层抽样的抽样误差计算公式
项目 平均数的抽样误 差公式 成数的抽样误差 公式
重复抽样


不重复抽样

n 1 n N
2 i

x

2 i

x

n
p 1 p n

p
p
p 1 p n 1 n N
2016/6/16
36
等距抽样,即机械抽样或系统抽样,是指将 总体各单位按某一标志排队,而后按固定顺 序和相等间隔在总体中抽取若干样本单位, 构成样本。 先排队,再计算抽样间隔d,然后等距抽样。 特点:保证样本单位在总体中均匀分布,从而 提高了样本对总体的代表性,利于降低抽样 误差。 适用对总体有一定认识的情况。 按排队依据的标志是否与所要调查的标志关, 可分为无关标志排队法和有关标志排队法。
2016/6/16
31

纯随机抽样,即简单随机抽样,是指对总体 不作任何处理,不进行分类也不进行排队, 而是完全按照随机的原则,直接从总体全部 单位中抽选出样本单位加以观察。 具体方法有:直接抽选法、抽签法、随机数 字表述法 特点:总体每一个单位被抽到的机会均等,且 方便简单,易于掌握。 适用于总体单位的标志变异程度不大,或具有 某种特征的单位均匀地分布在总体的各个部 分,或对总体了解很少的情况。
相关文档
最新文档