《统计学》课件 第五章统计推断
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
z ) 1
2
/2
1-
/2
Hale Waihona Puke Baidu
n
p( x z
2
) 1 n
-z值
0
统计量 临界值
区间估计的图示
x z 2 x
- 2.58x -1.65 x
x
+1.65x + 2.58x
x
-1.96 x
+1.96x
90%的样本 95% 的样本 99% 的样本
原点矩存在,若不存在则无法估计;矩估计法不能充分地利 用估计时已掌握的有关总体分布形式的信息。
2.最大似然估计法
基本思想:当我们经一次抽样取得一些观测数据(样本值) 后,应给未知参数选取一些数值,使得所观测得到的样本值 出现的概率最大。
要求:知道总体分布类型。
注意:对于正态总体,两种方法所得的估计量在形式上是
点估计不考虑估计误差的大小,故不需确定估计量的概率分 布。点估计的主要作用是寻找参数的估计量。
按照构造统计量的方法不同,点估计有很多具体方 法,最经典的是矩估计法和最大似然估计法。
1.矩估计法 p142-145
概念:矩估计法是用样本矩来估计总体矩的方法,如 用样本一阶原点矩(样本均值)估计总体一阶原点 矩(总体均值)。 优点及缺点:矩估计法简便、直观;局限性:要求总体的阶
该食品平均重量的置信区间为101.44g~109.28g
2.总体均值的区间估计 p149
------正态总体的方差未知、小样本
1. 假定条件
总体服从正态分布,且方差(2) 未知 小样本 (n < 30)
x s n
2. 使用 t 分布统计量
t ~ t (n 1)
3. 总体均值 在1-置信水平下的置信区间为
区间估计时应考虑的一些具体问题
1.在概率意义下计算参数
q 的变化范围,即 P {qˆ1 #q
ˆ q2 = 1- a
}
2.区间估计中的两个基本要求:
3.Neyman原则 即在保证置信度的前提下,尽可能提高估计的精确度。
1.总体均值的区间估计(大样本)(p147)
1. 假定条件(重复抽样时)
2
n1
2
n 1 s 2
2 1 2
n1
自由度
总体方差的区间估计 例题分析
(五)单侧置信区间
p151
区间估计小结 p152
基本步骤:
(1)依题意确定待估参数;
(2)依题设条件构造与待估参数相对应的估计量;
(3)确定估计量的抽样分布;
(4)依估计量的抽样分布,由给定的置信度计算待 估参数置信区间的上、下限。
一致的。但对于其它的总体,两种方法所得的估计量在形式 上并不总是一致的。
(二)点估计量的评价标准 最基本的有三条 : 1、无偏性:E ( ) ,称 是
计量 。
的无偏估
2、有效性:一个具有较小变异的统计量的意义
在于将有更多的机会产生一个更接近于总体参数 的量。 3、一致性:随着样本容量的增大,点估计量的 值越来越接近被估计总体参数。
对置信区间的理解注意:
②总体参数是固定的、未知的,而用样本构造的区间则是不 固定的。若抽取不同的样本,用该方法可以可到不同的区 间,从这个意义上说置信区间是随机区间,会因样本的不 同而不同,而且不是所有的区间都包含总体参数的真值。 ③在实际问题中,进行估计时往往只抽取一个样本,此时所 构造的是与该样本相联系的一定置信水平(比如95%)下的 置信区间。由于用该样本所构造的区间是一个特定的区间 ,而不再是随机区间,所以无法知道这个样本所产生的区 间是否包含总体参数的真值。我们只能希望这个区间是大 量包含总体参数真值的区间中的一个,但它也可能是少数 几个不包含参数真值的区间中的一个。
统计学家在某种程度上确信这个区间会包含真正 的总体参数,所以给它取名为置信区间
对置信区间的理解注意:
① 如果用某种方法构造的所有区间中有95%的区间中包含
总体参数的真值,5%的区间不包含总体参数的真值,那么 用该方法构造的区间称为置信水平为95%的置信区间。同 理,其他置信水平的区间也可用类似的语言表述。
注意:一般将同时满足这三条标准的估计量称为优良估计量。
无偏性(unbiasedness)
无偏性:估计量抽样分布的数学期望等于被 估计的总体参数 ( E ( ) 即无系统偏差)
ˆ P( )
无偏 有偏
A
B
ˆ
有效性(efficiency)
有效性:对同一总体参数的两个无偏点估计 量,有更小方差的估计量更有效 。(在众多 无偏估计量中,称具有最小方差的估计量为 最佳无偏估计量。)
ˆ P( )
ˆ 1 的抽样分布
B A
ˆ 2
的抽样分布
ˆ
一致性(consistency)
一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数。
ˆ P( )
较大的样本容量
B A
较小的样本容量
ˆ
统计中的几个基本概念及表示符号
总体 样本
参数
第 五 章 统计推断
1
2
2014-1-1 版权所有 BY 统计学课程组 1
第五章 参数估计与假设检验
p140
第一节 第三节
总体参数估计 总体参数检验
2014-1-1
版权所有 BY lazhenx
2
学习目标
1.掌握估计量的优良标准 2.参数区间估计的思想与方法 3.参数假设检验的临界值法与P值法 4.一定条件下,样本容量确定的方法
总体服从正态分布,且方差(2) 已知或未知 如果不是正态分布,方差(2) 已知或者未知,大样本 可由正态分布来近似 (n 30)
边际误差
2. 使用正态分布统计量 z(标准化) x z ~ N (0,1) n 3. 总体均值 在1- 置信水平下的置信区间为
x zα 2
σ n
1.
ˆ P q1 #q
{
ˆ q2 = 1- a
}
置信区间
置信水平1-α
样本统计量 (点估计)
置信下限
置信上限
当总体服从正态分布N(μ,σ2)时,(σ2已知)来自该总体 的所有容量为n的样本的均值x也服从正态分布,x 的数 学期望为μ,方差为σ2/n 即x~N(μ,σ2/n) 置信水
平
p(
x
总体参数估计 p141
一、点估计 1.点估计的定义和分类 2.估计量的评价标准 二、区间估计 1.区间估计的含义 2.总体均值的区间估计 3.总体成数的区间估计 4.总体方差的区间估计 5.单侧置信区间 三、样本容量的确定
2014-1-1 版权所有 BY lazhenx 5
或 x zα 2
s n
( σ 未知 )
总体均值的区间估计------例题分析 p148
1.正态总体方差已知;或非正态总体但有大样本;或正态总 体方差未知但有大样本
2014-1-1
版权所有 BY lazhenx
24
总体均值的区间估计(例题分析)
【 例 】一家食品生产企业以生产袋装食品为主,为对产量质 量进行监测,企业质检部门经常要进行抽检,以分析每袋重 量是否符合要求。现从某天生产的一批食品中随机抽取了25 袋,测得每袋重量如下表所示。已知产品重量的分布服从正 态分布,且总体标准差为10g。试估计该批产品平均重量的置 信区间,置信水平为95%.
总体均值的区间估计(例题分析)
解:已知X~N(,102),n=25, 1- = 95%,z/2=1.96。根 据样本数据计算得: x 105.36 总体均值在1-置信水平下的置信区间为
x z
2
10 105.36 1.96 n 25 105.36 3.92 101.44,109.28
p(1 p) n 3. 总体比例在1-置信水平下的置信区间为
z
p
~ N (0,1)
p z 2
2014-1-1
(1 )
n
或 p z 2
p(1 - p) ( 未知时) n
29
版权所有 BY lazhenx
总体成数的区间估计----- 例题分析
p150
2014-1-1
版权所有 BY lazhenx
30
(四)总体方差的区间估计 p150
1. 估计一个总体的方差或标准差 2. 假设总体服从正态分布 3. 总体方差 2 的点估计量为S2,且
n 1s 2
2
4. 总体方差在1- 置信水平下的置信区间为
n 1 s 2
~ 2 n 1
2
25袋食品的重量 112.5 102.6 100.0 116.6 136.8 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105.0 93.3
三、 样本容量的确定
p152
一、问题的提出 二、处理问题的原则 三、简单随机抽样下,调查成本既定时样本容 量确定的方法 1. 估计总体均值时样本容量的确定
2. 估计总体比例时样本容量的确定
2014-1-1
版权所有 BY lazhenx
37
样本容量的确定
一、问题的提出
从推断来看,要达到估计所要求的精确程度,
区间估计的置信水平
1.
2.
将构造置信区间的步骤重复很多次,置信区间 包含总体参数真值的次数所占的比例称为置信 水平 表示为 (1 -
为是总体参数未在区间内的比例
相应的 为: 0.01,0.05,0.10 2.58, 1.96, 1.645 (记住)
3.
常用的置信水平值有 99%, 95%, 90%
重复抽样 x t
s
2
不重复抽样
X ? ta 2 (n 1)
n
S n
N- n N- 1
总体均值的区间估计-------例题分析 p149
2014-1-1
版权所有 BY lazhenx
28
(三)总体成数的区间估计 p149
1.
2.
假定条件(只讨论大样本情形)
可以由正态分布来近似
使用正态分布统计量 z
均值
标准差
统计量
x s
比例
p
x
s
2 n 1
为 的无偏、有效、一致估计量; 为 的无偏、有效、一致估计量
2
p 为 的无偏、有效、一致估计量。
二、区间估计(interval estimate) p146
在点估计的基础上,给出总体参数估计的一个区间范 围,该区间由样本统计量加减抽样误差而得到的 在概率意义下计算参数 q 的变化范围,即
第一节
总体参数估计
p141
参数估 计 方 法
点
估
计
矩估计法
区间估计
最大似然法 最小二乘法
注意:本节估计都是在简单随机重复抽样的条件下来讨论的。
一、点估计
参数估计按是否考虑估计误差的大小及发生的概率, 估计方法分为点估计和区间估计两大类。
(一))点估计的定义
例如:用样本均值直接作为总体均值的估计值; 例如:用两个样本均值之差直接作为总体均值之差的估计.
x
区间估计练习
一、假定容量n=100的一个随机样本 x 产生均值为81和标准差s=12。要求: ①构造总体均值95%置信水平下的置信区间; ②构造总体均值99% 置信水平下的置信区间。 二、一个容量为400的随机样本取自均值和标准差 均未知的总体。已经计算出下列值: 2 2280 xi =14592要求: xi ①构造总体均值95%置信水平下的置信区间; ②构造总体均值99%置信水平下的置信区间。 81±1.96×1.2 ;81±2.58×1.2 ;(5.7±1.96×2/20)
自然要求样本容量越大越好;但从抽样来看,
增大样本容量,势必增加人力、物力,从而导 致调查成本增大,这无疑是不经济的做法。于 是在抽样推断中,势必要在统计推断的精确度 与调查成本这一对矛盾间进行权衡。
2014-1-1
版权所有 BY lazhenx
3
重点与难点
1.参数区间估计的统计思想 2.估计的可靠程度、平均误差及极限误差的关 系 3.临界值检验法的统计思想 4.P值的计算方法及其含义的理解 5.参数检验中的两类错误及其关系
2014-1-1
版权所有 BY lazhenx
4
第一节
z 的值:
2
区间估计基本表达 (以估计
为例):
区间估计的数学表达方式:
ˆ 1 ˆ P L U
x P Z 2 Z 2 1 x
置信区间 (confidence interval)
样本统计量所构造的总体参数的估计区间称为置信区间.