第5章统计推断:参数估计

合集下载

统计推断-参数估计

统计推断-参数估计
利用t分布构建的总体均值的(1-α)%置信区间公式如下:
t(1-a/2,df):t的分位值, 决定于置信度和自由度,可通 过查表得到。
19
利用t分布构建总体均值的置信区间
电阻的电阻值服从正态分布,抽取了10个电阻值的观察 值如下:
电阻值 608 630 610 636 637 610 626 602 604 636
n
Z的分位值,决定于置信度 当置信度为95%时,Z的 0.975的分位值为1.96
应用以上公式的前提条件为:
总体σ已知,或者 大样本(n≥30)
16
学生t分布
定义
设x1,x2…xn是来自正态总体N (, 2 )的一个样本, x 和S为样
本均值和标准差,则:
t x ~ t(n 1)
2
(n 1)s2
2
~
2 (n 1)
2 (n 1) 表示为自由度为(n-1)的卡方分布,卡方分布有以下特
点:
非负非对称分布
21
卡方分布
利用卡方分布构建的总体方差(1-a)%置信区间公式如下:
(n 1)s2
2 (1 / 2, df
)
2
(n 1)s2
2 ( / 2, df
)
卡方的分位值可通过 查表得到.
代表性:所抽取样本能够代表所要研究的总体 随机性:总体中每一个个体都有相等的机会被选中 独立性:样本中一个个体被选中不影响另外一个个体被选中
的可能性
10
抽样分布
因为统计量从样本到样本是变化的,所以根据统计量 作出的任何推断必定带有不确定性,但这种不确定性 是有规律可循的,这种规律就体现在抽样分布中。
x
2 x
2
n
x

第5章--抽样分布与参数估计教案资料

第5章--抽样分布与参数估计教案资料

(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是 ,标准差是 ,从这个总体中抽出一 个容量是 n 的样本,则样本平均数 X 也服从 正态分布,其平均数 E( X ) 仍为 ,其标准
差为 。 X 5-19
从正态分布的再生定理可以看出,只要总体 变量服从正态分布,则从中抽取的样本,不管n 是多少,样本平均数都服从正态分布。但是在 客观实际中,总体并非都是正态分布。对于从 非正态分布的总体中抽取的样本平均数的分布 问题,需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节 抽样的基本概念与数学原理
一、有关抽样的基本概念 二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
(一)样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合,这个集合的大小称为样本容量, 一般用n表示,它表明一个样本中所包含的单 位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明:尽管个别现象受偶然因 素影响,有各自不同的表现。但是,对总体 的大量观察后进行平均,就能使偶然因素的 影响相互抵消,消除由个别偶然因素引起的 极端性影响,从而使总体平均数稳定下来, 反映出事物变化的一般规律。

统计推断与参数估计方法

统计推断与参数估计方法

统计推断与参数估计方法统计推断是统计学中的一个重要分支,它的目标是通过对样本数据进行分析和推断,从而对总体进行推断和做出统计决策。

参数估计是统计推断的核心内容之一,它涉及到对总体的参数进行估计和推断。

本文将介绍统计推断的概念、方法以及参数估计的原理和常见方法。

一、统计推断概述统计推断是通过样本信息对总体进行推断的一种方法。

在现实生活中,很难获得总体数据,因此我们通常通过抽样来获取样本数据,然后根据样本数据对总体进行推断和做出统计判断。

统计推断可以分为两大类:参数推断和非参数推断。

参数推断是基于总体分布的假设,利用样本数据对总体参数进行推断。

非参数推断则不对总体分布做出假设,通过样本数据对总体分布进行推断。

二、参数估计原理参数估计是统计推断的一种重要方法,它的目标是通过样本数据对总体参数进行估计。

参数估计的核心思想是通过样本数据得到一个估计量,使得估计量与总体参数值尽可能接近。

常用的参数估计方法有最大似然估计、矩估计和贝叶斯估计等。

最大似然估计是根据样本数据的含量,通过计算总体参数最可能出现的取值,来估计总体参数值。

矩估计是通过样本矩的函数与总体矩的函数相等来估计总体参数值。

贝叶斯估计则是利用贝叶斯定理,根据已有信息和先验概率对总体参数进行估计。

三、常用的参数估计方法1. 最大似然估计最大似然估计是参数估计中最常用的方法之一。

最大似然估计的核心思想是选取一组参数值,使得给定样本数据出现的可能性最大。

最大似然估计可以简化为求解似然函数的最大值所对应的参数值。

2. 矩估计矩估计是通过样本矩的函数与总体矩的函数相等来进行参数估计。

矩估计的基本思想是利用样本矩估计总体矩,然后通过总体矩的函数得到对总体参数的估计。

3. 贝叶斯估计贝叶斯估计是基于贝叶斯定理的一种参数估计方法。

贝叶斯估计将参数估计问题转化为给定样本数据下参数的后验分布的估计问题。

通过引入先验分布和似然函数,可以得到对总体参数的估计。

四、参数估计的应用参数估计在各个领域中都有广泛的应用。

第五章 统计推断(1)

第五章 统计推断(1)
2检验是根据s判断抽出该样本的总体 其标准差是否等于
某一给定值。
检验程序:
(a) 确定假设H 0和H A: H 0:= 0;H A 有三种可能的形式: ( 1 ) 0 (2) 0 (若已知不可能小于 0 ) (3) 0 (若已知不可能大于 0 )
(b)计算检验的统计量:
1. 单个样本平均数检验
在实际研究中,常常要 检验一个样本平均数 x与已知的总体 平均数0是否有显著差异,即检 验该样本是否来自某一 已知 的总体。
已知的总体平均数一般 为一些公认的理论数值 。如畜禽正常 的生理指标、怀孕期、 生产性能指标等,都可 以样本平均数 与之比较,检验差异显 著性。
1.1 在σ已知的情况下,单个平均数的显著性 检验-u检验 检验程序:
• 两类错误之间的关系如何?
二者的区别是I型错误只有在否定H0的情况下发生,而 II型错误只有在接受H0时才会发生。 二者的联系是,在样本容量相同的情况下,I型错误减 小,II型错误就会增大;反之II型错误减小,I型错误就 会增大。比如,将显著性水平α从0.05提高到0.01,就 更容易接受H0,因此犯I型错误的概率就减小,但相应 地增加了犯II型错误的概率。
第一节 假设检验的基本步骤及原理
1. 假设检验的基本步骤
我们通过一个例子来介绍假设检验的基本步骤:
例一,已知某品种玉米 单穗重X ~ N (300,9.52 ),即单穗重 总体平均数0 300g,标准差 9.5 g。在种植过程中喷洒 了某种药剂的植株中随 机抽取9个果穗,测得平均单穗 重 x 308g,试问这种药剂对该品 种玉米的平均单穗重 有无真实影响?
• (一)提出假设
首先对样本所在的总体 作一假设。假设喷洒了 药剂的玉米单穗重 总体平均数与原来的玉米单穗重总 体平均数0之间没有真实差异, 即=0。也就是说表面差异( x 0)是由抽样误差造成的 。

第五章统计推断

第五章统计推断
2014-8-16 版权所有 BY 统计学课程组 32
一、假设检验的一般性问题(6)

(三) 单、双侧检验问题
2014-8-16
版权所有 BY 统计学课程组
33
一、假设检验的一般性问题(7)
(四)假设检验中的两类错误
2014-8-16
版权所有 BY 统计学课程组
34
一、假设检验的一般性问题(8)
2014-8-16 版权所有 BY 统计学课程组 6
一、点估计


总体的参数估计按是否考虑估计误差及发生概率的大小, 可分为点估计和区间估计两大类。 1.点估计的定义和分类

点估计不考虑估计误差的大小,故不需确定估计量的概 率分布。点估计的基本方法包括矩估计法和最大似然估 计法,其主要作用是寻找参数的最佳估计量。
9

(2)有效性
2014-8-16
版权所有 BY 统计学课程组
10

(3)一致性 (相合性)
2014-8-16
版权所有 BY 统计学课程组
11
二、区间估计(1)


1.区间估计的含义
ˆ #q 1 在概率意义下计算参数 q 的变化范围,即 P {q ˆ = 1- a q 2
}

2014-8-16
版权所有 BY 统计学课程组
16
二、区间估计(6)--总体成数的区间估计

只讨论大样本情形
2014-8-16
版权所有 BY 统计学课程组
17
二、区间估计(7)--总体方差的区间估计
2014-8-16
版权所有 BY 统计学课程组
18
二、区间估计(8)--单侧置信区间
2014-8-16

第五章 参数估计

第五章 参数估计
(总体方差未知时,以样本方差代替)
1
X 2 t n1 n2 2
2
2 Sp
n1
n2
X
1
X 2 z
2
2 S12 S 2 n1 n2
2 Sp
2 2 n1 1S1 n2 1S 2
n1 n2 2
20
例题:

分别在城市1和城市2中随机抽取n1=400, n2=500的职工进行调查,经计算两城市职工的 平均月收入及标准差分别为X1=1650元,
22
思考题:

一个研究机构做了一项调查,以确定稳定的吸 烟者每周在香烟上的消费额。他们抽取49位固 定的吸烟者,发现均值为20元,标准差5元。
1.总体均值的点估计是多少?
2.总体均值μ的95%置信区间是什么?
23
思考题解答:
1.总体均值的点估计是20元。
2.总体均值μ的95%置信区间: 随机变量X表示每周香烟消费额,由题意可知,X=20, S=5,1-α=0.95,α=0.05;n=49 属于大样本,σ 未知以S估计。总体均值μ的95%置信区间为
P z Z z 1 2 2
P L U 1
X P z z 1 2 2 n
Step3:将上面等式进行等价变换即可。
P L U 1
第五章 参数估计
第五章 参数估计

利用样本数据对总体特征进行推断,通常在以下 两种情况下进行:

当总体分布类型已知(如:正态),根据样本数据对 总体分布的未知参数进行估计或检验。参数估 计或参数检验。(如:μ或σ为何?) 当总体分布类型未知或知道很少,根据样本数据 对总体的未知分布的形状或特征进行推断。非参 数检验。(如:是否正态分布?是否随机?)

第05章 统计推断

第05章  统计推断

单侧检验 α=0.05或0.01 统计推断 第五章
§5.1 单个样本的统计假设检验
5.1.2 单个样本的显著性检验程序
统计假设检验的三步曲: 1、建立零假设(null hypothesis)——假设差异不显著或无关; 2、计算统计量(u-检验,t-检验,x2-检验,F-检验);
3、判断假设。 对于带备择假设的零假设:需根据备择假设的拒
F
s , df n 1, df n 1 s
下侧临界点F1-α的 值,按右式计算
解释: F< F0.05,或P>0.05,接受H0; F> F0.05,或P<0.05,拒 Fdf1,df2,α,df 1附表7中没有给出 df 2为分母自由度 为分子自由度, 1 绝H0, ② F < F 1-α
s ③HA:μ≠μ0,包括μ>μ0和μ<μ0 此时相应各备择假设的H0的拒绝域分别为:
①t > tα解释: t<t0.05,接受H0; t>t0.05,拒绝H0 ②t < -tα ③|t| > tα/2,或表示为|t| > tα(两侧)
t n 1
n
第五章 统计推断
§5.1 单个样本的统计假设检验
379.2 377.2 u 1.82 3. 3 n 9 由于u 1.82 u0.05 1.645 ,所以拒绝H0假设、接受HA。
即栽培条件的改善显著地提高了豌豆籽粒重量。
x 0
第五章 统计推断
§5.1 单个样本的统计假设检验
5.1.4 σ未知时平均数的显著性检验——t 检验(t-test) 检验的程序: (1)零假设H0:μ=μ0 备择假设:①HA:μ>μ0,若已知μ不可能小于μ0 (2)计算统计量: x 0 (3)判断统计量: ②HA:μ<μ0,若已知μ不可能大于μ0

第5章 抽样推断

第5章 抽样推断

名称
符号
总体容量
N
总体平均数
X
总体方差
2
总体标准差
总体成数
P
样本统计量
名称
符号
n 样本容量
样本平均数 x
样本方差
s2
样本标准差 s
样本成数 p
第一节 抽样推断
★ 一、抽样推断的意义和一般步骤 ★ 二、总体参数与样本统计量 ★ 三、抽样框与样本数
四、概率抽样与非概率抽样
三、抽样框与样本数
㈠ 抽样框 ㈡ 抽样方法 ㈢ 抽样组织方式 ㈣ 样本数和样本容量
⒈ 总体平均数(总体i
X i1 N
或X
i 1 m
Fi
i 1
⒉ 总体标准差:
1 N
N i 1
Xi X
2或
1m
2
m
X i X Fi
Fi i1
i 1
⒊ 总体方差:
2 1
N
N i 1
Xi X
2或 2
1
m
Fi
m i 1
2
X i X Fi
为 2的无偏估计
m i1
1m fi 1 i1
2
xi x fi
⒋ 样本成数:
p n1 , q n0 1 p
n
n
⒌ 样本单位是非标志的标准差:
为 P 的
无偏估计
sp
n p1 p
n 1
n pq n 1
⒍ 样本单位是非标志的方差:
sp2
n n 1
p1
p
n n 1
pq

2 P

无偏估计
总体参数
居民一组 居民二组…
在某个住宅小区

第5章 参数估计

第5章 参数估计

猎物射击,结果该猎物身中一弹,你认为谁打中的可能
性最大? 根据经验而断:老猎人打中猎物的可能性最大. 极大似然估计法的思想就是对固定的样本值,选
择待估参数的估计值使“样本取样本值”[离散型]或 “样
本取值落在样本值附近”[连续型] 的概率最大。
(2、极大似然估计的求法
单参数情形
根据总体分 布律写出似 然函数:换x 为xi
来得到待估参数θ 的极大似然估计值(驻点);
③ 、必要时,参照极大似然估计值写出极大似然
估计量.
【例6】求服从二项分布B(m,p)的总体X未知参数 p的极大似然估计量。 〖解〗单参数,离散型。 因为总体 X
~ B(m, p),
x m x
其分布律为
m x
f ( x; p) C p (1 p)
下面分离散型与连续型总体来讨论. 设离散型总体X的分布律
P{X x} p( x; )
( )
形式已知,θ 为待估参数. X 1 , X 2 ,..., X n 为来自总体X的
样本, x1 , x2 ,..., xn 为其样本值,则 X 1 , X 2 ,..., X n 的联合分
布律为:
用其观察值
ˆ( X , X ,..., X ), 1 2 n
——θ 的估计量
ˆ( x , x ,..., x ) 1 2 n
——θ 的估计值
来估计未知参数θ .
今后,不再区分估计量和估计值而统称为θ 的估计,
ˆ . 均记为
二、构造估计量的两种方法
1、矩估计法 理论根据:样本矩(的连续函数)依概率收敛于总
因为X~N(μ ,σ 2),所以X总体的概率密度为
2 1 (x ) 2 f ( x; , ) exp ( R, 0) 2 2 2

第5章 参数估计及点估计

第5章 参数估计及点估计

第5章参数估计及点估计5.1考点归纳一、点估计1.矩估计法(1)定义设X为连续型随机变量,其概率密度为,或X为离散型随机变量,其分布律为,其中为待估参数,,,,是来自X的样本,假设总体X的前k阶矩或(X离散型)存在,其中,=1,2,…,k.一般来说,它们是的函数,基于样本矩依概率收敛于相应的总体矩(=1,2,,k),样本矩的连续函数依概率收敛于相应的总体矩的连续函数,我们就用样本矩作为相应的总体矩的估计量,而以样本矩的连续函数作为相应的总体矩的连续函数的估计量,这种估计方法称为矩估计法.(2)矩估计法的具体做法设这是一个包含k个未知参数的联立方程组,一般来说,可以从中解出,得到以分别代替上式中的,i=1,2,…,k,就以,i=1,2,…,k,分别作为,=1,2,…,k的估计量,这种估计量称为矩估计量,矩估计量的观察值称为矩估计值.2.克拉默-拉奥(Cramer-Rao)不等式(1)克拉默一拉奥不等式克拉默一拉奥不等式设ξ1,ξ2,…,ξn为取自具有概率函数f(x;0),θ∈Θ={θ:a<0<b}的母体ξ的一个子样,a,b为已知常数,a可以取-∞,b可以取+∞。

又η=u(ξ1,ξ2,…,ξn)是g(θ)的一个无偏估计,且满足正则条件:①集合{x:f(x;0)>0}与0无关;②与存在,且对一切θ∈Θ,;③令称为信息量,则等式成立的充要条件为存在一个不依赖于但可能依赖于θ的K,使得等式依概率1成立。

特别当g(θ)=θ时,上式可化为:称它为克拉默—拉奥不等式。

也称为信息不等式。

(2)重要性质及定义①性质:若则②定义a.若θ的一个无偏估计使克拉默一拉奥不等式中等式:成立,则称的有效估计。

b.若的一个无偏估计,且克拉默一拉奥不等式下界存在,则称下界与的比为估计的有效率,这里。

c.若当时,一个估计的有效率则称为参数的渐近有效估计。

3.拉奥-勃拉克维尔(Rao-Blackwell)定理(1)拉奥-勃拉克维尔定理设ξ与η是两个随机变量,且Eη=μ,Dη>0.设ξ=x条件下叼的条件期望,则(2)相关定理设ξ1,ξ2,…,ξn是取自一个母体ξ的子样,ξ有概率函数,且是θ的一个充分统计量,不仅是η的函数,且Eη2=θ,则是θ的充分统计量的函数,其均值=0,方差。

第5章 统计推断

第5章 统计推断

第 5 章 统计推断5.1 统计推断概述统计推断就是利用样本的数据,对总体的数量特征作出具有一定可靠程度的估计和判断。

统计推断的基本内容有参数估计和假设检验两方面。

概括地来讲,参数估计是指研究一个随机变量,推断它的数量特征和变动模式。

而假设检验是检验随机变量的数量特征和变动模式是否符合我们事先所作的假设。

参数估计和假设检验的共同特点是它们对总体都不很了解,都是利用部分样本所提供的信息对总体的数量特征作出估计或判断。

所以,统计推断的过程必定伴有某种程度的不确定性,需要用概率来表示其可靠程度,这是统计推断的一个重要特点。

5.1.1 参数估计参数估计是以样本统计量作为未知总体参数的估计量,并通过对样本各单位的实际观察取得样本数据,计算样本统计量的取值,把它作为总体参数的估计量。

参数估计包括点估计和区间估计。

点估计是直接以样本统计量作为相应总体参数的估计量。

例如,用样本均值作为总体均值的点估计量,用样本方差作为总体方差的点估计量。

点估计的优点在于它能提供总体参数的的具体估计值,可以直接作为决策的数量依据。

但是,点估计事实上几乎不可能做到完全准确,更谈不上有多大的置信度。

而区间估计是估计总体参数以某种概率保证程度(置信度)落入某一区间,这样就有把握多了。

对总体被估计参数θ作区间估计,就是要给出区间的下限1ˆθ和上限2ˆθ,使被估计参数落在(1ˆθ,2ˆθ)内的概率为1α−,即 12ˆˆ()1P θθθα≤≤=− 其中,1α−就是置信度,α被称为显著性水平,如图 5-1。

ˆθ12图 5-1 区间估计在SPSS 中没有专门的参数估计命令。

参数的点估计值可以在Descriptives 命令中得到,例如用统计量mean 作为总体均值的点估计,用统计量variance 作为总体方差的点估计等。

参数的区间估计可以通过Explore 命令得到(参见4.4节的内容),也可以在各种假设检验的过程中可以得到(参见本节后面的内容)。

第五章参数估计

第五章参数估计
第五章
参数估计基础
抽样研究的目的就是要用样本信息来推断相应总 抽样研究的目的就是要用样本信息来推断相应总 体的特征,这一过程称为统计推断。 体的特征,
统计推断包括: 统计推断包括:参数估计和假设检验
在用样本信息来推断相应总体特征 的过程中总是存在误差 误差--的过程中总是存在误差 抽样误差。
抽样误差: 抽样误差: 由个体变异产生的、由于抽样而造成的样 个体变异产生的、由于抽样 抽样而造成的样 产生的 本统计量与样本统计量及样本统计量与总体参 数之间的差异称为抽样误差。 数之间的差异称为抽样误差。
3、置信区间的计算
X ± zα / 2σ X
X± X± Zα / 2SX
X ± tα / 2,ν sX
3、置信区间的计算
(1)σ已知,按标准正态分布原理计算 已知,
通式: 通式: X
± zα / 2σ X
(双侧) 双侧)
为标准正态变量, 相当于按ν=∞时及P ν=∞时及 Zа/2为标准正态变量,Zа/2相当于按ν=∞时及P取α,由附 查的的t界值。 表2查的的t界值。 95%的双侧置信区间: 的双侧置信区间: 的双侧置信区间 99%的双侧置信区间: 的双侧置信区间: 的双侧置信区间
(二)频率的抽样分布
从总体中随机抽取若干样本, 从总体中随机抽取若干样本,计算出样 本频率, 本频率,这些频率的分布即为频率的抽样分 布。也是抽样分布的一种。 也是抽样分布的一种。 频率的抽样分布也有一定的规律。 频率的抽样分布也有一定的规律。 p72:表5-3 :
频率的抽样分布: 频率的抽样分布: 1.样本频率服从正态分布: 样本频率服从正态分布: 样本频率服从正态分布 Nπ,n(1-π)≥5时 ( ) 时
(X −1.96σX, X + 1.96σX ) (X − 2.58σX, X + 2.58σX )

参数估计

参数估计

~ N (0,1)
ˆ Z 2 p
ˆ (1 p ˆ) p n
27
总体比例的置信区间:例子
1986年对悉尼995 名青少年的随机调 查发现,有21.7% 的人每天都抽烟。 试估计悉尼青少年 中每天都抽烟的青 少年比例的90%的 置信区间。
ˆ 5, n(1 p ˆ) 5 解:显然有 np 因此可以用正态分布进行估计。 Z/2=1.645
L U
P( ˆ ˆ ) 1
L U
ˆ , ˆ )就称为未知总体参数的置信区间。 成立,则该区间 (
L U
21
二、总体均 值的区间估 计 σ2已知?


2
是 总体正态?

n≥30? 否 是 否
x Z
n
x t
s
2
n
x Z 2

n
增大n; 非参数 方法等。
实际中总体方差总是未知的, 因而这是应用最多的公式。在 大样本时t值可以用z值来近似。
n 1)s

2

2
~ n 1)
2
总体方差在置信水平1-α下的置信区间为:
n 1)s 2 2 2 n 1)
2
n 1)s 2 1 2 n 1)
2
29
•总体方差的区间估计:例子
检验一批电子元件,共抽取了10件检验,电子元 件使用寿命的样本方差为8175.56,试在95%的 置信概率下对该批产品使用寿命的方差和标准差 进行区间估计。 解:电子元件的使用寿命可看作服从正态分布,根 据正态总体方差置信区间的公式,可得该批电子 元件使用寿命的方差的置信区间为:
(n 1)
19
5.3 区间估计

卫生统计学七版 第五章参数估计基础

卫生统计学七版 第五章参数估计基础

二、总体均数及总体概率的区间估计
(一)总体均数的置信区间
1、t 分布法
当 未知且 n 较小时,估计双侧置信 区间:
(X
-t
,
s X
,
X
t ,
s X
)
可简写为:
X
t ,
s X
或X t,
s n
总体均数的95%双侧置信区间为:X
t0.05,
s X
例5-2(P95) 已知某地27名健康成年男子血红蛋白 含量的均数为125g/L,标准差为15g/L,试估计该地健康 成年男子血红蛋白平均含量的95%和99%置信区间 。
二项分布 n 31 X 25 n X 6 查附表6,得7 37 改错
该药物治疗脑血管梗塞有效概率的95%置信区间为 63%~93%。
2、正态近似法 适用范围:np>5,且n(1-p)> 5
例5-6(P96) 用某种仪器检查已确诊的乳腺癌患者 120名,检出乳腺癌患者94例,检出率为78.3%,试估计该 仪器乳腺癌总体检出率的95%置信区间。 np 1200.783 93.96 n(1 p) 1200.217 26.04
第三节 总体均数及总体概率的估计
一、参数估计的基础理论
参数估计区 点间 估估 计计
对总体参数估计的范围称为置信区间,用CI(confidence interval)
表示,其置信度为(1 ),一般取置信度为95%,即取为0.05,此区
间的较小值称为置信下限,较大值称为置信上限。一般进行双侧置信区 间的估计。
第五章 参数估计基础
公共卫生学院 邹焰

定量资料

统计描述等级资料(有序分类资 料)

第五章 统计推断

第五章 统计推断

2019/4/2
22
本章习题
3. 某种产品生产过程设计规格为每批平均生产 120 个,超过或低于这个标准都是不合理的。有10批 产品组成的样本中,每批生产的产品数量如下: 108 118 120 122 119 113 124 122 120 123。 检验样本结果能否表示该生产过程运作正常? (假定总体服从正态分布,α=0.05。)
6
1、假设检验问题
【例5.1】 在超市上出售的某种品牌方便面,按规定每
包净重少于 100 克的比例不得超过 1%。技术监督部门 从某超市的货架上任意抽取 200包该种品牌的方便面, 经检验发现有 3包(1.5%)重量少于 100克,试问:超 市出售的这种方便面是否符合质量标准?
在本例中,超市上出售的这种方便面的不合格率是未 知的,我们关心的问题是:如何根据这 200 包方便面 (样本)的不合格率 p=1.5% 来判断超市上出售的这种 品牌的方便面(总体)的不合格率 P≤1% 是否成立?
并非因为它存在逻辑的绝对错误,只是因为它存
在的可能性很小。
2019/4/2 14
6、假设检验的一般步骤
( 1 )根据所研究的问题,提出原假设 H0 和备择 假设H1;
(2)构造检验统计量;
( 3 )计算检验统计量的值和检验统计量观测值 发生的概率; (4)给定显著性水平α(即发生第一类错误的最 大允许概率),并做出统计决策。
2019/4/2
15
5.2 单样本 t 检验
单样本的 T 检验,是一个正态总体在方差未知时,总体 均值与某一已知数是否有显著性差异的假设检验;检验 统计量为(该统计量服从自由度为n-1的t分布):
t
x 0 s/ n
x 0

第五章统计推断:参数估计

第五章统计推断:参数估计
112.5 102.6 100.0 116.6 136.8 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105.0 93.3
2 2 (n 1) 0 ) 39.364 .025(24
45
【例】根据以往 的生产统计,某 种产品的合格率 约为 90% ,现要 求边际误差为 5%,在求95%的 置信区间时,应 抽取多少个产品 作为样本?
应抽取的样本容量为
n0
n0 0.05 N
n0 n n0
n0 n n0 1 N
53
2016年4月28日星期四
2016年4月28日星期四
112.5 102.6 100.0 116.6 136.8
101.0 107.5 123.5 95.4 102.8
103.0 95.0 102.0 97.8 101.5
102.0 108.8 101.6 108.6 98.4
100.5 115.6 102.2 105.0 93.3
【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中 随机抽取 16 只,测得其使用寿命 ( 小时 ) 如下。建立该批灯泡 平均使用寿命95%的置信区间
1510 1450 1480 1460
1520 1480 1490 1460
1480 1510 1530 1470
1500 1520 1510 1470
【例】一家食品生产企业以生产袋装食品为主,现从某 天生产的一批食品中随机抽取了 25袋,测得每袋重量如 下表7所示。已知产品重量的分布服从正态分布。以95% 的置信水平建立该种食品重量方差的置信区间

第五章 统计推断

第五章   统计推断

为研究电渗处理对草莓果实中钙离子含量的影响, 选用10个草莓品种来进行电渗处理与对照的对比试验, 结果如下,问电渗处理对草莓钙离子含量是否有影响?
电渗处理草莓果实钙离子含量
品种号
1
2
3
4
5
6
7
8
910电渗ຫໍສະໝຸດ 理22.2323.42
23.25
21.38
24.45
22.42
24.37
21.75
19.82
三,假设测验的基本方法 ①对所研究的总体首先提出一个无效假设 ②规定测验的显著水平α(一般α=0.05有时α=0.01) ③在承认上述无效假设正确的前提下,获得平均数的抽样分布,计 算假设正确的概率 ④根据"小概率事件实际上不可能发生"的原理接受或否定无效假 设 如小麦品种 旧品种:0=300kg/亩 σ=75kg 新品种:1=330kg/亩 y=330kg 第一步:首先提出假设: HA:1≠0 第二步:平均数的抽样分布,计算概率: = 15 ( kg ) σ y = σ / n = 75 / 25 样本容量n=25 H0:1=0=300kg
135.2
135.2
133.5
(二),成对资料平均数的假设测验
若试验设计是将性质相同 若试验设计是将性质相同的两个供试单位配成一对, 性质相同的两个供试单位配成一对 配成一对, 并设多个配对,然后对每一配对的两个供试单位分别随机 成对数据. 地给予不同处理,所得的观察值为成对数据 地给予不同处理,所得的观察值为成对数据.
1.提出假设.H0:1-2=0,即两条生产线的平均日产量无显著 差异.对HA:1-2≠0,即两条生产线上的平均日产量有显著差 异. 2.确定显著水平.α=0.01. .确定显著水平.α 0.01. 3.检验计算. y1 = 65 . 83 S 2 = 59.7299 y 2 = 59 .77 S 2 2 = 42.8747

第五章统计推断ppt课件

第五章统计推断ppt课件

假设检验的基本思想
这个值不像我 们应该得到的 样本均值 ...
1200
抽样分布
100
... 因此我们拒绝
假设 =2000
... 如果这是总 体的真实均值
= 2000小时 样本均值 H0
(三) 假设检验单、双侧检验问题: ①提出假设
原假设,H0 : = μ0 ,(或 、 ,原假设的对立面称备
版权所有 BY 统计学课程组
42
假设检验的统计思想小结
1)假设检验的基本思想:通过提出假设,利用 “小概率原理”和“概率反证法”,论证假设 的真伪的一种统计分析方法。
小概率原理:也就是实际推断原理,它认为在 一次实验中,概率很小的事件,实际上是不可 能发生的。
概率反证法:如果在其他因素给定的前提下, 要证明某一事实(对总体参数假定)是否成立, 只要假设该事实(参数假定)成立,在该事实
第一节 总体参数估计
一、点估计 1.点估计的定义 2.点估计量的优良标准 二、区间估计 1.区间估计的定义 2.总体均值的区间估计
2019/11/16
版权所有 BY 统计学课程组
5
一、点估计
1.参数估计按是否考虑估计误差的大小及发生的概率,估计方法分为点估 计和区间估计两大类。
根据上述例子,区间估计的步骤可归纳为: (1)依题意确定待估参数; (2)依题设条件构造与待估参数相对应的估
计量; (3)确定估计量的抽样分布; (4)依估计量的抽样分布,由给定的置信度
计算待估参数置信区间的上、下限。
2019/11/16
版权所有 BY 统计学课程组
29
x
区间估计练习
一、假定容量n=100的一个随机样本
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章 参数估计



第一节 第二节 第三节 第四节
参数估计的基本原理 一个总体参数的区间估计 两个总体参数的区间估计 样本容量的确定
学习目标
1.
2. 3. 4. 5. 6.
估计量与估计值的概念 点估计与区间估计的区别 评价估计量优良性的标准 一个总体参数的区间估计方法 两个总体参数的区间估计方法 样本容量的确定方法
25袋食品的重量
112.5
102.6 100.0 116.6 136.8
101.0
107.5 123.5 95.4 102.8
103.0
95.0 102.0 97.8 101.5
102.0
108.8 101.6 108.6 98.4
100.5
115.6 102.2 105.0 93.3
总体均值的区间估计
总体方差的区间估计
总体方差的区间估计

3.
1. 估计一个总体的方差或标准差 2. 假设总体服从正态分布 总体方差 2 的点估计量为S2,且
n 1S 2
2
4. 总体方差在1-置信水平下的置信区间为
~ 2 n 1
n 1S 2 2 n 1S 2 2 2 2 n 1 1 2 n 1
2015年7月23日星期四
6
一个总体参数的估计
总体参数 均值 比例 方差 符号表示 样本统计量
X
x p
S2
P 2
2015年7月23日星期四
7
二、点估计与区间估计
估 计 方 法
点 估 计
矩估计法 顺序统计量法 最大似然法 最小二乘法
区间估计
2015年7月23日星期四
8
点估计
(point estimate)
1.
2015年7月23日星期四
9
区间估计
(interval estimate)
1.
在点估计的基础上,给出总体参数估计的一个区间 范围,该区间由样本统计量加减抽样误差而得到的 根据样本统计量的抽样分布能够对样本统计量与总 体参数的接近程度给出一个概率度量

2.
比如,某班级平均分数在75~85之间,置信水平是95%
总体方差的区间估计
(例题分析)
解 : 已 知 n = 25 , 1- = 95% , 根 据 样 本 数 据 计 算 得 s2 =93.21 2 (n 1) 02.025 (24) 39.364 12 (n 1) 02.975 (24) 12.401
X z 2

n
或 X z 2
S n
( 未知)
总体均值的区间估计
(例题分析)
【例】一家保险公司收集到由 36位投保个人组成的随机样本, 并得到每个投保人的年龄 ( 周岁 ) 数据如下表。试建立投保人 年龄90%的置信区间
36个投保人年龄的数据
23
36 42 34 39 34
35
42 53 28 49 39
置信区间
样本统计量 (点估计)
置信下限
置信上限
区间估计的图示
X z 2 X
- 2.58x -1.65 x
X

+1.65x + 2.58x
X
-1.96 x
+1.96x
90%的样本 95% 的样本 99% 的样本
置信水平
1.
2.
将构造置信区间的步骤重复很多次,置 信区间包含总体参数真值的次数所占的 比例称为置信水平 表示为 (1 -
2015年7月23日星期四
17
无偏性
(unbiasedness)

无偏性:估计量(随机变量)的数学期望等于被估计的总体参 数

中心极限定理证明了:样本平均数和样本成数都满足无偏 性 ˆ) P( E ( p) P
E( x ) X
ˆ B
1
ˆ
A
无偏
有偏
2
总体参数
2015年7月23日星期四 18
25袋食品的重量 112.5 102.6 100.0 116.6 136.8 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105.0 93.3
t X S n ~ t (n 1)
2.
使用 t 分布统计量
3. 总体均值 在1-置信水平下的置信区间为 S X t 2 n
t 分布
分布是类似正态分布的一种对称分布,它通常要比正 态分布平坦和分散。一个特定的分布依赖于称之为 自由度的参数。随着自由度的增大,分布也逐渐趋 于正态分布
标准正态分布
标准正态分布
t (df = 13)
t 分布
t (df = 5)
Z
X
t 分布与标准正态分布的比较
t 不同自由度的t分布
总体均值的区间估计
(例题分析)
【例】一家食品生产企业以生产袋装食品为主,为对产量质 量进行监测,企业质检部门经常要进行抽检,以分析每袋重 量是否符合要求。现从某天生产的一批食品中随机抽取了 25 袋,测得每袋重量如下表所示。已知产品重量的分布服从正 态分布,且总体标准差为10克。试估计该批产品平均重量的 置信区间,置信水平为95%
(例题分析)
解:已知X~N(,102),n=25, 1- = 95%,z/2=1.96。根 据样本数据计算得:x 105.36 总体均值在1-置信水平下的置信区间为
n 105.36 3.92
x z

2
105.36 1.96
10 25
101.44,109.28

ˆ
有效性
(efficiency)
有效性:对同一总体参数的两个无偏点估计量,有更小 标准差的估计量更有效
ˆ) P(
ˆ1 的抽样分布
B A
ˆ2
的抽样分布
样本平均 数比中位 数更有效

2015年7月23日星期四 19
ˆ
一致性
(consistency)

一致性:随着样本容量的增大,估计量的值越来越接 近被估计的总体参数 大数定律已经证明了:样本平均数和样本成数都满足 一致性
做法:用样本估计量的值直接作为总体参数的 估计值 例:用样本均值直接作为总体均值的估计; 用样本成数直接作为总体成数的估计 例:用两个样本均值之差直接作为总体均 值之差的估计 2. 缺点:没有考虑抽样误差的大小;没有给出估 计值接近总体参数的程度 3. 点估计的方法有矩估计法、顺序统计量法、最 大似然法、最小二乘法等
参数估计在统计方法中的地位
统计方法
描述统计 推断统计
参数估计
假设检验
统计推断的过程
总体
样 本
样本统计量
例如:样本均 值、比例、方 差
第一节 参数估计的基本原理
一、估计量与估计值 二、点估计与区间估计 三、评价估计量的标准
一、估计量与估计值
(estimator & estimated value)
P z 2
(1 )
n
或 P z 2
P(1 - P) ( 未知时) n
总体比例的区间估计
(例题分析)
【 例 】 某 城 市 想 解:已知 n=100,p=65% , 1-= 95%, z/2=1.96 要估计下岗职工 p (1 p ) 中女性所占的比 p z 2 例,随机抽取了 n 100 个 下 岗 职 工 , 65%(1 65%) 其中 65 人为女性 65% 1.96 100 职 工 。 试 以 95% 的置信水平估计 65% 9.35% 该城市下岗职工 55.65%,74.35% 中女性比例的置 该城市下岗职工中女性比例的置信 信区间 区间为55.65%~74.35%
3. 置信水平 (1 - ),影响 z 的大小
X 样本容量, n
常用置信水平及 z 2 值
置信水平 1- 90% 95% 99%

0.10 0.05 0.01
/2
0.05 0.025 0.005
z 2
1.645 1.96 2.58
2015年7月23日星期四
16
评价估计量的标准
39
46 45 39 38 45
27
43 54 36 34 48
36
31 47 44 48 45
44
33 24 40 50 32
总体均值的区间估计
(例题分析)
解:已知n=36, 1- = 90%,z/2=1.645。根据样本数 据计算得: x 39.5 ,s 7.77 总体均值在1-置信水平下的置信区间为
n 39.5 2.13
x z
s
2
39.5 1.645
7.77 36
37.37,41.63
投保人平均年龄的置信区间为37.37岁~41.63岁
总体均值的区间估计
(正态总体、2未知、小样本)
总体均值的区间估计
(小样本)

1. 假定条件

总体服从正态分布,且方差(2) 未知 小样本 (n < 30)
1476.8,1503.2
该种灯泡平均使用寿命的置信区间为1476.8小时~ 1503.2小时
总体比例的区间估计
总体比例的区间估计

1. 假定条件


总体服从二项分布 可以由正态分布来近似 大样本
2.
使用正态分布统计量Z P Z ~ N (0,1) (1 ) n 3. 总体比例在1-置信水平下的置信区间为
相关文档
最新文档