3.3(选)第三章 区间估计-点估计-样本量估计-缺区估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如果一个无偏估计量相对与其它所有可能无偏估计量,其
期望方差最小,那么称这种估计量为一致最小方差无偏估计 量。
(3) 相合性 用估计量估计参数涉及一个样本容量大小问题, 如果样本容量越大估计值越接近真值,那么这种估计量是相 合估计量。 除以上三方面标准外,还有充分性与完备性也是常考虑 的。
充分性指估计量应充分利用样本中每一变量的信息;
( y u y ) ( y u y )
并有置信限(下限和上限):
L1 ( y u y ),
L2 ( y u y )
样本平均数对总体平均数的点估计表 示为:
一、
总体平均数μ的置信限
(一)、在总体方差σ2为已知、或大样本时 μ的置信区间为: ( y u ) ( y u ) y y
(3) 多个随机变量分别与常数的乘积的求和函数的数
学期望是常数与多个随机变量的数学期望的乘积的和; (4) 多个相互独立的随机变量的乘积的数学期望是多 个随机变量的数学期望的乘积。
(二) 参数估计量的评选标准 评价估计量优劣的标准主要有无偏性、有效性、相合性等 (1) 无偏性 参数估计量的期望值与参数真值是相等的,这 种性质称为无偏性,具有无偏性的估计量称为无偏估计量。
即应抽取193位消费者作为样本
七、缺区的参数估计方法
第一节 农业科学中的主要参数及其估计量的评选标准 第二节 矩法
第三节 最小二乘法
第四节 极大似然法
第一节 农业科学中的主要参数及其估计量的评选标准
一、农业科学中的主要参数
农业科学研究中需要估计的参数是多种多样的,主要包括: (1)总体数量特征值参数,例如,用平均数来估计品种的产 量,用平均数差数来估计施肥等处理的效应;
这就是随机变量函数的数学期望。同理,离散型随机 变量方差的数学期望为:
D( y) yi E( y) pi
2 i 1
(8· 4)
连续型随机变量方差的数学期望为:
( y) f( y)dy D ( y) yE 2
(8· 5)
数学期望有这样一些常用的性质: (1) 常数的数学期望为常数本身; (2) 随机变量与常数的乘积的数学期望是常数与随机 变量的数学期望的乘积;
置信限 (confidence limit),区间的长度称为置信
距。
一般以L1和L2分别表示置信下限和上限。保证
该区间能覆盖参数的概率以P =(1-α)表示,称为置
信度。95%CI表示置信度95%的置信区间(区间估计)。
fN (y)
0.03
0.02
否定区域 2.5%
否定区域 2.5%
从图中看出,将有95%的样 本 y 值将落在 1.96 y
完备性指该估计量是充分的唯一的无偏估计量。
第二节 矩法
一、矩的概念 矩( moment )分为原点矩和中心矩两种。 对于样本y1,y2,…yn,各观测值的k次方的平均值,称为 n 1 k k 样本的k阶原点矩,记为 y k,有 y yi , 用观测值减去 n i 1 平均数得到的离均差的k次方的平均数称为样本的k阶中心矩, n 1 k k ˆ k ,有( y y ) ( y y )k 。 记为 ( y y) 或 i n i 1 对于总体y1,y2,…yN,各观测值的k次方的平均值,称为
(2)在揭示变数间的相互关系方面,用相关系数来描述2个
变数间的线性关系;用回归系数、偏回归系数等来描述原因 变数变化所引起的结果变数的平均变化的数量,用通径系数 来描述成分性状对目标性状的贡献程度等。
二、参数估计量的评选标准 (一) 数学期望 样本平均数的平均数就是一种数学期望。 例如,一个大豆品种的含油量为20%,测定一次可能
值,即无偏性表示估计值与真值间平均差异为0,近似可以
用估计值作为真值的一个代表。 同一个参数可以有许多无偏估计量,但不同估计量的期望 方差不同,也就是估计量在真值周围的波动大小不同。估计 量的期望方差越大说明用其估计值代表相应真值的有效性越 差;否则越好,越有效。不同的估计量具有不同的方差,方 差最小说明最有效。
n
其中:E z 2
估计两个总体比例之差时样本量的 确定 (例题分析)
【例】一家瓶装饮料制造商想要估计顾客对一种 新型饮料认知的广告效果。他在广告前和广告后 分别从市场营销区各抽选一个消费者随机样本, 并询问这些消费者是否听说过这种新型饮料。这 位制造商想以 10% 的误差范围和 95% 的置信水平 估计广告前后知道该新型饮料消费者的比例之差 ,他抽取的两个样本分别应包括多少人?(假定两 个样本量相等)
L1 y u y ,
L2 y u y
(二)、在总体方差σ2为未知时,n < 30,
Hale Waihona Puke Baidu
σ2需由样本均方s2估计,于是置信区间为:
( y t s y ) ( y t s y )
L1 y t s y ,
L2 y t s y
二、 两总体平均数差数(μ1- μ2)的置信限
第四章 参数的区间估计和点估计
一、总体平均数μ的置信度和置信区间
二、 两总体平均数差数(μ1- μ2)的置信限
三、二项总体百分数p的置信限
四、 两个二项总体百分数差数(p1- p2)的置信限
五、区间估计与假设测验 六、实验中样本量的确定
七、缺区估计
在一定概率保证下,估计出一个区间以能够覆盖 参数μ,称为区间估计。这个区间称置信区间 (confidence interval,CI),区间的上、下限称为
估计两个总体比例之差时 样本量的确定
1. 设n1和n2为来自两个总体的样本,并假定 n1=n2
2. 根据比例之差的区间估计公式可得两个样 本的容量n为
n1 n2 n
( z 2 ) 2 1 (1 1 ) 2 (1 2 ) E2
1 (1 1 ) 2 (1 2 )
1 2 1 2
ˆ1 p ˆ 2 ) u p L1 ( p ˆ1 p ˆ2 ,
ˆ1 p ˆ 2 ) u p L2 ( p ˆ1 p ˆ2
五、
区间估计与假设测验
因为置信区间是一定置信度下总体参数的所 在范围,故对参数所作假设若恰好落在该范围
之内,则这个假设与参数就没有真实的不同,
[( y1 y2 ) t s y1 y2 ] 1 2 [( y1 y2 ) t s y1 y2 ]
L1 ( y1 y2 ) t s y1 y2 ,
L2 ( y1 y2 ) t s y1 y2
(三)小样本成对数据总体差数μd的置信限
d t sd d d t sd
L1 d t sd ,
L2 d t sd
三、
二项总体百分数p的点估计和区 间估计
(一)np,nq>30,
ˆ u p L1 p ˆ, ˆ u p L2 p ˆ
p ˆ
ˆ (1 p ˆ) p n
至 1.96 y 的范围内, 即: P( 1.96 y ) y ( 1.96 y ) 0.95 推广到一般有:
P( u y ) y ( u y ) 1
0.01
接受区域
95%
0.00 255 270 285 300 315 330 345
因而接受H0;反之,如果对参数所作的假设落
在置信区间之外,则说明假设与参数不同,所
以应否定H0,接受HA。
[例] 原来春小麦千粒重μ0=34g,新引入春小麦品种的千粒重
y 35.2 g , s y 0.58
, 故其95%置信区间的两个置信限为:
L1=35.2-(2.365×0.58)=33.8(g) L2=35.2+(2.365×0.58)=36.6(g) 假设H0:μ=34g,正好落入上述置信区间,接受H0:
y
1.96 y
各项减μ得
1.96 y
P( u y ) y (u y ) 1 P( y u y ) ( y u y ) 1
各项减 y 并乘以-1得
于是得到在置信度P =(1-α)时,对μ的置 信区间为:
(二)二项总体百分数p的置信限 5<np,nq<30,
p ˆ
ˆ (1 p ˆ) p n
四、两个二项总体百分数差数(p1- p2)的 置信限 (一)np,nq>30, ˆ1 p ˆ 2 ) u pˆ pˆ ] ( p1 p2 ) [( p ˆ1 p ˆ 2 ) u pˆ pˆ ] [( p
E( y) yi pi
i 1
(8· 1)
这样可以求得总体平均值。 对于连续型随机变数y的数学期望E(y)为:
E ( y) yf( y)dy
(8· 2)
其中f(y)为随机变量y的概率密度函数,这样可以求得总 体均值。
用D(y)表示方差,有 D(y)=E [y-E(y)]2
(8· 3)
μ=34g的假设,即新引入品种与当地品种的千粒重没
有显著差异。
6. 样本量的确定 6. 估计总体比例时样本量的确定
估计一个总体比例时样本量的确 定
1. 根据比例区间估计公式可得样本量 n为 2
n
( z 2 ) (1 ) E
2
其中: E z 2
(1 )
n
2. 3.
(一)在两总体方差已知或大样本时
( y y ) u
1 2
y1 y2
( y y ) u
1 2 1 2
y1 y2
L1 ( y1 y2 ) u y1 y2 L2 ( y1 y2 ) u y1 y2
(二)小样本,两总体方差未知,可两总体方差 相等时
估计两个总体比例之差时样本量的 确定 (例题分析)
解: E=10%, 1-=95%,z/2=1.96,由于没有 的信息,用0.5代替
n1 n2 ( z 2 ) 2 1 (1 1 ) 2 (1 2 ) E2 1.96 2 0.5 (1 0.5) (0.5 (1 0.5) 0.12 192.08 193
是大于20%,再测定可能小于20%,大量反复测定后平均
结果为20%,这时20%便可看作为该大豆品种含油量的数 学期望,而每单独测定一次所获的值只是1个随机变量。 抽象地,随机变量的数字特征是指随机变量的数学期 望值。
对于离散型(间断性)随机变量y的分布列为:P{y=yi}=pi , 其中,i=1,2,…,那么随机变量y的数学期望E(y)为:
1 k 总体的k阶原点矩,记为 E( y ) ,有 E( y ) N
k k y i ;用观测 i 1 N
值减去平均数得到的离均差的k次方的平均数称为总体的k阶
N 1 中心矩,记为 E[(y ) ] 或 k ,有 E[( y ) ] ( y i )k N i 1
例如,在抽样分布中已经介绍了离均差平方和除以自由度得
到的均方的平均数等于总体方差,即该均方的数学期望等于 相应总体参数方差,这就是说该均方估计量是无偏的。 估计量的数学期望值在样本容量趋近于无穷大时与参数 的真值相等的性质称为渐进无偏性,具有渐进无偏性的估计 量称为渐进无偏估计量。
(2) 有效性 无偏性表示估计值是在真值周围波动的一个数
E的取值一般小于0.1 未知时,可取使方差达到最大的值0.5
估计总体比例时样本量的确定
(例题分析)
【例】根据以往 解 : 已 知 =90% , =0.05 , z/2=1.96,E=5% 的生产统计,某 种产品的合格率 应抽取的样本量为 2 ( z ) (1 ) 约为 90% ,现要 2 n 求边际误差为 E2 5% , 在 求 95% (1.96) 2 0.9 (1 0.9) 的置信区间时, 0.05 2 应抽取多少个产 138.3 139 品作为样本? 应抽取139个产品作为样本