统计学(07)第7章 参数估计
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第7章 参数估计)【圣才出品】
![贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第7章 参数估计)【圣才出品】](https://img.taocdn.com/s3/m/500615965727a5e9856a61f6.png)
第7章参数估计7.1 考点归纳【知识框架】【考点提示】(1)置信区间的含义理解(选择题、简答题考点);(2)估计量的三个评价标准(判断题、填空题、简答题考点);(3)区间估计的步骤(简答题考点)、总体参数的区间估计选择恰当的统计量(计算题考点);(4)必要样本容量的影响因素、计算(简答题、计算题考点)。
【核心考点】考点一:参数估计的基本原理1.置信区间(1)置信水平为95%的置信区间的含义:用某种方法构造的所有区间中有95%的区间包含总体参数的真值。
(2)置信度愈高(即估计的可靠性愈高),则置信区间相应也愈宽(即估计准确性愈低)。
(3)置信区间的特点:置信区间受样本影响,具有随机性,总体参数的真值是固定的。
一个特定的置信区间“总是包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题。
2.评价估计量的标准(1)无偏性:估计量抽样分布的期望值等于被估计的总体参数,即E(θ∧)=θ。
(2)有效性:估计量的方差尽可能小。
(3)一致性:随着样本量的增大,估计量的值越来越接近被估计总体的参数。
【提示】本考点常见考查方式:①直接考查置信水平为95%的置信区间的含义;②置信度、估计可靠性、置信区间的关系及应用;③置信区间的特点;④给出估计量的具体含义,判断体现了什么标准;⑤直接回答估计量的三个评价标准及具体含义(简答题)。
考点二:一个总体参数的区间估计表7-1 一个总体参数的区间估计【总结】一个总体参数的估计及所使用的分布见图7-1:图7-1 一个总体参数的估计及所使用的分布【真题精选】设总体X~N(μ,σ2),σ2已知,样本容量和置信水平固定,对不同的样本观测值,μ的置信区间的长度()。
[对外经济贸易大学2018研]A.变长B .变短C .保持不变D .不能确定 【答案】C【解析】在正态总体方差已知的条件下,μ的置信区间为/2x z ±ασ所以置信区间长度为/22Z α,当样本容量和置信水平固定时,置信区间长度保持不变。
第7章参数估计
![第7章参数估计](https://img.taocdn.com/s3/m/6869531e6c175f0e7cd137f1.png)
31 100
假定A品牌袋装大米的重量服从正态分布,现随机抽取13袋大 米,测得其重量(单位:千克)分别为 ⎛ ⎞ 24, 24.2, 24.4, 24.6, 24.7, ⎝ 24.8, 25, 25.1, 25.1, 25.2, ⎠ 25.3, 25.4, 25.6. 分别计算该品牌袋装大米的重量的均值,及重量的标准差 的95%的置信区间。
4. 整理后,得到未知参数������的置信区间
参数估计的基本原理 点估计 区间估计 一个总体参数的区间估计 总体均值的区间估计 总体比例的区间估计 总体方差的区间估计 两个总体参数的区间估计 两个总体均值之差的区间估计 两个总体比例之差的区间估计 两个总体方差之比的区间估计 样本量������的确定 估计总体均值是样本量的确定 估计总体比例时是样本量的确定
一家食品生产企业以生产袋装食品为主,每天的产量大约 为8000袋左右。按规定每袋的重量应为100g。为了对产品质量进 行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符 合要求。现从某天生产的一批食品中随机抽取25袋,测得每袋重 量如下所示: 112.5 102.6 100 116.6 136.8 101 107.5 123.5 95.4 102.8 103 95 102 97.8 101.5 102 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105 93.3
正态总体,������未知,因此应用公式①,即 ������ 2 ������ 2 方差的置信区间为[ ������(2������−(1) , ������2(������−1) ], ������ − 1) ( ������ −1) ������/2 1−������/2 √︂ √︂ ������ 2 ������ 2 标准差的置信区间为[ ������(2������−(1) , ������2(������−1) ]。 ������−1) (������−1)
第7章参数估计
![第7章参数估计](https://img.taocdn.com/s3/m/6fa72f193868011ca300a6c30c2259010202f393.png)
x 1 0
f P 1-p
x
xf f
1 p 0 (1 p) p (1 p)
p
2 (x x)2 f (1 p)2 p (0 p)2 (1 p)
f
p (1 p)
似然函数常简记为L或 L 1,2, ,k
未知参数的函数。
38
若有 ˆi (x1, x2,..., xn ) i 1, 2, k 使得
L x1, x2,..., xn;ˆ1, ˆ 2,
, ˆ k
max L (1 ,2 , ,k )
x1, x2,..., xn; 1, 2,
, k
则 ˆi (X1, X2,..., Xn) 为参数θi的极大似然估计量。
中选出一个使样本观察值出现的概率为最大的 ˆ 作
为θ的估计量。
称 ˆ 为θ 的极大似然估计量。
37
2.似然函数的数学表达式
设X1,X2,…Xn是取自总体X的一个样本,样本的联合密度 (连续型)或联合分布律 (离散型)为 :
f (x; 1,2 , , k )
定义似然函数为:
n
L L x1,..., xn; 1, 2, , k f xi; 1, 2, , k i 1 x1, x2 ,..., xn 给定的样本观察值
§7.1.4抽样误差
1.误差:调查结果与实际值之间的差异 抽样调查中的误差
登记性误差(非抽样误差) 误差代表性误差随系机统误误差差((抽非样抽误样差误)差)
2.抽样误差—由于抽样的随机性而产生的 样本指标对总体指标的代表性误差。抽样误 差可以计算并加以控制,但不可以避免。
统计学第五版课后练答案(7-8章)
![统计学第五版课后练答案(7-8章)](https://img.taocdn.com/s3/m/f0f2513f67ec102de2bd89bd.png)
第七章 参数估计7.1 (1)x σ==(2)2x z α∆= 1.96=1.54957.2 某快餐店想要估计每位顾客午餐的平均花费金额。
在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
x σ==(2)在95%的置信水平下,求估计误差。
x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。
置信区间为:2x z x z αα⎛-+ ⎝=()120 4.2,120 4.2-+=(115.8,124.2)7.322x z x z αα⎛-+ ⎝=104560±(87818.856,121301.144) 7.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。
要求:大样本,样本均值服从正态分布:2,x N n σμ⎛⎫ ⎪⎝⎭ 或2,s x N n μ⎛⎫⎪⎝⎭置信区间为:22x z x z αα⎛-+ ⎝=1.2 (1)构建μ的90%的置信区间。
2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(79.03,82.97)(2)构建μ的95%的置信区间。
2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(78.65,83.35)(3)构建μ的99%的置信区间。
2z α=0.005z =2.576,置信区间为:()81 2.576 1.2,81 2.576 1.2-⨯+⨯=(77.91,84.09)7.5 (1)2x z α±=25 1.96±=(24.114,25.886)(2)2x z α±119.6 2.326±=(113.184,126.016)(3)2x z α± 3.419 1.645±(3.136,3.702)7.6 (1)2x z α±=8900 1.96±=(8646.965,9153.035)(2)2x z α±8900 1.96±=(8734.35,9065.65)(3)2x z α±8900 1.645±=(8761.395,9038.605)(4)2x z α±8900 2.58±=(8681.95,9118.05)7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36人,调解:(1)样本均值x =3.32,样本标准差s=1.611α-=0.9,t=2z α=0.05z =1.645,x z α± 3.32 1.645±=(2.88,3.76)1α-=0.95,t=z α=0.025z =1.96,x z α± 3.32 1.96±(2.79,3.85)1α-=0.99,t=z α=0.005z =2.576,2x z α± 3.32 2.76±(2.63,4.01)7.82x t α±=10 2.365±7.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是:10 3 14 86 9 12 117 5 1015 9 16 13 2假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
第7章估计理论
![第7章估计理论](https://img.taocdn.com/s3/m/2cb9be657e21af45b207a809.png)
D X EX EX 2 12
2 2 2
1 1 2 1 X i X i Xi X n n n
2
2
样本方差
∴样本均值和样本方差是总体数学期望与总体方差的矩估计量。可以证明, 前面讲过的样本各种数字特征是总体同名数字特征的矩估计量。
X EX
标准化后的变量
也是随机变量,常数为离均系数,若X的数字特征为 EX , , Cs则的
Cs Cs 的最小值为: 均值为0 ,方差为1,
0
a EX 2 2 Cs Cs
当Cs 0,
,此时
为标准化正体分布∴结论是对的
从以上所推导出离均系数分布密度可知,该分布密度仅与 Cs 有关,那么只要给p 可通过积分求得p 即
解:设样本
x1 , x 2 , x n
x
1
为极大值 ∵ x1
* 即 取值范围[ x1 , ) 是抽自以上总体的。故 为使似然函数达最大
即
L 1 n 达最大 在 取值范围内 显然 x1时可使L达最大
对于P-III型分布中的τ分布(即a0=0的P-III分布),可以用两个似然方
P-Ⅲ型分布是我国水利水电工程水文计算规范中推荐采用的分 布,我国水文工作者对其参数估计的方法作了大量研究,现行广泛采用 的是适线法。 一、适线法 适线法不是给出估计量的计算公式,而是由实测样本直接推求 参数的估计值。包括目估和计算机优化适线法。 (一)、适线法的基本原理 设随机变量X的超过制分布函数 P( X x) G ( x; u10 ,, ul0 ) 的函 数类型已知,其中的参数 u10 ,, ul0未知,待估计,又设x1,…,xn为X 的一个容量为n的样本,利用这个样本通过适线法估计参数 u10 ,, ul0 的值。 将x1,x2,…,xn由大到小排队:x 计算经验频率 Pm P X xm ,将点 ( Pm , xm )(m=1~n)(称为经验点据)
统计学第七章参数估计
![统计学第七章参数估计](https://img.taocdn.com/s3/m/f004534d3069a45177232f60ddccda38376be193.png)
单击添加文本具体内容
参数估计
假设检验
描述统计
推断统计
参数估计在统计方法中的地位
统计方法
统计推断的过程
总体
总体均值、比例、方差等
样本统计量 如:样本均值、比例、方差
样本
§7.1 参数估计的一般问题
单击此处添加文本具体内容,简明扼要地阐述你的观点
一、估计量和估计值
参数估计(Parameter Estimation) ,用样本估计量估计总体估计值。
一个总体参数的区间估计
总体参数
符号表示
样本统计量
均值
比例
方差
第一章节
总体均值的区间估计 (正态总体、2已知,或非正态总体、大样本)
总体均值的区间估计 (大样本)
假定条件 总体服从正态分布,且方差(2) 未知 如果不是正态分布,可由正态分布来近似 (n 30) 使用正态分布统计量 z 总体均值 在1- 置信水平下的置信区间为
(1)估计量:用来估计总体参数的样本统计量。如:样本算术平均数、样本中位数、样本标准差、样本方差等。 例如: 样本均值就是总体均值 的一个估计量 (2)参数用 表示,估计量用 表示 (3)估计值:估计参数时计算出来的统计量的具体值 如果样本均值 x =80,则80就是的估计值
矩估计法
最小二乘法
换句话说,做出校全体女大学生身高均数为163.0 -- 164.5cm的结论,说对的概率是95%,说错的概率是5%;做出校全体女大学生身高均数为162.7 – 164.7cm的结论,说对的概率是99%,说错的概率是1%。
3、置信区间与置信水平
(1 - ) 区间包含了 的区间未包含
a /2
A
B
的抽样分布
统计学第七章、第八章课后题答案
![统计学第七章、第八章课后题答案](https://img.taocdn.com/s3/m/66b6bb21482fb4daa58d4beb.png)
统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。
5. 简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=▪ 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
07心理统计学-第七章 参数估计
![07心理统计学-第七章 参数估计](https://img.taocdn.com/s3/m/8bbcbe83b9d528ea81c779fb.png)
犯错误的概率,常用α(或p)表示。则1-α为置信 度。(显著性水平越高表示的是α值越小,即犯错误的可
能性越低) α为预先设定的临界点,常用的如.05、.01、.001;p 为检验计算所得的实际(犯错误)概率。
第一节 点估计、区间估计与标准误
三、区间估计与标准误
3、区间估计的原理与标准误
转换成比率为
p
n
p, SE p
n
pq n
同理可得公式7-17。自习[例7-12、例7-13]
1、从某地区抽样调查400人,得到每月人均文化消费为 160元。已知该地区文化消费的总体标准差为40元。试 问该地区的每月人均文化消费额。(α=.05,总体呈正态
分布)
2、上题中总体方差未知,已知Sn-1=44元。 3、已知某中学一次数学考试成绩的分布为正态分布,总 体标准差为5。从总体中随机抽取16名学生,计算得平 均数为81、标准差为Sn=6。试问该次考试中全体考生成 绩平均数的95%置信区间。 4、上题中总体方差未知,样本容量改为17人。 5、假定智商服从正态分布。随机抽取10名我班学生测 得智商分别为98、102、105、105、109、111、117、 123、124、126(可计算得M=112,Sn≈9.4),试以95% 的置信区间估计我班全体的智商平均数。 返回
值表,求tα /2(df)。
5、计算置信区间CI。
σ2已知,区间为M-Zα /2 SE <μ< M+Zα /2 SE;
σ2未知,区间为M-tα /2(df)SE <μ< M+tα /2(df)SE。
6、对置信区间进行解释。
二、σ2已知,对μ的区间估计(Z分布,例7-1 & 2) 三、σ2未知,对μ的区间估计(t分布,例7-3 & 4)
统计学参数估计PPT课件
![统计学参数估计PPT课件](https://img.taocdn.com/s3/m/7dd1b53903768e9951e79b89680203d8cf2f6a76.png)
在应用参数估计时,需要注意样本的代表性、数据的准确性和可靠性等问题, 以保证估计的准确性和可靠性。
对未来研究的建议
01
进一步探讨参数估计的理论基础
可以进一步探讨参数估计的理论基础,如大数定律和中心极限定理等,
以更好地理解和掌握参数估计的方法和原理。
02
探索新的估计方法
随着统计学的发展,可以探索新的参数估计方法,以提高估计的准确性
指导决策
评估效果
基于参数估计结果,制定科学合理的 决策。
利用参数估计,评估政策、项目等实 施效果。
预测未来
通过参数估计,预测未来的趋势和变 化。
02
参数估计的基本概念
点估计
定义
点估计是用一个单一的数值来估 计未知参数的值。
举例
在调查某班级学生的平均身高时, 我们可能使用所有学生身高的总 和除以人数来估计平均身高,这 里的总和除以人数就是点估计。
最小二乘法的缺点是假设误差项独立 同分布,且对异常值敏感,可能影响 估计的稳定性。
最小二乘法的优点是简单易行,适用 于线性回归模型,且具有优良的统计 性质。
贝叶斯估计法
贝叶斯估计法是一种基于贝叶 斯定理的参数估计方法,通过 将先验信息与样本数据相结合 来估计参数。
贝叶斯估计法的优点是能够综 合考虑先验信息和样本数据, 给出更加准确的参数估计。
高维数据的参数估计问题
1 2 3
高维数据对参数估计的影响
随着数据维度的增加,参数估计的复杂度和难度 也会相应增加,容易出现维度诅咒等问题。
高维数据参数估计的方法
针对高维数据,可以采用降维、特征选择、贝叶 斯推断等方法进行参数估计,以降低维度对估计 的影响。
统计学原理:第7章 参数估计
![统计学原理:第7章 参数估计](https://img.taocdn.com/s3/m/d46c03b2844769eae109ed7b.png)
一个总体参数的区间估计
总体参数 均值 比例 方差
7 - 26
符号表示 样本统计量
x
p
2
s2
7.2.1 总体均值的区间估计
1、正态总体、2已知,
非正态总体、大样本
2、正态总体、2未知,小样本
7 - 27
总体均值的区间估计
(1、Z分布)
1. 假定条件
总体服从正态分布,且方差(2) 已知
量进行监测,企业质检部门经常要进行抽检,以分析每袋重 量是否符合要求。现从某天生产的一批食品中随机抽取了25 袋,测得每袋重量如下表所示。已知产品重量的分布服从正 态分布,且总体标准差为10g。试估计该批产品平均重量的 置信区间,置信水平为95%
这表明一个具体的点估计值无法给出估计的可 靠性的度量,一个点估计量的可靠性是由它的 抽样标准误差来衡量的。
7 -9
抽样分布回顾
Xi ~
, 2
..X
~
,
2
n
p Z Z Z 1
2
2
p Z 2
X
X
Z 2
1
p
Z 7 - 10
2
X
X
Z
2
X
1
抽样分布回顾
p
Z
2
X
X
7 - 12
实际情况是,样本均值已知,而总体均值未知 。
x
样本均值与总体均值的距离是对称的,
若某个样本均值落在总体均值的两个标准差范围以内, 则总体均值就会被包括在以样本均值为中心左右两个标 准差的范围之内。
7 - 13
区间估计
(interval estimate)
1. 总体参数估计的一个区间: 样本统计量 加减 估计误差
心理及教育统计学第7章参数估计
![心理及教育统计学第7章参数估计](https://img.taocdn.com/s3/m/7d2daa85ad02de80d5d84039.png)
章节内容
第一节 点估计、区间估计及标准误 第二节 总体平均数的估计 第三节 标准差与方差的区间估计 第四节 相关系数的区间估计 第五节 比率及比率差异的区间估计
总体参数估计:在研究中从样本获得一组数 据后,通过这组信息,对总体特征进行估计, 即从局部结果推论总体的情况。
总体参数估计分点估计和区间估计两种。
7 8 2 . 2 6 2 2 . 6 7 7 8 2 . 2 6 2 2 . 6 7
71.9684.04
当n2=36时,df2=35,t0.05/2=2.042
7 9 2 . 0 4 2 1 . 5 2 7 9 2 . 0 4 2 1 . 5 2
75.982.1
【例7-4】
根据n2=36的样本估计总体参数μ:
0.95的置信区间 7 8 1 . 9 6 1 . 1 8 7 9 1 . 9 6 1 . 1 8
76.781.3
0.99的置信区间
7 9 2 . 5 8 1 . 1 8 7 9 2 . 5 8 1 . 1 8
75.782.04
83.686.4
总体方差σ2未知,对总体平均数的估计
总体方差未知,用样本的无偏方差(
s
2 n 1
)作为总体
方差的估计值,实现对总体平均数μ的估计。因为在总
体方差未知时,样本平均数的分布为t分布,故应查t值
表,确定t/2或t(1-)/2。
有两种情况:
(1)总体的分布为正态时,可不管n之大小。
(2)总体分布为非正态时,只有n>30,才能用概率对 其抽样分布进行解释,否则不能推论。
0.05水平和0.01水平是人们习惯上常用的两个显著性 水平。
区间估计的原理是抽样分布理论。在计算区间估计值, 解释估计的正确概率时,依据的是该样本统计量的分 布规律及抽样分布的标准误(SE)。
统计学 第七章 参数估计
![统计学 第七章 参数估计](https://img.taocdn.com/s3/m/89c2a33b87c24028915fc34c.png)
[
]
2 χα (n) (n)的α 分位数,记为k≜ n k≜
抽样分布
(3)性质 • 若X服从χ2 (n),则均值E(X)=n ,方差 D(X) =2n 。 • χ2分布具有可加性。若 X1,X2相互独立,
X1~ χ2(n1) ,X2~χ2(n2)
则(X1+X2)~χ2(n1+n2) • 当n→∞时,χ2分布渐进于正态分布
σ
2
~ χ (n −1)
2
第三节两个总体参数的区 间估计(112页)
• • • • • • • 一、两个总体均值之差的区间估计 (一)两个总体均值之差的估计:独立样本 大样本:近似于正态分布 小样本: (1)两个总体的方差均已知,近似于正态分布 (2)两个总体的方差均未知但相等,近似于t分布 (3)两个服从正态分布的总体的方差均未知且不等, 但样本容量相等,近似于t分布 • (4)两个总体的方差均未知且不等,样本容量也不 等,近似于t分布,自由度为V
• 解:求(3)的计算步骤: • ①求样本指标:
x =1000小时
σ=50 (小时)
µ x=
σ
n
=
50 100
=(小时) 5
• ②根据给定的F(t)=95%,查概率表得t=1.96。 • ③根据∆x=t×µx=1.96×5=9.8,计算总体平均耐 用时间的上、下限: x − ∆ x=1000-9.8=990.(小时) 2 • 下限 x +∆ x=1000+9.8=1009 .(小时) 8 • 上限 • 所以,以95%的概率保证程度估计该批产品的平均耐 用时间在990.2~1009.8小时之间。
f (x;θ ) 其中 θ
或概率密度为
是未知参数。 是未知参数。
如何求极大似然估 计量呢? 计量呢?
07章 抽样和参数估计习题及答案
![07章 抽样和参数估计习题及答案](https://img.taocdn.com/s3/m/07c4a640a417866fb94a8e1a.png)
第七章 抽样调查1、 抽样调查的目的在于用抽样指标去推断总体指标。
( )2、 不论总体单位数多少都适用抽样调查方法。
( )3、 古典概率是指每次试验中事件等可能出现的条件下,试验前就可计算出来的比率。
( )4、 股票指数在未来的一周内上升可能性的大小指的是主观概率。
( )5、对一个有限总体进行重复抽样,各次抽取的结果是相互独立的。
( )6、对一个无限总体进行不重复抽样,各次抽取的结果是相互独立的。
( )7、抽样极限误差可以大于抽样平均误差,可以小于抽样平均误差,当然也可以等于抽样平均误差。
( )8、对于重复简单随机抽样,若其它条件不变,样本单位数目增加3倍,则样本平均数抽样平均误差将必须减少30%。
( )9、对于重复简单随机抽样,若其它条件不变,要使抽样平均误差减少一半,则抽样单位数目将必须增加1倍。
( )10、抽样误差产生的原因是抽样调查时违反了随机原则。
( ) 11、抽样误差是抽样调查所固有的、无法消除的误差。
( )12、在确定样本单位数目时,若总体成数方差未知,则P 可取0.5。
( )1、 若某一事件出现的概率为1/6,当试验6次时,该事件出现的次数将是()。
1次 大于1次小于1次上述结果均有可能2、 已知一批计算机元件的正品率为80%,现随机抽取n 个样本,其中x 个为正品,则x 的分布服从()。
正态分布二项分布泊松分布超几何分布3、某工厂生产的零件出厂时每200个装一盒,这种零件分为合格与不合格两类,合格率约为99%,设每盒中的不合格数为X ,则X 通常服从( )。
正态分布二项分布泊松分布超几何分布4、 若一个系的学生中有65%是男生,40%是高年级学生。
若随机抽选一人,该学生或是男生或是高年级学生的概率最可能是( )。
0.350.600.80 1.055、 有为朋友从远方来,他乘火车、轮船、汽车、飞机来的概率分别为0.3、0.2、0.1和0.4,如果他乘火车、轮船、汽车来的话,迟到的概率分别为1/4、1/3和1/12,而乘飞机则不会迟到,试求他迟到的概率为( )。
统计学第7章参数估计1
![统计学第7章参数估计1](https://img.taocdn.com/s3/m/8dbf387df46527d3240ce059.png)
2. 根据一个具体的样本求出的总体均值的95% 的置信区间( )
A 以95%的概率包含总体均值 B 有5%的可能性包含总体均值 C 一定包含总体均值 D 要么包含总体均值,要么不包含总体均值
常用置信水平的临界值(Zα/2值)
置信水平
90% 95% 99%
α
0.10 0.05 0.01
样本均值经标准化处理后服从自由度为
(n-1)的t分布
t x ~ t(n 1)
s/ n
总体均值μ在1-α的置信水平下的置信区间为
x t
2
s n
【例】某时装店的管理人员想估计其顾客的平均
年龄,随机抽取了16位顾客进行了调查,得到 样本均值为32岁,样本标准差为8岁,假定顾客 的年龄近似服从正态分布,求该店全部顾客平均
α/2
0.05 0.025 0.005
Zα/2
1.645 1.96 2.58
X
- 2.58x
-1.65 x
+1.65x + 2.58x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
评价估计量的标准
1. 无偏性
∧
E(θ) =θ
2. 有效性
对同一总体参数的两个无偏估计量,标准差 越小的估计量估计效果越好,称估计量越有效。
际误差不超过20元,应抽取多少个顾客作 为样本?
解:已知=120(元),Z/2=1.96,E=20(元)
应抽取的样本容量为
n
Z2 2 2
E2
(1.96) 2120 2
统计学第7讲参数估计
![统计学第7讲参数估计](https://img.taocdn.com/s3/m/882851fdbb4cf7ec4afed050.png)
• 将此数据作为样本,商店开张后经过该地的人数作为总体。 在95%的置信度下,能否知道每天经过此地的人数?
案例二: 参数估计在品牌认知度中应用
例 某食品厂准备上市一种新产品,并配合以相应的广告 宣传,企业想通过调查孩子们对其品牌的认知情况来 评估广告的效用,以制定下一步的市场推广计划。他 们在该地区随机抽取350个小孩作访问对象,进行儿童 消费者行为与消费习惯调查,其中有一个问句是“你 听说过这个牌子吗?”,在350个孩子中,有112个小 孩的回答是“听说过”。根据这个问句,可以分析这 一消费群体对该品牌的认知情况。食品厂市场部经理 要求,根据这些样本,给定95%的置信度,估计该地 区孩子认知该品牌的比例。
优点:简单、具体明确
缺点:没有给出估计值接近总体参数的程度,也无法说明估 计结果有多大的把握程度。
(一)常用的点估计量
1.总体均值点估计量(样本均值)
x
1 n
n i 1
xi
2.总体方差与标准差点估计量(样本方差与标准差)
2
S2
1 n 1
n i 1
( xi
x)2
S
lnL(, 2 ; x1,
, xn ) n ln
2
n 2
ln
2
1
2
2
n i 1
( xi )2
对, 2求偏导数并令其为零.
ln L 1 n
2 i1
(xi ) 0
ln L
2
华北理工卫生统计学实验指导07参数估计
![华北理工卫生统计学实验指导07参数估计](https://img.taocdn.com/s3/m/8c0b0bd2f80f76c66137ee06eff9aef8941e48ae.png)
实验七:参数估计【目的要求】1.掌握均数抽样误差的概念及产生原因2.掌握总体均数的可信区间及估计方法3.熟悉标准差与标准误的区别和联系【案例分析】案例1:某研究者于某年在某市随机调查了200例正常成年人血铅含量(μg/100g),将资料整理成表5-3的频数表形式,试估计该市正常成年人血铅含量的参考值范围及正常成年人平均血铅含量的置信区间。
由于血铅值高于某上限值才被看作异常,故作者将该数据代入公式X+1.64S计算得到该市正常成年人血铅含量95%参考值范围的上界;并用公式X+1.64 s计算得到正常成年人平均血铅含量的95%置信区间的上界。
试问这样做是否合适? 为什X么?应当怎么做?200名正常成年人血铅频数表组段(μg/100g)频数f累计频数累计频率(%)4~252512.58~325728.512~369346.516~3012361.520~2514874.024~2217085.028~1118190.532~818994.536~419396.540~419798.544~119899.048~119999.552~561200100.0合计∑f=200【SPSS操作】Analyze→Descriptive Statistics→Explore→选择变量到Dependent List列表中→选择Display选择框内的Statistics→OK【练习题】一、填空题1.抽样误差是指。
2.标准误是指。
3.总体均数置信区间的计算方法有和。
4.t分布的自由度是。
5.参数估计分为和。
6.总体概率置信区间的计算方法有和。
二、选择题1.表示均数抽样误差大小的统计指标是( )A.标准差B.方差C.均数标准误D.变异系数E.样本标准误S表示( )2.xA.总体均数B.样本均数的标准差C.总体均数离散程度D.变量值X的离散程度3.标准误越大,表示此次抽样得到的样本频率( )A.系统误差越大B.可靠程度越大C.抽样误差越大D.可比性越差4.要减小抽样误差,通常的做法是( )A.适当增加样本例数B.将个体变异控制在一个范围内C.严格挑选观察对象D.增加抽样次数5.关于t分布的图形,下列哪项是错误的( )A.当v趋于无穷时,标准正态分布是t分布的特例B.当v逐渐增大,t分布逐渐逼近标准正态分布C.v越小,则t分布的尾部越高D.t分布是一条以v为中心左右对称的曲线6.已知某地25岁正常成年男性平均收缩压为113.0mmHg,从该地随机抽取20名25岁正常成年男性,测得平均收缩压为119.0 mmHg. 113.0mmHg与119.0mmHg不同,原因是( )A.样本例数太少B.抽样误差C.总体均数不同D.系统误差E.个体差异太大7.从上题的同一个地区再随机抽取20名8岁正常男孩,测得平均收缩压为90 mmHg,标准差为9.8 mmHg.90 mmHg与113.0 mmHg不同,原因是( )A.样本例数太少B.抽样误差C.总体均数不同D.系统误差E.样本均数不可比8.在同一总体随机抽样,样本含量n固定时,a越大,用总体均数的可信区间估计总体均数,估计的情况是()A.错的概率越大B.错的概率越小C.错的概率不变D.其精度越差9.统计推断包括两个重要方面()A.参数估计和假设检验B.计算均数和标准差C.统计描述和假设检验D.计算均数和标准误10.总体均数的可信区间()A.随总体均数而变化B.不随总体均数而变化C.固定区间D.随样本不同而变化11.总体概率的区间估计中,a值越大()A.置信度越大B.置信度越低C.估计的精度下降D.抽样误差越大E.抽样误差越小12.样本频率的标准误越大,()A.置信度越大B.置信度越低C.估计的精度下降D.抽样误差越大E.抽样误差越小13.置信区间和医学参考值范围相比,()A.置信区间也能判断个体值是否正常B.估计的精度好C.估计的精度下降D.置信区间的宽度小于医学参考值范围的宽度E.两者的计算都利于标准误三、判断题1.一般情况下,同一批资料的标准误小于标准差()2.从同一总体中随机抽取样本含量相同的两个样本,他们的样本均数与总体均数相同()3.增加样本含量可以减小抽样误差,所以样本含量越大越好()4.样本含量足够大时,来自正偏峰分布的样本可用正态近似法作参数估计()5.t分布法计算置信区间只适合小样本而不适用于大样本()6.当v一定,a=0.05时,单侧t值小于双侧t值()7.t值相等时,单侧概率小于双侧概率()8.通过样本频率估计总体概率,99%置信区间的精度高于95%置信区间()S都是变异指标,因此它们都可以表示抽样误差的大小()9.S和x四、思考题1.参考值范围和置信区间有什么区别和联系?2.t分布有什么特点?3.什么是均数标准误?意义是什么?如何计算及控制?【作业】1.为了研究某地黄连中小檗碱含量,随机抽查该地20份黄连中小檗碱含量(mg/100g)得平均数为4.35,标准差为0.20,试计算:(1)总体均数的95%和99%的可信区间。
统计学参数估计
![统计学参数估计](https://img.taocdn.com/s3/m/72637cf51b37f111f18583d049649b6648d7090a.png)
统计学参数估计统计学参数估计是统计学中一种重要的方法,它通过观察样本数据来估计总体参数的值。
参数是描述总体特征的数值,例如总体均值、总体比例等。
参数估计的目的是根据样本信息对总体参数进行推断,从而得到总体特征的近似值。
参数估计的过程通常分为点估计和区间估计两种方法。
点估计是指根据样本数据求出总体参数的一个数值估计量,例如样本均值、样本比例等。
点估计的基本思想是用样本统计量作为总体参数的估计值,它是参数的无偏估计量时,表示点估计是一个良好的估计。
区间估计是指根据样本数据求出一个区间,这个区间包含总体参数的真值的概率较高,通常用置信区间表示。
区间估计的基本思想是总体参数位于一个区间中的可能性,而不是一个确定的值。
置信区间的构造依赖于样本统计量的分布以及总体参数的估计量的抽样分布。
点估计和区间估计的方法有很多,其中最常用的是最大似然估计和矩估计。
最大似然估计是指根据已知样本观测值,选择使样本观测值出现的概率最大的总体参数作为估计值。
最大似然估计的基本思想是找到一个参数值,使得已观测到的样本结果出现的概率尽可能大。
矩估计是指根据样本矩的观测值,选择使样本矩的偏差与总体矩的偏差最小的总体参数作为估计值。
矩估计的基本思想是利用样本矩估计总体矩,从而近似估计总体参数。
参数估计在实际应用中具有广泛的应用价值。
例如,在医学研究中,需要对患者的疾病概率进行估计,以帮助医生做出正确的诊断和治疗决策。
在经济学研究中,需要对经济指标(如GDP、通胀率等)进行估计,以帮助政府制定宏观经济政策。
在市场调研中,需要对消费者行为进行估计,以帮助企业确定产品定价和市场策略。
然而,参数估计也存在一些局限性。
首先,参数估计的结果仅仅是对总体参数的估计,并不是总体参数的确切值。
其次,参数估计的结果受到样本容量的影响,样本容量越大,估计结果越可靠。
另外,参数估计还需要满足一些假设条件,如总体分布的形式、样本的独立性等,如果这些假设条件不满足,估计结果可能会失效。
第章统计学.参数估计 练习题
![第章统计学.参数估计 练习题](https://img.taocdn.com/s3/m/519c37cd77eeaeaad1f34693daef5ef7ba0d12d1.png)
第7章参数估计练习题一、填空题共10题,每题2分,共计20分1.参数估计就是用_______ __去估计_______ __;2. 点估计就是用_______ __的某个取值直接作为总体参数的_______ __;3.区间估计是在_______ __的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减_______ __得到;4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为_______ __,也成为_______ __;5.当样本量给定时,置信区间的宽度随着置信系数的增大而_______ __;当置信水平固定时,置信区间的宽度随着样本量的增大而_______ __;6. 评价估计量的标准包含无偏性、_______ __和_______ __;7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可靠程度,就会_______ __置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程度,就要_______ __样本量;8. 估计总体均值置信区间时的估计误差受总体标准差、_______ __和_______ __的影响;9. 估计方差未知的正态总体均值置信区间用公式_______ __;当样本容量大于等于30时,可以用近似公式_______ __;10. 估计正态总体方差的置信区间时,用_____ __分布,公式为______ __;二、选择题共10题,每题1分,共计10分1.根据一个具体的样本求出的总体均值的95%的置信区间 ;A.以95%的概率包含总体均值B.有5%的可能性包含总体均值C.一定包含总体均值D. 要么包含总体均值,要么不包含总体均值2.估计量的含义是指 ;A. 用来估计总体参数的统计量的名称B. 用来估计总体参数的统计量的具体数值C. 总体参数的名称D. 总体参数的具体数值3. 总体均值的置信区间等于样本均值加减边际误差,其中边际误差等于所要求置信水平的临界值乘以 ;A. 样本均值的标准差B. 样本标准差C. 样本方差D. 总体标准差4.一个95%的置信区间是指 ;A. 总体参数有95%的概率落在这一区间内B. 总体参数有5%的概率未落在这一区间内C. 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D. 在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数5. 置信系数表达了置信区间的 ;A. 准确性B. 精确性C. 显着性D. 可靠性6. 在置信水平不变的条件下,要缩小置信区间,则 ;A. 需要增加样本量B. 需要减少样本量C. 需要保持样本量不变D. 需要改变统计量的抽样标准差7. 某地区职工样本的平均工资450元,样本平均数的标准差是5元,该地区全部职工平均工资落在440-460元之间的估计置信度为 ;A. 0.95B.0.9545C. 0.99D. 0.99738. 在其它条件不变的情况下,如果总体均值置信区间半径要缩小成原来的二分之一,则所需的样本容量 ;A. 扩大为原来的4倍B. 扩大为原来的2倍C. 缩小为原来的二分之一D. 缩小为原来的四分之一9. 以下哪个不是用公式n st x ±构造置信区间所需的条件 ;A. 总体均值已知B. 总体服从正态分布C. 总体标准差未知D. 样本容量小于3010. 假设正态总体方差已知,欲对其均值进行区间估计;从其中抽取较小样本后使用的统计量是 ;A. 正态统计量B. 2χ统计量C. t 统计量D. F 统计量三、判断题共10题,每题1分,共计10分1. 在其他条件相同时,95%的置信区间比90%的置信区间宽;2. 比较参数的两个估计量的有效性时,必须保证它们是无偏估计;3. 用95%的置信水平得到某班学生考试成绩的置信区间为60-80分,因此我们可以说60-80分这个区间以95%的概率包含全班学生平均考试成绩的真值;4. 在总体均值和总体比例的区间估计中,边际误差由置信水平和统计量的标准差确定;5. 当正态总体的方差已知时,在小样本条件下,估计总体均值使用的分布是t 分布;6.有效性是指随着样本量的增大,估计量的值越来越接近被估总体的参数;7. 在置信水平一定的条件下,要提高估计的可靠性,就应增大样本量;8. 在样本量一定的条件下,要提高估计的精度,就应降低置信水平;9. 在其他条件不变的情况下,总体数据的方差越大,估计时所需的样本量就越大;10.对于非正态总体,在大样本条件下,估计总体均值使用的分布是正态分布;四、计算题共6题,每题10分,共计60分1、已知某苗圃中树苗高度服从正态分布,今工作人员从苗圃中随机抽取64株,测得苗高并求得其均值62厘米,标准差为8.2厘米;请确定该苗圃中树苗平均高度的置信区间,置信水平95%;2、从水平锻造机的一大批产品中随机抽取20件,测得其尺寸平均值x =32.58,样本方差2S =0.0966;假定该产品的尺寸2~(,)X N μσ,2,μσ均未知;试求2σ的置信度为95%的置信区间;3、某一金融分析师想要估计纽约证券交易所上市公司中拥有现金资产超过总资产百分之十的上市公司的比例;1他希望达到的估计误差不超过0.10,置信度为90%,请确定他所需的样本容量;2假设他根据1所确定的样本容量进行了抽样,并计算得出样本比例为0.13,试构建置信度为90%的总体比例的置信区间;4、某市交通管理部门拟估计该市机动车未按照规定购买保险的比例;1他们希望估计的允许误差不超过0.02,置信度为95%,请确定所需的样本容量;2假设他根据1所确定的样本容量进行了抽样,并计算得出样本比例为0.15,试构建置信度为95%的总体比例的置信区间;5、强生出租车公司拟进行一项调查,调查在六一儿童节那天出租车的平均行驶里程数;为此公司抽取了20辆出租车进行调查,测得样本均值545公里,标准差为140公里;请确定公司所有出租车平均行驶里程的置信区间,置信水平95%;6、某地区的写字楼月租金的标准差为80元,要估计总体均值的95%的置信区间,希望的边际误差为25元,应抽取的样本量是多少。
《统计学参数估计》课件
![《统计学参数估计》课件](https://img.taocdn.com/s3/m/f2af0658974bcf84b9d528ea81c758f5f71f2972.png)
4
点估计例子及应用
点估计可应用于各种领域,如经济学、医学研究和市场调查中的参数估计。
区间估计
区间估计的定义和原理
区间估计是用一个区间来估计总 体参数值,表示对参数的估计有 一定的不确定性。
置信区间的计算方法
置信区间的计算方法通常基于样 本统计量和抽样分布的特性。
区间估计例子及应用
区间估计可用于估计总体均值、 比例和方差等参数,并提供参数 估计的可信区间。
《统计学参数估计》PPT 课件
统计学参数估计PPT课件。介绍统计学中参数估计的基本概念和方法。本课 程将帮助您深入了解参数估计的重要性和应用前景。
参数估计概述
什么是参数估计?
参数估计是根据样本数据推 断总体参数的过程。
参数的概念和含义
参数是总体分布中的数值特 征,可以用于描述总体的中 心位置和离散程度。
参数估计的意义和应用
参数估计可以帮助我们了解 总体,并作出统计推断和预 测。
点估计
1
点估计的定义和原理
点估计是通过一个点估计总体参数值的方法,通常使用样本统计量来估计。
2
最大似然估计法
最大似然估计法是一种常用的点估计方法,根据样本数据选择使似然函数最大化的参数值。
3
最小乘法
最小乘法是一种点估计方法,通过最小化预测值与真实值之间的差距来估计参数。
参数估计是统计学中重要的工具,可以帮助我们 了解总体和做出合理的推断。
统计学参数估计的应用前景
统计学参数估计在各个领域都有广泛的应用,可 以提供实用的数据分析和决策支持。
假设检验
1 假设检验的基本概念和原理
假设检验是通过对统计数据进行检验来评估关于总体参数的假设。
2 假设检验的步骤和方法
概率论与数理统计第七章
![概率论与数理统计第七章](https://img.taocdn.com/s3/m/262e87b2a417866fb84a8ece.png)
估计 为1.68,这是点估计.
估计在区间[1.57, 1.84]内,这是区间估计.
一、点估计概念及讨论的问题
例1 已知某地区新生婴儿的体重X~ N(,2),
, 2未知,
…
随机抽查100个婴儿
得100个体重数据
9, 7, 6, 6.5, 5, 5.2, … 而全部信息就由这100个数组成.
求:两个参数a,b的矩估计
解: 写出方 V E 程 (X a(X )r组 ) ˆˆ2
其 中uˆˆ2Xn1in1(Xi X)2
但是
E
(
X
)
Var ( X )
a
b 2 (b a)2
12
即有
(ab2ba)2 12
X
ˆ
2
由方程组求解出a,b的矩估计:
a ˆX 3 ˆ b ˆX 3 ˆ
其中 ˆ:ˆ2 n 1i n1 ( XiX)2
(4) 在最大值点的表达式中, 用样本值代入 就得参数的极大似然估计值 .
两点说明:
1、求似然函数L( ) 的最大值点,可以应
用微积分中的技巧。由于ln(x)是x的增函
数,lnL( )与L( )在 的同一值处达到 它的最大值,假定是一实数,且lnL( ) 是 的一个可微函数。通过求解所谓“似 然方程”: dlnL() 0
E(X1m)=E(X2m)==E(Xnm)= E(Xm)=am . 根据大数定律,样本原点矩Am作为 X1m,X2m, ,Xnm的算术平均值依概率收敛到均 值am=E(Xm).即:
n 1i n1Xim pE(Xm)am
例1 设总体X的概率密度为
f(x)(1)x,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
总体均值的区间估计
(大样本)
1. 假定条件
总体服从正态分布,且方差(2) 已知
如果不是正态分布,可由正态分布来近似 (n 30)
2. 使用正态分布统计量 z
z x ~ N (0,1) n
3. 总体均值 在1- 置信水平下的置信区间为
36个投保人年龄的数据
23
35
39
27
36
44
36
42
46
43
31
33
42
53
45
54
47
24
34
28
39
36
44
40
39
49
38
34
48
50
34
39
45
48
45
32
7 - 24
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
总体均值的区间估计
(例题分析)
解:已知n=36, 1- = 90%,z/2=1.645。根据样本数
统计学
STATISTICS (第六版)
第 7 章 参数估计
7 -1
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
第 7 章 参数估计
7.1 参数估计的一般问题 7.2 一个总体参数的区间估计 7.3 两个总体参数的区间估计 7.4 样本量的确定
7 -2
作者:李艳芬,经济与管理学院
7 - 33
解:已知 n=100,p=65% , 1- = 95%,
z/2=1.96
p z 2
p(1 p) n
65% 1.96 65%(1 65%) 100
65% 9.35%
55.65%,74.35%
该城市下岗职工中女性比例的置信 区间为55.65%~74.35%
作者:李艳芬,经济与管理学院
点估计与区间估计
7 -7
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
点估计
(point estimate)
1. 用样本的估计量的某个取值直接作为总体参 数的估计值
▪ 例如:用样本均值直接作为总体均值的估计;用 两个样本均值之差直接作为总体均值之差的估计
2. 无法给出估计值接近总体参数程度的信息
区间估计
(interval estimate)
1. 在点估计的基础上,给出总体参数估计的一个区间 范围,该区间由样本统计量加减估计误差而得到
2. 根据样本统计量的抽样分布能够对样本统计量与总 体参数的接近程度给出一个概率度量
比如,某班级平均分数在75~85之间,置信水平是95%
置信区间
样本统计量 (点估计)
重复构造出的20个置信区间
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
评价估计量的标准
7 - 14
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
无偏性
(unbiasedness)
无偏性:估计量抽样分布的数学期望等于被 估计的总体参数
P(ˆ)
无偏
有偏
A
B
7 - 15
7 - 18
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
一个总体参数的区间估计
总体参数 均值 比例 方差
7 - 19
符号表示 样本统计量
x
p
2
s2
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
总体均值的区间估计
(正态总体、2已知,或非正态总体、大样本)
7 - 20
虽然在重复抽样条件下,点估计的均值可望等于
总体真值,但由于样本是随机的,抽出一个具体 的样本得到的估计值很可能不同于总体真值
7 -8
一个点估计量的可靠性是由它的抽样标准误差来 衡量的,这表明一个具体的点估计值无法给出估 计的可靠性的度量
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
(consistency)
一致性:随着样本量的增大,估计量的 值越来越接近被估计的总体参数
P(ˆ)
较大的样本量
A
B
较小的样本量
7 - 17
ˆ
作者:李艳芬,经济与管理学院
统计学
STATISTICS
7.2
一个总体参数的区间估计
(第六版)
7.2.1 总体均值的区间估计 7.2.2 总体比例的区间估计 7.2.3 总体方差的区间估计
据计算得:x 39.5 ,s 7.77
总体均值在1- 置信水平下的置信区间为
x z 2
s 39.5 1.645 7.77
n
36
39.5 2.13
37.37,41.63
投保人平均年龄的置信区间为37.37岁~41.63岁
7 - 25
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
ˆ
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
有效性
(efficiency)
有效性:对同一总体参数的两个无偏点估计
量,有更小标准差的估计量更有效
P(ˆ)
ˆ1 的抽样分布
B
A
ˆ2 的抽样分布
7 - 16
ˆ
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
一致性
统计学
STATISTICS (第六版)
置信水平
(confidence level)
1. 将构造置信区间的步骤重复很多次,置信 区间包含总体参数真值的次数所占的比例 称为置信水平
2. 表示为 (1 - 为是总体参数未在区间内的比例
3. 常用的置信水平值有 99%, 95%, 90%
相应的 为0.01,0.05,0.10
7 - 27
x t 2
s n
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
t 分布
t 分布是类似正态分布的一种对称分布,它通常要比 正态分布平坦和分散。一个特定的分布依赖于称之 为自由度的参数。随着自由度的增大,分布也逐渐 趋于正态分布
标准正态分布
标准正态分布
t (df = 13)
105.36 3.92
101.44,109.28
该食品平均重量的置信区间为101.44g~109.28g
7 - 23
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
总体均值的区间估计
(例题分析)
【例】一家保险公司收集到由36个投保人组成的随 机样本,得到每个投保人的年龄(单位:周岁)数据如 下表。试建立投保人年龄90%的置信区间
1510 1450 1480 1460
16灯泡使用寿命的数据
1520
1480
1480
1510
1490
1530
1460
1470
1500 1520 1510 1470
7 - 29
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
总体均值的区间估计
(例题分析)
解:已知X~N(,2),n=16, 1- = 95%,t/2=2.131
25袋食品的重量
112.5 101.0 103.0 102.0 100.5
102.6 107.5
95.0 108.8 115.6
100.0 123.5 102.0 101.6 102.2
116.6
95.4
97.8 108.6 105.0
173-62.82 102.8 101.5
98.4
93.3
作者:李艳芬,经济与管理学院
含总体参数的真值
我们只能是希望这个区间是大量包含总体参数真值的
区间中的一个,但它也可能是少数几个不包含参数真 值的区间中的一个
总体参数以一定的概率落在这一区间的表述是错误的
7 - 12
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
点估计值
置信区间
(95%的置信区间)
7 - 13
1. 估计量:用于估计总体参数的随机变量
如样本均值,样本比例, 样本方差等
例如: 样本均值就是总体均值 的一个估计量
2. 参数用 表示,估计量用ˆ 表示
3. 估计值:估计参数时计算出来的统计量的 具体值
如果样本均值 x =80,则80就是的估计值
7 -6
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
7.1 参数估计的一般问题
7.1.1 估计量与估计值 7.1.2 点估计与区间估计 7.1.3 评价估计量的标准
7 -4
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
估计量与估计值
7 -5
作者:李艳芬,经济与管理学院
统计学
估计量与估计值
STATISTICS (第六版)
(estimator & estimated value)
统计学
STATISTICS (第六版)
总体比例的区间估计
7 - 31
作者:李艳芬,经济与管理学院
统计学
STATISTICS (第六版)
总体比例的区间估计
1. 假定条件