统计学第七章 参数估计
7 参数估计
3个抽样实验结果图示
均数
均数
5. 15 5. 36 5. 57 5. 77 5. 98 6. 19
频数 100 150 200 250 300 350 400 450 50 0
n = 30; SX = 0.0920
均数
3. 71 3. 92 4. 12 4. 33 4. 54 4. 74 4. 95 5. 15 5. 36 5. 57 5. 77 5. 98 6. 19
t= X −µ X −µ = SX S/ n t变 换
σX
N(0,1) 0 t(ν) (
X
0
t 分布与正态分布的比较
t 分布:形状与 分布:形状与N(0,1)相似, 相似, 相似 分布中间较小, 但t分布中间较小,两侧较大。 分布中间较小 两侧较大。
随着v增大, 分布逼近 随着 增大,t分布逼近 增大 分布逼近N(0,1); ; v ∞时,t分布演变成 时 分布演变成 分布演变成N(0,1)。 。
参数估计
parameter estimation
统计学
统计描述
统计推断
参数估计
假设检验
总体、 总体、个体和样本
总体(population):调查研究的事物或现象的全体 个体(item unit):组成总体的每个元素 样本(sample):从总体中所抽取的部分个体 样本容量(sample size):样本中所含个体的数量
总体参数
µ、σ、π
可信区间(confidence interval, CI) 可信区间
可信区间
均 数
率
方差
σ2 未知
σ2 已知
总体均数的估计
点估计: 点估计:point estimation 区间估计: 区间估计:interval estimation 样本统计量 点估计) (点估计)
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第7章 参数估计)【圣才出品】
第7章参数估计7.1 考点归纳【知识框架】【考点提示】(1)置信区间的含义理解(选择题、简答题考点);(2)估计量的三个评价标准(判断题、填空题、简答题考点);(3)区间估计的步骤(简答题考点)、总体参数的区间估计选择恰当的统计量(计算题考点);(4)必要样本容量的影响因素、计算(简答题、计算题考点)。
【核心考点】考点一:参数估计的基本原理1.置信区间(1)置信水平为95%的置信区间的含义:用某种方法构造的所有区间中有95%的区间包含总体参数的真值。
(2)置信度愈高(即估计的可靠性愈高),则置信区间相应也愈宽(即估计准确性愈低)。
(3)置信区间的特点:置信区间受样本影响,具有随机性,总体参数的真值是固定的。
一个特定的置信区间“总是包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题。
2.评价估计量的标准(1)无偏性:估计量抽样分布的期望值等于被估计的总体参数,即E(θ∧)=θ。
(2)有效性:估计量的方差尽可能小。
(3)一致性:随着样本量的增大,估计量的值越来越接近被估计总体的参数。
【提示】本考点常见考查方式:①直接考查置信水平为95%的置信区间的含义;②置信度、估计可靠性、置信区间的关系及应用;③置信区间的特点;④给出估计量的具体含义,判断体现了什么标准;⑤直接回答估计量的三个评价标准及具体含义(简答题)。
考点二:一个总体参数的区间估计表7-1 一个总体参数的区间估计【总结】一个总体参数的估计及所使用的分布见图7-1:图7-1 一个总体参数的估计及所使用的分布【真题精选】设总体X~N(μ,σ2),σ2已知,样本容量和置信水平固定,对不同的样本观测值,μ的置信区间的长度()。
[对外经济贸易大学2018研]A.变长B .变短C .保持不变D .不能确定 【答案】C【解析】在正态总体方差已知的条件下,μ的置信区间为/2x z ±ασ所以置信区间长度为/22Z α,当样本容量和置信水平固定时,置信区间长度保持不变。
统计学参数估计
统计学参数估计参数估计是统计学中的一个重要概念,它是指在推断统计问题中,通过样本数据对总体参数进行估计的过程。
这一过程是通过样本数据来推断总体参数的未知值,从而进行总体的描述和推断。
在统计学中,参数是指总体的其中一种特征的度量,比如总体均值、总体方差等。
而样本则是从总体中获取的一部分观测值。
参数估计的目标就是基于样本数据来估计总体参数,并给出估计的精确程度,即估计的可信区间或置信区间。
常见的参数估计方法包括点估计和区间估计。
点估计是一种通过单个数值来估计总体参数的方法。
点估计的核心是选择合适的统计量作为估计量,并使用样本数据计算出该统计量的具体值。
常见的点估计方法包括最大似然估计和矩估计。
最大似然估计是一种寻找参数值,使得样本数据出现的概率最大的方法。
矩估计则是通过样本矩的函数来估计总体矩的方法。
然而,点估计只能提供一个参数的具体值,无法提供该估计值的精确程度。
为了解决这个问题,区间估计被引入。
区间估计是指通过一个区间来估计总体参数的方法。
该区间被称为置信区间或可信区间。
置信区间是在一定置信水平下,总体参数的真值落在该区间内的概率。
置信区间的计算通常涉及到抽样分布、标准误差和分位数等概念。
在实际应用中,参数估计经常用于统计推断、统计检验和决策等环节。
例如,在医学研究中,研究人员可以通过对患者进行抽样调查来估计其中一种药物的有效性和不良反应的发生率。
在市场调研中,市场研究人员可以通过抽取部分样本来估计一些产品的市场份额或宣传效果。
参数估计的准确性和可靠性是统计分析的关键问题。
估计量的方差和偏倚是影响估计准确性的主要因素,通常被称为估计量的精确度和偏倚性。
经典的参数估计要求估计量是无偏且有效的,即估计量的期望值等于真值,并且方差最小。
总之,参数估计是统计学中的一个重要概念,它通过样本数据对总体参数进行估计,并给出估计值的精确程度。
参数估计在统计推断、统计检验和决策等领域具有广泛的应用。
估计量的准确性和可靠性是参数估计的关键问题,通常通过方差和偏倚的分析来评价估计量的性质。
统计学第五版课后练答案(7-8章)
第七章 参数估计7.1 (1)x σ==(2)2x z α∆= 1.96=1.54957.2 某快餐店想要估计每位顾客午餐的平均花费金额。
在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
x σ==(2)在95%的置信水平下,求估计误差。
x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。
置信区间为:2x z x z αα⎛-+ ⎝=()120 4.2,120 4.2-+=(115.8,124.2)7.322x z x z αα⎛-+ ⎝=104560±(87818.856,121301.144) 7.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。
要求:大样本,样本均值服从正态分布:2,x N n σμ⎛⎫ ⎪⎝⎭ 或2,s x N n μ⎛⎫⎪⎝⎭置信区间为:22x z x z αα⎛-+ ⎝=1.2 (1)构建μ的90%的置信区间。
2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(79.03,82.97)(2)构建μ的95%的置信区间。
2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(78.65,83.35)(3)构建μ的99%的置信区间。
2z α=0.005z =2.576,置信区间为:()81 2.576 1.2,81 2.576 1.2-⨯+⨯=(77.91,84.09)7.5 (1)2x z α±=25 1.96±=(24.114,25.886)(2)2x z α±119.6 2.326±=(113.184,126.016)(3)2x z α± 3.419 1.645±(3.136,3.702)7.6 (1)2x z α±=8900 1.96±=(8646.965,9153.035)(2)2x z α±8900 1.96±=(8734.35,9065.65)(3)2x z α±8900 1.645±=(8761.395,9038.605)(4)2x z α±8900 2.58±=(8681.95,9118.05)7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36人,调解:(1)样本均值x =3.32,样本标准差s=1.611α-=0.9,t=2z α=0.05z =1.645,x z α± 3.32 1.645±=(2.88,3.76)1α-=0.95,t=z α=0.025z =1.96,x z α± 3.32 1.96±(2.79,3.85)1α-=0.99,t=z α=0.005z =2.576,2x z α± 3.32 2.76±(2.63,4.01)7.82x t α±=10 2.365±7.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是:10 3 14 86 9 12 117 5 1015 9 16 13 2假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
概率论与数理统计-参数估计
第七章 参数估计
例:
引言
设总体 X 是服从参数为 的指数分布,其中参数
未 知 ,
0 .X1 ,,
X
是总体
n
X
的一个样本,
我们的任务是根据样本,来估计 的取值,从
而估计总体的分布.
这 是 一 个 参 数 估 计 问 题.
第七章 参数估计
§1 点估计 §2 估计量的评选标准 §3 区间估计
第七章 参数估计 §1 点估计
2
令
A1
A2
, (
2
1)
.
第七章 参数估计
例6(续)
解此方程组,得
§1 点估计
ˆ
A1 2 A2 A12
,
ˆ
A2
A1 A12
.
ˆ X 2 ,
即
B2
ˆ X .
B2
其中 B2
1 n
n i 1
Xi X
2 为样本的二阶中心矩.
第七章 参数估计(第二十二讲) 三、 极大似然法
§1 点估计
1
第七章 参数估计
例6(续)
EX 2 x 2 f
x dx x 2
x 1e x dx
0
§1 点估计
2 2 x ( e 2)1 x dx
2 0 2
2 2
1 2
1
2
因此有
EX
,
EX
2
1 .
⑵ 在不引起混淆的情况下,我们统称估计量
与估计值为未知参数 的估计.
第七章 参数估计
二、 矩估计法
§1 点估计
设X为连续型随机变量,其概率密度为
f ( x;1 ,, k ), X为离散型随机变量,其分布列为
参数估计在数理统计学中总体的分布是未知的包括两种情形
第七章 参数估计
1、 矩估计法原理: 以样本矩作为相应地总体矩的估计量; 以样本矩的连续函数作为相应地总体矩的连续函数 的估计量.
设总体 X的 l阶矩 : l E ( X )(l 1,2, , k )存在时 ,
l
由辛钦大数定理知:
1 n l Al X i n i 1
参数估计问题是利用从总体抽样得到的信息来估 计总体的某些参数或者参数的某些函数. 估计新生儿的体重 估计废品率 估计湖中鱼数 在参数估计问题 中,假定总体分 估计降雨量 布形式已知,未 … 知的仅仅是一个 … 或几个参数.
第 2页
第七章 参数估计
参数估计方法:
(1)根据抽自总体的样本 X 1 , X 2 , , X n 去确定参数 空间 中的一点作为 的值
l x p( x;1 ,, k ), l 1,2,, k.
第14页
第七章 参数估计
这是包含 k个未知参数 1, , k 的联立方程组,
1 1 1 , 2 , , k , , , 2 2 1 2 k k k 1 , 2 , , k
其中 1 , , k 是待估参数 , X 1 , , X n为来自 X的样本 .
1) 求总体 X 的 l 阶矩 :
l E ( X ) x f ( x;1 ,, k )dx, l 1,2,, k .
l l
或 l E ( X l )
xR X
------点估计
(2)确定中的某一小部分作为 的取值的范围
------区间估计
第 3页
第七章 参数估计 §1 点估计 §3 估计量的评选标准 §4 区间估计 §5 正态总体均值与方差的区间估计 §6 (0-1)分布参数的区间估计 §7 单侧置信区间
07心理统计学-第七章 参数估计
犯错误的概率,常用α(或p)表示。则1-α为置信 度。(显著性水平越高表示的是α值越小,即犯错误的可
能性越低) α为预先设定的临界点,常用的如.05、.01、.001;p 为检验计算所得的实际(犯错误)概率。
第一节 点估计、区间估计与标准误
三、区间估计与标准误
3、区间估计的原理与标准误
转换成比率为
p
n
p, SE p
n
pq n
同理可得公式7-17。自习[例7-12、例7-13]
1、从某地区抽样调查400人,得到每月人均文化消费为 160元。已知该地区文化消费的总体标准差为40元。试 问该地区的每月人均文化消费额。(α=.05,总体呈正态
分布)
2、上题中总体方差未知,已知Sn-1=44元。 3、已知某中学一次数学考试成绩的分布为正态分布,总 体标准差为5。从总体中随机抽取16名学生,计算得平 均数为81、标准差为Sn=6。试问该次考试中全体考生成 绩平均数的95%置信区间。 4、上题中总体方差未知,样本容量改为17人。 5、假定智商服从正态分布。随机抽取10名我班学生测 得智商分别为98、102、105、105、109、111、117、 123、124、126(可计算得M=112,Sn≈9.4),试以95% 的置信区间估计我班全体的智商平均数。 返回
值表,求tα /2(df)。
5、计算置信区间CI。
σ2已知,区间为M-Zα /2 SE <μ< M+Zα /2 SE;
σ2未知,区间为M-tα /2(df)SE <μ< M+tα /2(df)SE。
6、对置信区间进行解释。
二、σ2已知,对μ的区间估计(Z分布,例7-1 & 2) 三、σ2未知,对μ的区间估计(t分布,例7-3 & 4)
统计学原理:第7章 参数估计
一个总体参数的区间估计
总体参数 均值 比例 方差
7 - 26
符号表示 样本统计量
x
p
2
s2
7.2.1 总体均值的区间估计
1、正态总体、2已知,
非正态总体、大样本
2、正态总体、2未知,小样本
7 - 27
总体均值的区间估计
(1、Z分布)
1. 假定条件
总体服从正态分布,且方差(2) 已知
量进行监测,企业质检部门经常要进行抽检,以分析每袋重 量是否符合要求。现从某天生产的一批食品中随机抽取了25 袋,测得每袋重量如下表所示。已知产品重量的分布服从正 态分布,且总体标准差为10g。试估计该批产品平均重量的 置信区间,置信水平为95%
这表明一个具体的点估计值无法给出估计的可 靠性的度量,一个点估计量的可靠性是由它的 抽样标准误差来衡量的。
7 -9
抽样分布回顾
Xi ~
, 2
..X
~
,
2
n
p Z Z Z 1
2
2
p Z 2
X
X
Z 2
1
p
Z 7 - 10
2
X
X
Z
2
X
1
抽样分布回顾
p
Z
2
X
X
7 - 12
实际情况是,样本均值已知,而总体均值未知 。
x
样本均值与总体均值的距离是对称的,
若某个样本均值落在总体均值的两个标准差范围以内, 则总体均值就会被包括在以样本均值为中心左右两个标 准差的范围之内。
7 - 13
区间估计
(interval estimate)
1. 总体参数估计的一个区间: 样本统计量 加减 估计误差
心理及教育统计学第7章参数估计
章节内容
第一节 点估计、区间估计及标准误 第二节 总体平均数的估计 第三节 标准差与方差的区间估计 第四节 相关系数的区间估计 第五节 比率及比率差异的区间估计
总体参数估计:在研究中从样本获得一组数 据后,通过这组信息,对总体特征进行估计, 即从局部结果推论总体的情况。
总体参数估计分点估计和区间估计两种。
7 8 2 . 2 6 2 2 . 6 7 7 8 2 . 2 6 2 2 . 6 7
71.9684.04
当n2=36时,df2=35,t0.05/2=2.042
7 9 2 . 0 4 2 1 . 5 2 7 9 2 . 0 4 2 1 . 5 2
75.982.1
【例7-4】
根据n2=36的样本估计总体参数μ:
0.95的置信区间 7 8 1 . 9 6 1 . 1 8 7 9 1 . 9 6 1 . 1 8
76.781.3
0.99的置信区间
7 9 2 . 5 8 1 . 1 8 7 9 2 . 5 8 1 . 1 8
75.782.04
83.686.4
总体方差σ2未知,对总体平均数的估计
总体方差未知,用样本的无偏方差(
s
2 n 1
)作为总体
方差的估计值,实现对总体平均数μ的估计。因为在总
体方差未知时,样本平均数的分布为t分布,故应查t值
表,确定t/2或t(1-)/2。
有两种情况:
(1)总体的分布为正态时,可不管n之大小。
(2)总体分布为非正态时,只有n>30,才能用概率对 其抽样分布进行解释,否则不能推论。
0.05水平和0.01水平是人们习惯上常用的两个显著性 水平。
区间估计的原理是抽样分布理论。在计算区间估计值, 解释估计的正确概率时,依据的是该样本统计量的分 布规律及抽样分布的标准误(SE)。
统计学 第七章 参数估计
[
]
2 χα (n) (n)的α 分位数,记为k≜ n k≜
抽样分布
(3)性质 • 若X服从χ2 (n),则均值E(X)=n ,方差 D(X) =2n 。 • χ2分布具有可加性。若 X1,X2相互独立,
X1~ χ2(n1) ,X2~χ2(n2)
则(X1+X2)~χ2(n1+n2) • 当n→∞时,χ2分布渐进于正态分布
σ
2
~ χ (n −1)
2
第三节两个总体参数的区 间估计(112页)
• • • • • • • 一、两个总体均值之差的区间估计 (一)两个总体均值之差的估计:独立样本 大样本:近似于正态分布 小样本: (1)两个总体的方差均已知,近似于正态分布 (2)两个总体的方差均未知但相等,近似于t分布 (3)两个服从正态分布的总体的方差均未知且不等, 但样本容量相等,近似于t分布 • (4)两个总体的方差均未知且不等,样本容量也不 等,近似于t分布,自由度为V
• 解:求(3)的计算步骤: • ①求样本指标:
x =1000小时
σ=50 (小时)
µ x=
σ
n
=
50 100
=(小时) 5
• ②根据给定的F(t)=95%,查概率表得t=1.96。 • ③根据∆x=t×µx=1.96×5=9.8,计算总体平均耐 用时间的上、下限: x − ∆ x=1000-9.8=990.(小时) 2 • 下限 x +∆ x=1000+9.8=1009 .(小时) 8 • 上限 • 所以,以95%的概率保证程度估计该批产品的平均耐 用时间在990.2~1009.8小时之间。
f (x;θ ) 其中 θ
或概率密度为
是未知参数。 是未知参数。
如何求极大似然估 计量呢? 计量呢?
统计学第七章第八章课后题答案
统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。
5. 简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为其中: 2222α2222)(E z n σα=n z E σα2=▪ 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
统计学第7章参数估计1
2. 根据一个具体的样本求出的总体均值的95% 的置信区间( )
A 以95%的概率包含总体均值 B 有5%的可能性包含总体均值 C 一定包含总体均值 D 要么包含总体均值,要么不包含总体均值
常用置信水平的临界值(Zα/2值)
置信水平
90% 95% 99%
α
0.10 0.05 0.01
样本均值经标准化处理后服从自由度为
(n-1)的t分布
t x ~ t(n 1)
s/ n
总体均值μ在1-α的置信水平下的置信区间为
x t
2
s n
【例】某时装店的管理人员想估计其顾客的平均
年龄,随机抽取了16位顾客进行了调查,得到 样本均值为32岁,样本标准差为8岁,假定顾客 的年龄近似服从正态分布,求该店全部顾客平均
α/2
0.05 0.025 0.005
Zα/2
1.645 1.96 2.58
X
- 2.58x
-1.65 x
+1.65x + 2.58x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
评价估计量的标准
1. 无偏性
∧
E(θ) =θ
2. 有效性
对同一总体参数的两个无偏估计量,标准差 越小的估计量估计效果越好,称估计量越有效。
际误差不超过20元,应抽取多少个顾客作 为样本?
解:已知=120(元),Z/2=1.96,E=20(元)
应抽取的样本容量为
n
Z2 2 2
E2
(1.96) 2120 2
统计学第7讲参数估计
• 将此数据作为样本,商店开张后经过该地的人数作为总体。 在95%的置信度下,能否知道每天经过此地的人数?
案例二: 参数估计在品牌认知度中应用
例 某食品厂准备上市一种新产品,并配合以相应的广告 宣传,企业想通过调查孩子们对其品牌的认知情况来 评估广告的效用,以制定下一步的市场推广计划。他 们在该地区随机抽取350个小孩作访问对象,进行儿童 消费者行为与消费习惯调查,其中有一个问句是“你 听说过这个牌子吗?”,在350个孩子中,有112个小 孩的回答是“听说过”。根据这个问句,可以分析这 一消费群体对该品牌的认知情况。食品厂市场部经理 要求,根据这些样本,给定95%的置信度,估计该地 区孩子认知该品牌的比例。
优点:简单、具体明确
缺点:没有给出估计值接近总体参数的程度,也无法说明估 计结果有多大的把握程度。
(一)常用的点估计量
1.总体均值点估计量(样本均值)
x
1 n
n i 1
xi
2.总体方差与标准差点估计量(样本方差与标准差)
2
S2
1 n 1
n i 1
( xi
x)2
S
lnL(, 2 ; x1,
, xn ) n ln
2
n 2
ln
2
1
2
2
n i 1
( xi )2
对, 2求偏导数并令其为零.
ln L 1 n
2 i1
(xi ) 0
ln L
2
华北理工卫生统计学实验指导07参数估计
实验七:参数估计【目的要求】1.掌握均数抽样误差的概念及产生原因2.掌握总体均数的可信区间及估计方法3.熟悉标准差与标准误的区别和联系【案例分析】案例1:某研究者于某年在某市随机调查了200例正常成年人血铅含量(μg/100g),将资料整理成表5-3的频数表形式,试估计该市正常成年人血铅含量的参考值范围及正常成年人平均血铅含量的置信区间。
由于血铅值高于某上限值才被看作异常,故作者将该数据代入公式X+1.64S计算得到该市正常成年人血铅含量95%参考值范围的上界;并用公式X+1.64 s计算得到正常成年人平均血铅含量的95%置信区间的上界。
试问这样做是否合适? 为什X么?应当怎么做?200名正常成年人血铅频数表组段(μg/100g)频数f累计频数累计频率(%)4~252512.58~325728.512~369346.516~3012361.520~2514874.024~2217085.028~1118190.532~818994.536~419396.540~419798.544~119899.048~119999.552~561200100.0合计∑f=200【SPSS操作】Analyze→Descriptive Statistics→Explore→选择变量到Dependent List列表中→选择Display选择框内的Statistics→OK【练习题】一、填空题1.抽样误差是指。
2.标准误是指。
3.总体均数置信区间的计算方法有和。
4.t分布的自由度是。
5.参数估计分为和。
6.总体概率置信区间的计算方法有和。
二、选择题1.表示均数抽样误差大小的统计指标是( )A.标准差B.方差C.均数标准误D.变异系数E.样本标准误S表示( )2.xA.总体均数B.样本均数的标准差C.总体均数离散程度D.变量值X的离散程度3.标准误越大,表示此次抽样得到的样本频率( )A.系统误差越大B.可靠程度越大C.抽样误差越大D.可比性越差4.要减小抽样误差,通常的做法是( )A.适当增加样本例数B.将个体变异控制在一个范围内C.严格挑选观察对象D.增加抽样次数5.关于t分布的图形,下列哪项是错误的( )A.当v趋于无穷时,标准正态分布是t分布的特例B.当v逐渐增大,t分布逐渐逼近标准正态分布C.v越小,则t分布的尾部越高D.t分布是一条以v为中心左右对称的曲线6.已知某地25岁正常成年男性平均收缩压为113.0mmHg,从该地随机抽取20名25岁正常成年男性,测得平均收缩压为119.0 mmHg. 113.0mmHg与119.0mmHg不同,原因是( )A.样本例数太少B.抽样误差C.总体均数不同D.系统误差E.个体差异太大7.从上题的同一个地区再随机抽取20名8岁正常男孩,测得平均收缩压为90 mmHg,标准差为9.8 mmHg.90 mmHg与113.0 mmHg不同,原因是( )A.样本例数太少B.抽样误差C.总体均数不同D.系统误差E.样本均数不可比8.在同一总体随机抽样,样本含量n固定时,a越大,用总体均数的可信区间估计总体均数,估计的情况是()A.错的概率越大B.错的概率越小C.错的概率不变D.其精度越差9.统计推断包括两个重要方面()A.参数估计和假设检验B.计算均数和标准差C.统计描述和假设检验D.计算均数和标准误10.总体均数的可信区间()A.随总体均数而变化B.不随总体均数而变化C.固定区间D.随样本不同而变化11.总体概率的区间估计中,a值越大()A.置信度越大B.置信度越低C.估计的精度下降D.抽样误差越大E.抽样误差越小12.样本频率的标准误越大,()A.置信度越大B.置信度越低C.估计的精度下降D.抽样误差越大E.抽样误差越小13.置信区间和医学参考值范围相比,()A.置信区间也能判断个体值是否正常B.估计的精度好C.估计的精度下降D.置信区间的宽度小于医学参考值范围的宽度E.两者的计算都利于标准误三、判断题1.一般情况下,同一批资料的标准误小于标准差()2.从同一总体中随机抽取样本含量相同的两个样本,他们的样本均数与总体均数相同()3.增加样本含量可以减小抽样误差,所以样本含量越大越好()4.样本含量足够大时,来自正偏峰分布的样本可用正态近似法作参数估计()5.t分布法计算置信区间只适合小样本而不适用于大样本()6.当v一定,a=0.05时,单侧t值小于双侧t值()7.t值相等时,单侧概率小于双侧概率()8.通过样本频率估计总体概率,99%置信区间的精度高于95%置信区间()S都是变异指标,因此它们都可以表示抽样误差的大小()9.S和x四、思考题1.参考值范围和置信区间有什么区别和联系?2.t分布有什么特点?3.什么是均数标准误?意义是什么?如何计算及控制?【作业】1.为了研究某地黄连中小檗碱含量,随机抽查该地20份黄连中小檗碱含量(mg/100g)得平均数为4.35,标准差为0.20,试计算:(1)总体均数的95%和99%的可信区间。
统计学参数估计
统计学参数估计统计学参数估计是统计学中一种重要的方法,它通过观察样本数据来估计总体参数的值。
参数是描述总体特征的数值,例如总体均值、总体比例等。
参数估计的目的是根据样本信息对总体参数进行推断,从而得到总体特征的近似值。
参数估计的过程通常分为点估计和区间估计两种方法。
点估计是指根据样本数据求出总体参数的一个数值估计量,例如样本均值、样本比例等。
点估计的基本思想是用样本统计量作为总体参数的估计值,它是参数的无偏估计量时,表示点估计是一个良好的估计。
区间估计是指根据样本数据求出一个区间,这个区间包含总体参数的真值的概率较高,通常用置信区间表示。
区间估计的基本思想是总体参数位于一个区间中的可能性,而不是一个确定的值。
置信区间的构造依赖于样本统计量的分布以及总体参数的估计量的抽样分布。
点估计和区间估计的方法有很多,其中最常用的是最大似然估计和矩估计。
最大似然估计是指根据已知样本观测值,选择使样本观测值出现的概率最大的总体参数作为估计值。
最大似然估计的基本思想是找到一个参数值,使得已观测到的样本结果出现的概率尽可能大。
矩估计是指根据样本矩的观测值,选择使样本矩的偏差与总体矩的偏差最小的总体参数作为估计值。
矩估计的基本思想是利用样本矩估计总体矩,从而近似估计总体参数。
参数估计在实际应用中具有广泛的应用价值。
例如,在医学研究中,需要对患者的疾病概率进行估计,以帮助医生做出正确的诊断和治疗决策。
在经济学研究中,需要对经济指标(如GDP、通胀率等)进行估计,以帮助政府制定宏观经济政策。
在市场调研中,需要对消费者行为进行估计,以帮助企业确定产品定价和市场策略。
然而,参数估计也存在一些局限性。
首先,参数估计的结果仅仅是对总体参数的估计,并不是总体参数的确切值。
其次,参数估计的结果受到样本容量的影响,样本容量越大,估计结果越可靠。
另外,参数估计还需要满足一些假设条件,如总体分布的形式、样本的独立性等,如果这些假设条件不满足,估计结果可能会失效。
《概率论与数理统计》课件第七章 参数估计
03
若存在, 是否惟一?
添加标题
1
2
3
4
5
6
对于同一个未知参数,不同的方法得到的估计量可能不同,于是提出问题
应该选用哪一种估计量? 用何标准来评价一个估计量的好坏?
常用标准
(1)无偏性
(3)一致性
(2)有效性
7.2 估计量的评选标准
无偏性
一致性
有效性
一 、无偏性
定义1 设 是未知参数θ的估计量
09
则称 有效.
10
比
11
例4 设 X1, X2, …, Xn 是X 的一个样本,
添加标题
问那个估计量最有效?
添加标题
解 ⑴
添加标题
由于
添加标题
验证
添加标题
都是
添加标题
的无偏估计.
都是总体均值
的无偏估计量.
故
D
C
A
B
因为
所以
更有效.
例5 设总体 X 的概率密度为
关于一致性的两个常用结论
1. 样本 k 阶矩是总体 k 阶矩的一致性估计量.
是 的一致估计量.
由大数定律证明
用切比雪夫不 等式证明
似然函数为
其中
解得参数θ和μ的矩估计量为
2
时
3
令
1
当
6
,故
5
,表明L是μ的严格递增函数,又
4
第二个似然方程求不出θ的估计值,观察
添加标题
所以当
01
添加标题
从而参数θ和μ的最大似然估计值分别为
03
添加标题
时L 取到最大值
02
添加标题
第章统计学.参数估计 练习题
第7章参数估计练习题一、填空题共10题,每题2分,共计20分1.参数估计就是用_______ __去估计_______ __;2. 点估计就是用_______ __的某个取值直接作为总体参数的_______ __;3.区间估计是在_______ __的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减_______ __得到;4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为_______ __,也成为_______ __;5.当样本量给定时,置信区间的宽度随着置信系数的增大而_______ __;当置信水平固定时,置信区间的宽度随着样本量的增大而_______ __;6. 评价估计量的标准包含无偏性、_______ __和_______ __;7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可靠程度,就会_______ __置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程度,就要_______ __样本量;8. 估计总体均值置信区间时的估计误差受总体标准差、_______ __和_______ __的影响;9. 估计方差未知的正态总体均值置信区间用公式_______ __;当样本容量大于等于30时,可以用近似公式_______ __;10. 估计正态总体方差的置信区间时,用_____ __分布,公式为______ __;二、选择题共10题,每题1分,共计10分1.根据一个具体的样本求出的总体均值的95%的置信区间 ;A.以95%的概率包含总体均值B.有5%的可能性包含总体均值C.一定包含总体均值D. 要么包含总体均值,要么不包含总体均值2.估计量的含义是指 ;A. 用来估计总体参数的统计量的名称B. 用来估计总体参数的统计量的具体数值C. 总体参数的名称D. 总体参数的具体数值3. 总体均值的置信区间等于样本均值加减边际误差,其中边际误差等于所要求置信水平的临界值乘以 ;A. 样本均值的标准差B. 样本标准差C. 样本方差D. 总体标准差4.一个95%的置信区间是指 ;A. 总体参数有95%的概率落在这一区间内B. 总体参数有5%的概率未落在这一区间内C. 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D. 在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数5. 置信系数表达了置信区间的 ;A. 准确性B. 精确性C. 显着性D. 可靠性6. 在置信水平不变的条件下,要缩小置信区间,则 ;A. 需要增加样本量B. 需要减少样本量C. 需要保持样本量不变D. 需要改变统计量的抽样标准差7. 某地区职工样本的平均工资450元,样本平均数的标准差是5元,该地区全部职工平均工资落在440-460元之间的估计置信度为 ;A. 0.95B.0.9545C. 0.99D. 0.99738. 在其它条件不变的情况下,如果总体均值置信区间半径要缩小成原来的二分之一,则所需的样本容量 ;A. 扩大为原来的4倍B. 扩大为原来的2倍C. 缩小为原来的二分之一D. 缩小为原来的四分之一9. 以下哪个不是用公式n st x ±构造置信区间所需的条件 ;A. 总体均值已知B. 总体服从正态分布C. 总体标准差未知D. 样本容量小于3010. 假设正态总体方差已知,欲对其均值进行区间估计;从其中抽取较小样本后使用的统计量是 ;A. 正态统计量B. 2χ统计量C. t 统计量D. F 统计量三、判断题共10题,每题1分,共计10分1. 在其他条件相同时,95%的置信区间比90%的置信区间宽;2. 比较参数的两个估计量的有效性时,必须保证它们是无偏估计;3. 用95%的置信水平得到某班学生考试成绩的置信区间为60-80分,因此我们可以说60-80分这个区间以95%的概率包含全班学生平均考试成绩的真值;4. 在总体均值和总体比例的区间估计中,边际误差由置信水平和统计量的标准差确定;5. 当正态总体的方差已知时,在小样本条件下,估计总体均值使用的分布是t 分布;6.有效性是指随着样本量的增大,估计量的值越来越接近被估总体的参数;7. 在置信水平一定的条件下,要提高估计的可靠性,就应增大样本量;8. 在样本量一定的条件下,要提高估计的精度,就应降低置信水平;9. 在其他条件不变的情况下,总体数据的方差越大,估计时所需的样本量就越大;10.对于非正态总体,在大样本条件下,估计总体均值使用的分布是正态分布;四、计算题共6题,每题10分,共计60分1、已知某苗圃中树苗高度服从正态分布,今工作人员从苗圃中随机抽取64株,测得苗高并求得其均值62厘米,标准差为8.2厘米;请确定该苗圃中树苗平均高度的置信区间,置信水平95%;2、从水平锻造机的一大批产品中随机抽取20件,测得其尺寸平均值x =32.58,样本方差2S =0.0966;假定该产品的尺寸2~(,)X N μσ,2,μσ均未知;试求2σ的置信度为95%的置信区间;3、某一金融分析师想要估计纽约证券交易所上市公司中拥有现金资产超过总资产百分之十的上市公司的比例;1他希望达到的估计误差不超过0.10,置信度为90%,请确定他所需的样本容量;2假设他根据1所确定的样本容量进行了抽样,并计算得出样本比例为0.13,试构建置信度为90%的总体比例的置信区间;4、某市交通管理部门拟估计该市机动车未按照规定购买保险的比例;1他们希望估计的允许误差不超过0.02,置信度为95%,请确定所需的样本容量;2假设他根据1所确定的样本容量进行了抽样,并计算得出样本比例为0.15,试构建置信度为95%的总体比例的置信区间;5、强生出租车公司拟进行一项调查,调查在六一儿童节那天出租车的平均行驶里程数;为此公司抽取了20辆出租车进行调查,测得样本均值545公里,标准差为140公里;请确定公司所有出租车平均行驶里程的置信区间,置信水平95%;6、某地区的写字楼月租金的标准差为80元,要估计总体均值的95%的置信区间,希望的边际误差为25元,应抽取的样本量是多少。
概率论与数理统计第七章
估计 为1.68,这是点估计.
估计在区间[1.57, 1.84]内,这是区间估计.
一、点估计概念及讨论的问题
例1 已知某地区新生婴儿的体重X~ N(,2),
, 2未知,
…
随机抽查100个婴儿
得100个体重数据
9, 7, 6, 6.5, 5, 5.2, … 而全部信息就由这100个数组成.
求:两个参数a,b的矩估计
解: 写出方 V E 程 (X a(X )r组 ) ˆˆ2
其 中uˆˆ2Xn1in1(Xi X)2
但是
E
(
X
)
Var ( X )
a
b 2 (b a)2
12
即有
(ab2ba)2 12
X
ˆ
2
由方程组求解出a,b的矩估计:
a ˆX 3 ˆ b ˆX 3 ˆ
其中 ˆ:ˆ2 n 1i n1 ( XiX)2
(4) 在最大值点的表达式中, 用样本值代入 就得参数的极大似然估计值 .
两点说明:
1、求似然函数L( ) 的最大值点,可以应
用微积分中的技巧。由于ln(x)是x的增函
数,lnL( )与L( )在 的同一值处达到 它的最大值,假定是一实数,且lnL( ) 是 的一个可微函数。通过求解所谓“似 然方程”: dlnL() 0
E(X1m)=E(X2m)==E(Xnm)= E(Xm)=am . 根据大数定律,样本原点矩Am作为 X1m,X2m, ,Xnm的算术平均值依概率收敛到均 值am=E(Xm).即:
n 1i n1Xim pE(Xm)am
例1 设总体X的概率密度为
f(x)(1)x,
概率论第7章
X1, ... ,Xn是来自总体X的独立同分布样本,分布
律或概率密度函数是f(x,q),其中q∈Q是参数,Q已知, 是q的取值范围.f (x,q)的形式已知,则有统计模型
f ( x1,θ) f ( xn ,θ) θ Q
例1 某种型号的产品N个,其合格率q未知,从中随机
抽取n个(n<<N),设Xi 是第i次抽到的样品,正品Xi=1, 否则 Xi =0,则 X1,X2,…,Xn 就是样本.总体分布为两点
分布B(0,1),参数空间为q=(0,1),则可得统计模型
n
n
xi
n xi
θ i1 (1 θ) i1
用矩估计法估计λ的值。
解 设X为灯管寿命,则
1 n
x n i1 xi 130.55
μ1
E
X
=
1 λ
μ1 m1
μ1
E
X
=
1 λ
X
λˆ 1 0.0077 X
例2 设总体X的均值μ和方差σ2 >0都存在,μ,σ2未知.
X1,…,Xn是来自 X 的样本,试求μ, σ2的矩估计量 .
矩估计量的观察值称为矩估计值 .
总体k阶中心矩 样本k阶中心矩
Vk
Bk
E[ X 1n
n i1
E( X )]k; ( Xi X )k .
例1. 设有一批灯管,其寿命服从参数为λ的指数分 布,今随机从中抽取11只,测得其寿命数据如下:
110, 184, 145, 122, 165, 143, 78, 129, 62, 130, 168
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
标准正态分布
t (df = 13)
t 分布
t (df = 5)
z
x
t 分布与标准正态分布的比较
不同自由度的t分布
t
总体均值的区间估计
(例题分析)
【例】已知某种灯泡的寿命服从正态分布,现从一 批灯泡中随机抽取 16只,测得其使用寿命(小时)如 下。建立该批灯泡平均使用寿命95%的置信区间
(interval estimate)
在点估计的基础上,给出总体参数估
计的一个区间范围,该区间由样本统计 量加减抽样误差而得到的
根据样本统计量的抽样分布能够对样
本统计量与总体参数的接近程度给出一 个概率度量
区间估计的基本原理
以总体均值的区间估计为例: 样本均值在重复抽样或无限总体抽样的情况下 , X ~N(μ,σ2/n)。 由正态分布的3 原则: P(- ≤ X ≤ +)=0.6827 P(-2 ≤ X ≤ +2)=0.9545 P(-3≤ X ≤ +3)=0.9973 实际上,我们可以求出 X 落在总体均值的两侧 任何倍数的标准误差范围内的概率。
2
x z
x z
2
n
2
2
n
x t
2
n
x z
2
n
三、总体比率的区间估计
1. 假定条件
总体服从二项分布
可以由正态分布来近似
使用正态分布统计量 z p z= ~ N (0,1) p(1 p) n 总体比率在1-置信水平下的置信区间为
p z 2
置信区间
(confidence interval)
说明: 1 用一个具体的样本所构造的区间是一个特定的 区间,我们无法知道这个样本所产生的区间是 否包含总体参数的真值 我们只能是希望这个区间是大量包含总体参数真
值的区间中的一个,但它也可能是少数几个不包 含参数真值的区间中的一个
置信区间与置信水平
三、评价估计量的标准
无偏性
(unbiasedness)
无偏性:估计量抽样分布的数学期望等于被估计的
总体参数
ˆ) P(
无偏 有偏
A
B
ˆ
有效性
(efficiency)
有效性:对同一总体参数的两个无偏点估计
量,有更小标准差的估计量更有效
ˆ) P(
的抽样分布
B A
的抽样分布
ˆ
一致性
+1.65x
+2.58x
x
-1.96x
+1.96x
90%的样本 95% 的样本 99% 的样本
置信区间
1.
2.
由样本统计量所构造的总体参数的估计区间称为 置信区间
统计学家在某种程度上确信这个区间会包含真正 的总体参数,所以给它取名为置信区间
区间估计
(interval estimate)
样本均值的抽样分布
/2
x
1–
/2
x =
(1 - ) % 区间包含了
x
% 的区间未包含
置信区间
(95%的置信区间)
点估计值
重复构造出的20个置信区间
置信区间
(confidence interval)
2.如果用95%的置信区间得到的某班的学生考试成绩 的置信区间是(60,80)。 不可以说(60,80)这个区间以95%的概率包含 全班学生平均考试成绩的真值。
25袋食品的重量 112.5
102.6 100.0 116.6 136.8
101.0
107.5 123.5 95.4 102.8
103.0
95.0 102.0 97.8 101.5
102.0
108.8 101.6 108.6 98.4
100.5
115.6 102.2 105.0 93.3
总体方差的区间估计
x z
2
s 7.77 = 39.5 1.645 n 36 = 39.5 2.13 = 37.37,41.63
投保人平均年龄的置信区间为37.37岁~41.63岁
二、总体均值的区间估计
(小样本)
1.
假定条件
总体服从正态分布,且方差(2) 未知
小样本 (n < 30)
25 1 93.21 2 25 1 93.21
12.401
该企业生产的食品总体重量标准差的的置信区 间为7.54g~13.43g
例如, P(-1.96≤
X
≤ +1.96)=0.95
这意味着, P( X -1.96≤ ≤ X +1.96)=0.95
上式说明,如果抽取100个样本来估计均值,由 100个样本均值所构造的100个区间中,约有95 个区间包含总体的均值。
区间估计的图示
- 2.58x
-1.65 x
16灯泡使用寿命的数据 1510 1520 1480 1500
1450
1480 1460
1480
1490 1460
1510
1530 1470
1520
1510 1470
总体均值的区间估计
(例题分析)
解:已知X~N(,2),n=16, 1- = 95%,t/2=2.131 根据样本数据计算得:x = 1490 , s = 24.77 总体均值在1-置信水平下的置信区间为
第 7 章 参数估计
7.1 参数估计的一般问题
7.2 一个总体参数的区间估计 7.3 两个总体参数的区间估计
7.4 样本容量的确定
学习目标
1.
2. 3.
4.
5. 6.
1、估计量与估计值的概念 2、点估计与区间估计的区别 3、评价估计量优良性的标准 4、一个总体参数的区间估计方法 5、两个总体参数的区间估计方法 6、样本容量的确定方法
解:已知 n=100,p=65% , 1- = 95%, z/2=1.96
p z
2
p (1 p ) n
= 65% 1.96
65%(1 65%) 100
= 65% 9.35% = 55.65%,74.35%
该城市下岗职工中女性比率的置信 区间为55.65%~74.35%
(例题分析)
解:已知n=25,1-=95% ,根据样本数据计算得 s2 =93.21 2 (n 1) = 02.025 (24) = 39.364 12 (n 1) = 02.975 (24) = 12.401 2置信度为95%的置信区间为
2 2
39.364 = 56.83 2 180.39
四、总体方差的区间估计
1、 估计一个总体的方差或标准差 2、 假设总体服从正态分布 3、总体方差 2 的点估计量为s2,且 n 1s 2 ~ 2 n 1 2 4、总体方差在1- 置信水平下的置信区间为
n 1s 2 2 n 1s 2 2 2
2 1 2
(consistency)
一致性:随着样本容量的增大,估计量的值越来
越接近被估计的总体参数
较大的样本容量
ˆ) P(
B A
较小的样本容量
ˆ
7.2 一个总体参数的区间估 计
一、总体均值的区间估计 二、总体比率的区间估计 三、总体方差的区间估计
一个总体参数的区间估计
总体参数 符号表示 样本统计量
使用 t 分布统计量 x t= ~ t (n 1) s n
总体均值 在1-置信水平下的置信区间为
x t 2
s n
t 分布
t 分布是类似正态分布的一种对称分布,它通常要比 正态分布平坦和分散。一个特定的分布依赖于称之 为自由度的参数。随着自由度的增大,分布也逐渐 趋于正态分布
x t
2
s 24.77 = 1490 2.131 n 16 = 1490 13.2 = 1476.8,1503.2
该种灯泡平均使用寿命的置信区间为1476.8小时~ 1503.2小时
总体分布
样本容量
σ已知
σ未知
x z S n
S n
大样本 正态分布 小样本 非正态分布x z S大样本
25袋食品的重量
112.5
102.6 100.0
101.0
107.5 123.5
103.0
95.0 102.0
102.0
108.8 101.6
100.5
115.6 102.2
116.6
136.8
95.4
102.8
97.8
101.5
108.6
98.4
105.0
93.3
总体均值的区间估计
(例题分析)
解:已知X~N(,102),n=25, 1- = 95%,z/2=1.96。根据 样本数据计算得: x = 105.36 总体均值在1-置信水平下的置信区间为
总体均值的区间估计
(例题分析)
【 例 】一家食品生产企业以生产袋装食品为主,为对产量 质量进行监测,企业质检部门经常要进行抽检,以分析每袋 重量是否符合要求。现从某天生产的一批食品中随机抽取了 25袋,测得每袋重量如下表所示。已知产品重量的分布服从 正态分布,且总体标准差为 10g 。试估计该批产品平均重量 的置信区间,置信水平为95%
x z
2
10 = 105.36 1.96 n 25 = 105.36 3.92 = 101.44,109.28
该食品平均重量的置信区间为101.44g~109.28g
总体均值的区间估计
(例题分析)
【例】一家保险公司收集到由 36 投保个人组成的随 机样本,得到每个投保人的年龄(周岁)数据如下表。 试建立投保人年龄90%的置信区间