统计学参数估计精
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 我们只能是希望这个区间是大量包含总体参数真 值的区间中的一个,但它也可能是少数几个不包 含参数真值的区间中的一个
点估计值
置信区间
(95%的置信区间)
重复构造出的20个置信区间
置信区间与置信水平
均值的抽样分布
x
/2
1 –
/2
x x
(1 - ) % 区间包含了 % 的区间未包含
评价估计量的标准
1. 用样本的估计量直接作为总体参数的估计值 用什么样的估计量来估计参数呢? 实际上没有硬性限制。任何统计量,只要人们觉得 合适就可以当成估计量。 ▪ 例如:用样本均值直接作为总体均值的估计 ▪ 例如:用两个样本均值之差直接作为总体均 值之差的估计
2. 没有给出估计值接近总体参数程度的信息
区间估计
• 估计就是根据你拥有的信息来对现实世界进行 某种判断。
• 你可以根据一个人的衣着、言谈和举止判断其 身份
• 你可以根据一个人的脸色,猜出其心情和身体 状况
• 统计中的估计也不例外,它是完全根据数据做 出的。
• 如果我们想知道北京人认可某饮料的比例,人 们只有在北京人中进行抽样调查以得到样本, 并用样本中认可该饮料的比例来估计真实的比 例。
(interval estimate)
当描述一个人的体重时,你一般可能不会说这个 人是76.35公斤,你会说这个人是七八十公斤, 或者是在70公斤到80公斤之间。这个范围就是区 间估计的例子。
区间估计 (interval estimate)
1. 在点估计的基础上,给出总体参数估计的一个区间 范围,该区间由样本统计量加减抽样误差而得到的
2. 根据样本统计量的抽样分布能够对样本统计量与总 体参数的接近程度给出一个概率度量
– 比如,某班级平均分数在75~85之间,置信水平是95%
•点估计给出一个数
字,用起来很方便;
而区间估计给出一
个区间,说起来留
有余地;不像点估
计那么绝对。
置信下限
置信区间
样本统计量 (点估计)
置信上限
区间估计的图示
P( X x )
这里的a也称为上(右)侧尾概率 (upper/right tail probability)。
显然,对于连续对称分布,α上侧分位数等 于(1-α)下侧分位数,而(1-α)下侧分位 数等于α上侧分位数。
通常用zα表示标准正态分布的α上侧分位数,即对于 标准正态分布变量Z,有P(Z>zα)= α 。
• 从不同的样本得到的结论也不会完全一样。虽 然真实的比例在这种抽样过程中永远也不知道; 但可以知道估计出来的比例和真实的比例大致 差多少。
5.1 参数估计的一般问题
5.1.1 估计量与估计值 5.1.2 点估计与区间估计 5.1.3 评价估计量的标准
估计量与估计值
估计量与估计值
(estimator & estimated value)
0.25
0.2
0.15
0.1
P(z<z0.05)=1- =0.95
P(ˆ) 较大的样本容量 B
较小的样本容量
A
ˆ
5.2 一个总体参数的区间估计
5.2.1 总体均值的区间估计 5.2.2 总体比例的区间估计 5.2.3 总体方差的区间估计
一个总体参数的区间估计
总体参数 均值 比例 方差
符号表示 样本统计量
x
p
2
s2
分位数
我们有必要引进总体的下侧分位数、上侧分位数以 及相应的尾概率的概念。
第 5 章 参数估计
5.1 参数估计的一般问题 5.2 一个总体参数的区间估计 5.3 两个总体参数的区间估计 5.4 样本容量的确定
学习目标
1. 估计量与估计值的概念 2. 点估计与区间估计的区别 3. 评价估计量优良性的标准 4. 一个总体参数的区间估计方法 5. 两个总体参数的区间估计方法 6. 样本容量的确定方法
x z 2 x
x
- 2.58x
x
-1.65 x
+1.65x + 2.58x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
置信水平
1. 将构造置信区间的步骤重复很多次,置 信区间包含总体参数真值的次数所占的 比例称为置信水平
2. 表示为 (1 -
为是总体参数未在区间内的比例
3. 常用的置信水平值有 99%, 95%, 90%
相应的 为0.01,0.05,0.10
置信区间
(confidence interval)
1. 由样本统计量所构造的总体参数的估计区间称 为置信区间
2. 统计学家在某种程度上确信这个区间会包含真 正的总体参数,所以给它取名为置信区间
3. 用一个具体的样本所构造的区间是一个特定的 区间,我们无法知道这个样本所产生的区间是 否包含总体参数的真值
无偏性
(unbiasedness)
无偏性:估计量抽样分布的数学期望等于被 估计的总体参数
P(ˆ)
无偏
有偏
A
B
ˆ
有效性
(efficiency)
有效性:对同一总体参数的两个无偏点估计
量,有更小标准差的估计量更有效
P(ˆ)
ˆ1 的抽样分布
B
A
ˆ2 的抽样分布
来自百度文库
ˆ
一致性
(consistency)
一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数
对于连续型随机变量X,a下侧分位数(又称为a分 位数,a-quantile)定义为数xa,它满足关系
P( X x )
这里的a又称为下(左)侧尾概率(lower/left tail probability)
而a上 侧分 位 数 ( 又 称a 上分 位数 ,a-upper
quantile)定义为数xa,它满足关系
1. 估计量:用于估计总体参数的随机变量
– 如样本均值,样本比例、样本方差等
– 例如: 样本均值就是总体均值 的一个估计量
2. 参数用 表示,估计量用ˆ 表示
3. 估计值:估计参数时计算出来的统计量的 具体值
– 如果样本均值 x =80,则80就是的估计值
二战中的 点估计
点估计与区间估计
点估计 (point estimate)
表示了0.05上侧分位数zα=z0.05及相应的尾概率( α =0.05)。有些书用符号z1-α而不是Zα ;因此在
看参考文献时要注意符号的定义。
N(0,1)分布右侧尾概率P(z>z)=的示意
图
Tail Probability for N(0,1)
0.4
0.35
0.3
Density of N(0,1)
点估计值
置信区间
(95%的置信区间)
重复构造出的20个置信区间
置信区间与置信水平
均值的抽样分布
x
/2
1 –
/2
x x
(1 - ) % 区间包含了 % 的区间未包含
评价估计量的标准
1. 用样本的估计量直接作为总体参数的估计值 用什么样的估计量来估计参数呢? 实际上没有硬性限制。任何统计量,只要人们觉得 合适就可以当成估计量。 ▪ 例如:用样本均值直接作为总体均值的估计 ▪ 例如:用两个样本均值之差直接作为总体均 值之差的估计
2. 没有给出估计值接近总体参数程度的信息
区间估计
• 估计就是根据你拥有的信息来对现实世界进行 某种判断。
• 你可以根据一个人的衣着、言谈和举止判断其 身份
• 你可以根据一个人的脸色,猜出其心情和身体 状况
• 统计中的估计也不例外,它是完全根据数据做 出的。
• 如果我们想知道北京人认可某饮料的比例,人 们只有在北京人中进行抽样调查以得到样本, 并用样本中认可该饮料的比例来估计真实的比 例。
(interval estimate)
当描述一个人的体重时,你一般可能不会说这个 人是76.35公斤,你会说这个人是七八十公斤, 或者是在70公斤到80公斤之间。这个范围就是区 间估计的例子。
区间估计 (interval estimate)
1. 在点估计的基础上,给出总体参数估计的一个区间 范围,该区间由样本统计量加减抽样误差而得到的
2. 根据样本统计量的抽样分布能够对样本统计量与总 体参数的接近程度给出一个概率度量
– 比如,某班级平均分数在75~85之间,置信水平是95%
•点估计给出一个数
字,用起来很方便;
而区间估计给出一
个区间,说起来留
有余地;不像点估
计那么绝对。
置信下限
置信区间
样本统计量 (点估计)
置信上限
区间估计的图示
P( X x )
这里的a也称为上(右)侧尾概率 (upper/right tail probability)。
显然,对于连续对称分布,α上侧分位数等 于(1-α)下侧分位数,而(1-α)下侧分位 数等于α上侧分位数。
通常用zα表示标准正态分布的α上侧分位数,即对于 标准正态分布变量Z,有P(Z>zα)= α 。
• 从不同的样本得到的结论也不会完全一样。虽 然真实的比例在这种抽样过程中永远也不知道; 但可以知道估计出来的比例和真实的比例大致 差多少。
5.1 参数估计的一般问题
5.1.1 估计量与估计值 5.1.2 点估计与区间估计 5.1.3 评价估计量的标准
估计量与估计值
估计量与估计值
(estimator & estimated value)
0.25
0.2
0.15
0.1
P(z<z0.05)=1- =0.95
P(ˆ) 较大的样本容量 B
较小的样本容量
A
ˆ
5.2 一个总体参数的区间估计
5.2.1 总体均值的区间估计 5.2.2 总体比例的区间估计 5.2.3 总体方差的区间估计
一个总体参数的区间估计
总体参数 均值 比例 方差
符号表示 样本统计量
x
p
2
s2
分位数
我们有必要引进总体的下侧分位数、上侧分位数以 及相应的尾概率的概念。
第 5 章 参数估计
5.1 参数估计的一般问题 5.2 一个总体参数的区间估计 5.3 两个总体参数的区间估计 5.4 样本容量的确定
学习目标
1. 估计量与估计值的概念 2. 点估计与区间估计的区别 3. 评价估计量优良性的标准 4. 一个总体参数的区间估计方法 5. 两个总体参数的区间估计方法 6. 样本容量的确定方法
x z 2 x
x
- 2.58x
x
-1.65 x
+1.65x + 2.58x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
置信水平
1. 将构造置信区间的步骤重复很多次,置 信区间包含总体参数真值的次数所占的 比例称为置信水平
2. 表示为 (1 -
为是总体参数未在区间内的比例
3. 常用的置信水平值有 99%, 95%, 90%
相应的 为0.01,0.05,0.10
置信区间
(confidence interval)
1. 由样本统计量所构造的总体参数的估计区间称 为置信区间
2. 统计学家在某种程度上确信这个区间会包含真 正的总体参数,所以给它取名为置信区间
3. 用一个具体的样本所构造的区间是一个特定的 区间,我们无法知道这个样本所产生的区间是 否包含总体参数的真值
无偏性
(unbiasedness)
无偏性:估计量抽样分布的数学期望等于被 估计的总体参数
P(ˆ)
无偏
有偏
A
B
ˆ
有效性
(efficiency)
有效性:对同一总体参数的两个无偏点估计
量,有更小标准差的估计量更有效
P(ˆ)
ˆ1 的抽样分布
B
A
ˆ2 的抽样分布
来自百度文库
ˆ
一致性
(consistency)
一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数
对于连续型随机变量X,a下侧分位数(又称为a分 位数,a-quantile)定义为数xa,它满足关系
P( X x )
这里的a又称为下(左)侧尾概率(lower/left tail probability)
而a上 侧分 位 数 ( 又 称a 上分 位数 ,a-upper
quantile)定义为数xa,它满足关系
1. 估计量:用于估计总体参数的随机变量
– 如样本均值,样本比例、样本方差等
– 例如: 样本均值就是总体均值 的一个估计量
2. 参数用 表示,估计量用ˆ 表示
3. 估计值:估计参数时计算出来的统计量的 具体值
– 如果样本均值 x =80,则80就是的估计值
二战中的 点估计
点估计与区间估计
点估计 (point estimate)
表示了0.05上侧分位数zα=z0.05及相应的尾概率( α =0.05)。有些书用符号z1-α而不是Zα ;因此在
看参考文献时要注意符号的定义。
N(0,1)分布右侧尾概率P(z>z)=的示意
图
Tail Probability for N(0,1)
0.4
0.35
0.3
Density of N(0,1)