参数估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
24.76 1490 16
Sample Standard Deviation Sample Mean Sample Size
Confidence Level
Intermediate Calculations Standard Error of the Mean Degrees of Freedom t Value
Intermediate Calculations Sample Proportion Z Value Standard Error of the Proportion Interval Half Width Confidence Interval Interval Lower Limit
95%
0.65 -1.959 0.0476 0.093 0.5565
例题分析
x t s
2
n
105 .36 2.06 105 .36 3.99
9.66 25
101 .37 ,109 .35
该食品平均重量的置信区间为:
101.37g~109.35g
该食品平均重量的置信区间为:
101.44g~109.28g
例题分析:PHstat
PHstat>Confidence Intervals>Estimate for the Mean, sigma unknown
例题分析
x z 2
10 105.36 1.96 n 25 105.36 3.92
该食品平均重量的置信区间为: 101.44g~109.28g
例题分析:PHstat
PHstat>Confidence Intervals>Estimate for the Mean, sigma known
12 2 (n 1)为置信区间下限临界值,查 2 分布表确定;
s 2为样本方差。
例题分析
一家食品企业从某天生产的产品中随机抽取 25袋,测得 每袋重量如下表所示。已知产品重量的服从正态分布。 以95%的置信水平建立食品重量方差的置信区间
25袋食品的重量 112.5 102.6 100.0 116.6 136.8 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105.0 93.3
Data Population Standard Deviation Sample Mean Sample Size 10 105.36 25
Confidence Level
Intermediate Calculations Standard Error of the Mean Z Value Interval Half Width
25袋产品的重量 112.5 102.6 100.0 116.6 136.8 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105.0 93.3
Confidence Level 80% 90% 95% 98% 99% 99.8% 99.9% Critical value z 2 1.28 1.645 1.96 2.33 2.57 3.08 3.27
例题分析
为分析产品重量是否符合标准,某企业从一批产品中随机抽 取25袋,测得每袋重量如下。已知产品重量服从正态分布, 且总体标准差为 10g 。试估计该批产品平均重量的置信区间 ,置信水平为95%
95%
6.19 15 2.13
Interval Half Width
Confidence Interval Interval Lower Limit Interval Upper Limit
13.19
1476.80 1503.20
总体比例的区间估计:大样本
总体比例p在1-置信水平下的置信区间为
Interval Upper Limit
0.7434
总体方差的区间估计:正态总体
总体方差 2在1- 置信水平下的置信区间为
2 2 ( n 1 ) s (n 1) s 2 2 2 1 2 (n 1) 2 (n 1) 2 2 ( n 1 ) 为置信区间下限临界值 ,查 分布表确定; 2
x t
2
s x t n
2
s n
s x t 2 n t 2为临界值,t ~ t (n 1),可查t分布表确定; s为样本标准差,替代总 体标准差
t 分布
t分布是近似正态分布的一种对称分布,但更平坦和 分散。t分布依赖于自由度(n-1),随着自由度的增 大,逐渐趋近于正态分布
Sample Standard Deviation Sample Mean Sample Size Confidence Level Intermediate Calculations t Value Interval Half Width Confidence Interval Interval Lower Limit
某城市想要估计 下岗女性职工比 例,随机地抽取 了 100 名 下 岗 职 工,其中 65 人为 女性。试以 95% 的置信水平估计 该城市下岗职工 中女性比例的置 信区间
p z
2
p (1 p ) n
65%(1 65%) 65% 1.96 100 65% 9.35% 55.65%,74.35%
12,22已知时,1-2的置信区间为
( x1 x 2 ) z 2
2 12 2 n1 n2
12,22未知时,1-2的置信区间为
( x1 x2 ) z 2
2 s12 s2 n1 n2
2 ( s12 , s2 为样本方差)
例题分析
某地区教育管理部门想 估计两所中学高考英语 平均分数之差。在两所 中学随机抽取两个样本 ,有关数据如右表 。建 立两所中学平均分数之 差95%的置信区间
例:95%的置信区间
点估计值
重复构造出的20个置信区间
一个总体参数的区间估计
总体参数 符号表示 样本统计量
均值
比例
x
p
2
p
s
2
方差
总体均值估计:正态总体&方差已知
总体均值 在1- 置信水平下的置信区间为
x z 2
x z 2 n n
x z 2 n z 2为临界值,z ~ N (0,1),可查标准正态分布表 确定;
两所中学高考英语平均分数之差的置信区间为 5.03分~10.97分
均值差的区间估计:T分布
95%
2 -1.959 3.9199
Confidence Interval
Interval Lower Limit Interval Upper Limit 101.44 109.27
例题分析:PHstat
输入样本数据
总体均值估计:正态总体&方差未知
总体均值 在1- 置信水平下的置信区间为
25
93.21 95% 5297.08 16814.1
两个总体参数的区间估计
总体参数 均值差 比例差 方差比 符号表示 样本统计量
1 2
p1 p2
2 12 2
x1 x2 p1 p2
s s
2 1
2 2
均值差的区间估计:正态分布
假设条件:样本来自两个正态总体,或两个样 本均为大样本(n1, n2>30)时
9.65 105.36 25.00 0.95
输入样本数据
2.06 3.99
101.37
Interval Upper Limit
109.35
例题分析:PHstat
PHstat>Confidence Intervals>Estimate for the Mean, sigma unknown
Data
该城市下岗职工中女性比例的置信 区间为:55.65%~74.35%
例题分析:PHstat
Baidu Nhomakorabea
PHstat>Confidence Intervals>Estimate for the proportion
Sample Size Number of Successes 100 65
Confidence Level
区间估计
随机样本 总体
(均值, μ, 未知)
均值 x = 50
置信水平 我有 95%的把 握相信总体均 值μ介于40和 60之间
样本
置信水平(Confidence Level)
用随机样本重复构造置信区间,所有区间中包 含总体参数的比例称为置信水平 表示为 (1- 为总体参数未在区间内的比例 常用的置信水平值有 99%, 95%, 90% 相应的 为0.01,0.05,0.10
p z 2 p(1 - p) p(1 - p) p p z 2 n n
p (1 - p ) p z 2 n z 2为临界值,z ~ N (0,1),可查标准正态分布表确定; p为样本比例; 大样本:np 5; n(1 p) 5
例题分析
例题分析:PHstat
PHstat>Confidence Intervals>Estimate for the population variance
可使用Excel中的 STDEV函数计算
Data
Sample Size
Sample Standard Deviation Confidence Level Results Interval Lower Limit for Variance Interval Upper Limit for Variance
总体标准差; n 样本容量; x 样本均值
确定临界值:置信水平 = 95%
1 0.95 0.05
Z 2 Z 0.025 1.96
0.025
0.95
0
0.025
Z0.025 = -1.96
临界值
Z0.025 = 1.96
临界值
正态分布常用置信水平及临界值
区间估计( Interval Estimate )
置信区间 下限
点估计 区间估计 (置信区间)
置信区间 上限
点估计
我们可以用……估计 总体参数 一个样本统计量 (点估计)
均值 比例
μ p
x p
为何引入区间估计?
总体参数是确定的,样本统计量(点估计) 是不确定的(随机的) 区间估计能够对总体参数与样本统计量的 离差给出一个概率度量(置信水平)
标准正态分布
标准正态分布
t (df = 13)
t 分布
t (df = 5)
z
x
t 分布与标准正态分布的比较
不同自由度的t分布
t
例题分析
为分析产品重量是否符合标准,某企业从一批产品中随机抽 取25袋,测得每袋重量如下。已知产品重量服从正态分布, 试估计该批产品平均重量的置信区间,置信水平为95%
25袋产品的重量 112.5 102.6 100.0 116.6 136.8 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105.0 93.3
两个样本的有关数据 中学1 中学2
n1=46
n2=33
x1 86
S1=5.8
x2 78
S2=7.2
例题分析
解: 两个总体均值之差在1-置信水平下的置信区间为
( x1 x 2 ) z 2
2 s12 s 2 n1 n2
5.8 2 7.2 2 (86 78) 1.96 46 33 8 2.97 (5.03,10.97)
第7章 参数估计
Estimating Population Values
用样本统计量推断总体参数
样本统计量
(已知)
推断
总体参数
(未知, 但可以用样本
统计量 来估计)
样本
总体
总体参数的估计方法
点估计(Point Estimate)
给出总体参数的一个单个估计值 给出总体参数的一个估计范围(置信区间)
Sample Standard Deviation Sample Mean Sample Size
Confidence Level
Intermediate Calculations Standard Error of the Mean Degrees of Freedom t Value
Intermediate Calculations Sample Proportion Z Value Standard Error of the Proportion Interval Half Width Confidence Interval Interval Lower Limit
95%
0.65 -1.959 0.0476 0.093 0.5565
例题分析
x t s
2
n
105 .36 2.06 105 .36 3.99
9.66 25
101 .37 ,109 .35
该食品平均重量的置信区间为:
101.37g~109.35g
该食品平均重量的置信区间为:
101.44g~109.28g
例题分析:PHstat
PHstat>Confidence Intervals>Estimate for the Mean, sigma unknown
例题分析
x z 2
10 105.36 1.96 n 25 105.36 3.92
该食品平均重量的置信区间为: 101.44g~109.28g
例题分析:PHstat
PHstat>Confidence Intervals>Estimate for the Mean, sigma known
12 2 (n 1)为置信区间下限临界值,查 2 分布表确定;
s 2为样本方差。
例题分析
一家食品企业从某天生产的产品中随机抽取 25袋,测得 每袋重量如下表所示。已知产品重量的服从正态分布。 以95%的置信水平建立食品重量方差的置信区间
25袋食品的重量 112.5 102.6 100.0 116.6 136.8 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105.0 93.3
Data Population Standard Deviation Sample Mean Sample Size 10 105.36 25
Confidence Level
Intermediate Calculations Standard Error of the Mean Z Value Interval Half Width
25袋产品的重量 112.5 102.6 100.0 116.6 136.8 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105.0 93.3
Confidence Level 80% 90% 95% 98% 99% 99.8% 99.9% Critical value z 2 1.28 1.645 1.96 2.33 2.57 3.08 3.27
例题分析
为分析产品重量是否符合标准,某企业从一批产品中随机抽 取25袋,测得每袋重量如下。已知产品重量服从正态分布, 且总体标准差为 10g 。试估计该批产品平均重量的置信区间 ,置信水平为95%
95%
6.19 15 2.13
Interval Half Width
Confidence Interval Interval Lower Limit Interval Upper Limit
13.19
1476.80 1503.20
总体比例的区间估计:大样本
总体比例p在1-置信水平下的置信区间为
Interval Upper Limit
0.7434
总体方差的区间估计:正态总体
总体方差 2在1- 置信水平下的置信区间为
2 2 ( n 1 ) s (n 1) s 2 2 2 1 2 (n 1) 2 (n 1) 2 2 ( n 1 ) 为置信区间下限临界值 ,查 分布表确定; 2
x t
2
s x t n
2
s n
s x t 2 n t 2为临界值,t ~ t (n 1),可查t分布表确定; s为样本标准差,替代总 体标准差
t 分布
t分布是近似正态分布的一种对称分布,但更平坦和 分散。t分布依赖于自由度(n-1),随着自由度的增 大,逐渐趋近于正态分布
Sample Standard Deviation Sample Mean Sample Size Confidence Level Intermediate Calculations t Value Interval Half Width Confidence Interval Interval Lower Limit
某城市想要估计 下岗女性职工比 例,随机地抽取 了 100 名 下 岗 职 工,其中 65 人为 女性。试以 95% 的置信水平估计 该城市下岗职工 中女性比例的置 信区间
p z
2
p (1 p ) n
65%(1 65%) 65% 1.96 100 65% 9.35% 55.65%,74.35%
12,22已知时,1-2的置信区间为
( x1 x 2 ) z 2
2 12 2 n1 n2
12,22未知时,1-2的置信区间为
( x1 x2 ) z 2
2 s12 s2 n1 n2
2 ( s12 , s2 为样本方差)
例题分析
某地区教育管理部门想 估计两所中学高考英语 平均分数之差。在两所 中学随机抽取两个样本 ,有关数据如右表 。建 立两所中学平均分数之 差95%的置信区间
例:95%的置信区间
点估计值
重复构造出的20个置信区间
一个总体参数的区间估计
总体参数 符号表示 样本统计量
均值
比例
x
p
2
p
s
2
方差
总体均值估计:正态总体&方差已知
总体均值 在1- 置信水平下的置信区间为
x z 2
x z 2 n n
x z 2 n z 2为临界值,z ~ N (0,1),可查标准正态分布表 确定;
两所中学高考英语平均分数之差的置信区间为 5.03分~10.97分
均值差的区间估计:T分布
95%
2 -1.959 3.9199
Confidence Interval
Interval Lower Limit Interval Upper Limit 101.44 109.27
例题分析:PHstat
输入样本数据
总体均值估计:正态总体&方差未知
总体均值 在1- 置信水平下的置信区间为
25
93.21 95% 5297.08 16814.1
两个总体参数的区间估计
总体参数 均值差 比例差 方差比 符号表示 样本统计量
1 2
p1 p2
2 12 2
x1 x2 p1 p2
s s
2 1
2 2
均值差的区间估计:正态分布
假设条件:样本来自两个正态总体,或两个样 本均为大样本(n1, n2>30)时
9.65 105.36 25.00 0.95
输入样本数据
2.06 3.99
101.37
Interval Upper Limit
109.35
例题分析:PHstat
PHstat>Confidence Intervals>Estimate for the Mean, sigma unknown
Data
该城市下岗职工中女性比例的置信 区间为:55.65%~74.35%
例题分析:PHstat
Baidu Nhomakorabea
PHstat>Confidence Intervals>Estimate for the proportion
Sample Size Number of Successes 100 65
Confidence Level
区间估计
随机样本 总体
(均值, μ, 未知)
均值 x = 50
置信水平 我有 95%的把 握相信总体均 值μ介于40和 60之间
样本
置信水平(Confidence Level)
用随机样本重复构造置信区间,所有区间中包 含总体参数的比例称为置信水平 表示为 (1- 为总体参数未在区间内的比例 常用的置信水平值有 99%, 95%, 90% 相应的 为0.01,0.05,0.10
p z 2 p(1 - p) p(1 - p) p p z 2 n n
p (1 - p ) p z 2 n z 2为临界值,z ~ N (0,1),可查标准正态分布表确定; p为样本比例; 大样本:np 5; n(1 p) 5
例题分析
例题分析:PHstat
PHstat>Confidence Intervals>Estimate for the population variance
可使用Excel中的 STDEV函数计算
Data
Sample Size
Sample Standard Deviation Confidence Level Results Interval Lower Limit for Variance Interval Upper Limit for Variance
总体标准差; n 样本容量; x 样本均值
确定临界值:置信水平 = 95%
1 0.95 0.05
Z 2 Z 0.025 1.96
0.025
0.95
0
0.025
Z0.025 = -1.96
临界值
Z0.025 = 1.96
临界值
正态分布常用置信水平及临界值
区间估计( Interval Estimate )
置信区间 下限
点估计 区间估计 (置信区间)
置信区间 上限
点估计
我们可以用……估计 总体参数 一个样本统计量 (点估计)
均值 比例
μ p
x p
为何引入区间估计?
总体参数是确定的,样本统计量(点估计) 是不确定的(随机的) 区间估计能够对总体参数与样本统计量的 离差给出一个概率度量(置信水平)
标准正态分布
标准正态分布
t (df = 13)
t 分布
t (df = 5)
z
x
t 分布与标准正态分布的比较
不同自由度的t分布
t
例题分析
为分析产品重量是否符合标准,某企业从一批产品中随机抽 取25袋,测得每袋重量如下。已知产品重量服从正态分布, 试估计该批产品平均重量的置信区间,置信水平为95%
25袋产品的重量 112.5 102.6 100.0 116.6 136.8 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105.0 93.3
两个样本的有关数据 中学1 中学2
n1=46
n2=33
x1 86
S1=5.8
x2 78
S2=7.2
例题分析
解: 两个总体均值之差在1-置信水平下的置信区间为
( x1 x 2 ) z 2
2 s12 s 2 n1 n2
5.8 2 7.2 2 (86 78) 1.96 46 33 8 2.97 (5.03,10.97)
第7章 参数估计
Estimating Population Values
用样本统计量推断总体参数
样本统计量
(已知)
推断
总体参数
(未知, 但可以用样本
统计量 来估计)
样本
总体
总体参数的估计方法
点估计(Point Estimate)
给出总体参数的一个单个估计值 给出总体参数的一个估计范围(置信区间)