参数估计课件讲解
合集下载
概率论与数理统计第7章参数估计PPT课件
5
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,
第七讲参数估计-685304785解析PPT课件
.
对于总体被估计参数θ,找出样本的两个估计量θ1和θ2, (θ1<θ2)使被估计参数落在区间(θ1,θ2)内的概率为 1-α,其中α为介于0—1之间的已知数,即
P(θ1≤θ≤θ2)=1-α
11
.
称区间(θ1,θ2)为总体参数的估计区间,θ1为 估计下限,θ2为估计上限,1-α为估计置信度(表示 用置信区间估计的可靠性),α为显著性水平(表示 用置信区间估计不可靠的程度)。
绝对离差不超过4元的概率为19/25=76%,抽 样误差不超过8元的概率为100%。
抽样误差范围和估计置信度是密不可分的, 抽样误差愈小,估计准确度愈高,但置信度愈小。
18
.
置信度与准确性的关系
19
.
当均值为0,标准差为1 时,正态分布为标准化 正态分布。
20
.
4、抽样误差范围的计算 假定我们以Z表示置信度, S表示样本的标准差,
14
例2、用有放回抽样的方法,从5人中间抽取2个构成样本, 求样本日平均工资,并推算总体的工资水平置信区间
样本变量
34
38
42
46
50
34
34
36
38
40
42
.
38
36
38
40
42
44
42
38
40
42
44
46
46
40
42
44
46
48
50
42
44
46
48
50
15
样本日平均工资
34 36 38 40 42 44 46 48 50 合计
4
.
二、点估计的估计方法
第四讲参数估计PPT课件
0.50
均数 的均 数
4.99
5.00
均数标准差
0.2212 0.1580
5.00 0.0920
n
0.2236 0.1581 0.0913
由表1可见,从同一总体中随机抽取样本含 量n=10的若干样本,各样本算得的样本均 数并不等于相应的总体均数,且各样本均 数也不完全相同。这种由于随机抽样而造 成的来自同一总体的样本均数之间及样本 均数与相应的总体均数之间的差异,称之 为均数的抽样误差。
总体均数可信区间的计算
Hale Waihona Puke 总体均数可信区间的计算 需考虑: (1)总体标准差 是否已知, (2)样本含量n的大小 通常有两类方法: (1)t分布法
(2)u分布法
1. 单一总体均数的可信区间 (1) 未 知 : 按 t 分 布 。
双 侧 1 可 信 区 间 则 为 :
X t 2 , S X < X t 2 , S X ( X t S 2 , X , X t 2 , S X )
由于样本均数与相应的总体均数之间存在着 差异,由数理统计推理可知:从正态总体中 随机抽取样本含量为n的样本,每抽取一个 样本可计算一个样本均数,重复100次抽样可 得到100个样本均数。
这些样本均数服从均数为
,方差为
2 x
的正态分布.其中 x 为样本均数的总
体标准差,计算公式为: / n X
2. 两总体均数之差的可信区间: 从相 等,但 不等的两个正态总体 N(1, 2)和 N(2, 2)进行随机抽样。则两总体均数之差
( 1 2 )的双侧1 可信区间为
(X 1X2)t/2,SX1X2
( n 1 1 ) ( n 2 1 ) n 1 n 2 2
S X1X 2
均数 的均 数
4.99
5.00
均数标准差
0.2212 0.1580
5.00 0.0920
n
0.2236 0.1581 0.0913
由表1可见,从同一总体中随机抽取样本含 量n=10的若干样本,各样本算得的样本均 数并不等于相应的总体均数,且各样本均 数也不完全相同。这种由于随机抽样而造 成的来自同一总体的样本均数之间及样本 均数与相应的总体均数之间的差异,称之 为均数的抽样误差。
总体均数可信区间的计算
Hale Waihona Puke 总体均数可信区间的计算 需考虑: (1)总体标准差 是否已知, (2)样本含量n的大小 通常有两类方法: (1)t分布法
(2)u分布法
1. 单一总体均数的可信区间 (1) 未 知 : 按 t 分 布 。
双 侧 1 可 信 区 间 则 为 :
X t 2 , S X < X t 2 , S X ( X t S 2 , X , X t 2 , S X )
由于样本均数与相应的总体均数之间存在着 差异,由数理统计推理可知:从正态总体中 随机抽取样本含量为n的样本,每抽取一个 样本可计算一个样本均数,重复100次抽样可 得到100个样本均数。
这些样本均数服从均数为
,方差为
2 x
的正态分布.其中 x 为样本均数的总
体标准差,计算公式为: / n X
2. 两总体均数之差的可信区间: 从相 等,但 不等的两个正态总体 N(1, 2)和 N(2, 2)进行随机抽样。则两总体均数之差
( 1 2 )的双侧1 可信区间为
(X 1X2)t/2,SX1X2
( n 1 1 ) ( n 2 1 ) n 1 n 2 2
S X1X 2
参数估计课件讲解
样本统计量 (点估计)
置信区间
置信下限
置信上限
13
(3)置信水平:如果我们将构造置信区间的步骤重 复多次,置信区间中包含总体参数真值的次数所 占的比率,称为置信水平。
在构造置信区间时,我们可以用所希望的值作为
置信水平。比较常用的置信水平是:90%,95% 和99%,通常用 1- 表示置信水平,其中 称 为显著性水平。
由抽样平均误差
mx =
s = 1.5 =0.15(小时) n 10
D x = zm= 1.96? 0.15 0.29(4 小时)
\ x - 0.294 #X x + 0.294,即3.706 #X 4.294
因此,以95%置信度,估计该地区内居民每天
看电视的平均时间在3.706到4.294个小时之间。
18
4. F(z)、 z、 Δ、μ之间的关系
F(z)与z具有一一对应的关系,所以已知概率 保证程度F(z)就可以求出概率度z ;若已知z 也就可以知道F(z)。
给定F(z) z Δ = z×μ
样本 μ 和总体参数的点估计值
m= s n
给定Δ
抽样平均误差
Δ/μ= z
F(z)
19
5.区间估计的特点
(1)指出总体被估计参数的上限和下限, 即指出总体参数的可能范围,而不是直 接给出总体参数的估计值。
14
两个需要注意的问题
如果用某种方法构造的所有区间中有95%的 区间包含总体参数的真值,5%的区间不包含 总体参数的真值,那么,用该方法构造的区 间称为置信水平为95%的置信区间。
置信区间是一个随机区间,它会因样本的不 同而不同,而且不是所有的区间都包含参数 真值。
15
2.抽样误差汇总
置信区间
置信下限
置信上限
13
(3)置信水平:如果我们将构造置信区间的步骤重 复多次,置信区间中包含总体参数真值的次数所 占的比率,称为置信水平。
在构造置信区间时,我们可以用所希望的值作为
置信水平。比较常用的置信水平是:90%,95% 和99%,通常用 1- 表示置信水平,其中 称 为显著性水平。
由抽样平均误差
mx =
s = 1.5 =0.15(小时) n 10
D x = zm= 1.96? 0.15 0.29(4 小时)
\ x - 0.294 #X x + 0.294,即3.706 #X 4.294
因此,以95%置信度,估计该地区内居民每天
看电视的平均时间在3.706到4.294个小时之间。
18
4. F(z)、 z、 Δ、μ之间的关系
F(z)与z具有一一对应的关系,所以已知概率 保证程度F(z)就可以求出概率度z ;若已知z 也就可以知道F(z)。
给定F(z) z Δ = z×μ
样本 μ 和总体参数的点估计值
m= s n
给定Δ
抽样平均误差
Δ/μ= z
F(z)
19
5.区间估计的特点
(1)指出总体被估计参数的上限和下限, 即指出总体参数的可能范围,而不是直 接给出总体参数的估计值。
14
两个需要注意的问题
如果用某种方法构造的所有区间中有95%的 区间包含总体参数的真值,5%的区间不包含 总体参数的真值,那么,用该方法构造的区 间称为置信水平为95%的置信区间。
置信区间是一个随机区间,它会因样本的不 同而不同,而且不是所有的区间都包含参数 真值。
15
2.抽样误差汇总
第八章 参数估计PPT课件
16
点估计
最大似然估计法
如 果 似 然 函 数 L (x 1 ,x 2 ,...,x n ; )在 ˆ 处 取 得 最 大 值 ,则 称 ˆ 为 总 体 参 数 的 最 大 似 然 估 计 .
由于函数y lnx在定义域内单增,则如果当
ˆ时似然函数L(x1, x2,..., xn;)取得最大值,则 当 ˆ时lnL(x1, x2,..., xn;)也取得最大值;反之 亦然.因此我们只需考虑lnL(x1, x2,..., xn;)的最
(1) X n1 X1 n2 X 2 是的无偏估计 ;
n1 n2
(2)S
2
(n1
1)S12
(n2
1)SLeabharlann 2 2是2的无偏估计
.
n1 n2 2
9
估计量优劣标准
有效估计
设 和 都是的无偏估计,若样本容量为n, 的
方差小于 的方差,则称 是比 有效的估计量。
如果在的一切无偏估计量里中, 的方差达到最小, 则称为的有效估计量。
(1) 设为连续型随机变量 , 其概率密度函数为
( x; ), 其中 为未知参数 ,由于样本的独立性 , 样
本( X 1, X 2 ,..., X n )的联合概率密度函数为
n
L( x1, x2 ,..., xn ; ) ( xi ; ) i 1
对于样本 ( X 1, X 2 ,..., X n )的一组观测值 ( x1, x2 ,..., xn )
是 向 量 ,则 求 偏 导 数 );
第 四 ,令 导 数 等 于 零 ,解 出 即 可 .
18
点估计
最大似然估计法的例题
1. 0—1分布中p的最大似然估计;
2. Poisson分布的参数 的最大似然估计; 3. 指数分布的参数 的最大似然估计;
点估计
最大似然估计法
如 果 似 然 函 数 L (x 1 ,x 2 ,...,x n ; )在 ˆ 处 取 得 最 大 值 ,则 称 ˆ 为 总 体 参 数 的 最 大 似 然 估 计 .
由于函数y lnx在定义域内单增,则如果当
ˆ时似然函数L(x1, x2,..., xn;)取得最大值,则 当 ˆ时lnL(x1, x2,..., xn;)也取得最大值;反之 亦然.因此我们只需考虑lnL(x1, x2,..., xn;)的最
(1) X n1 X1 n2 X 2 是的无偏估计 ;
n1 n2
(2)S
2
(n1
1)S12
(n2
1)SLeabharlann 2 2是2的无偏估计
.
n1 n2 2
9
估计量优劣标准
有效估计
设 和 都是的无偏估计,若样本容量为n, 的
方差小于 的方差,则称 是比 有效的估计量。
如果在的一切无偏估计量里中, 的方差达到最小, 则称为的有效估计量。
(1) 设为连续型随机变量 , 其概率密度函数为
( x; ), 其中 为未知参数 ,由于样本的独立性 , 样
本( X 1, X 2 ,..., X n )的联合概率密度函数为
n
L( x1, x2 ,..., xn ; ) ( xi ; ) i 1
对于样本 ( X 1, X 2 ,..., X n )的一组观测值 ( x1, x2 ,..., xn )
是 向 量 ,则 求 偏 导 数 );
第 四 ,令 导 数 等 于 零 ,解 出 即 可 .
18
点估计
最大似然估计法的例题
1. 0—1分布中p的最大似然估计;
2. Poisson分布的参数 的最大似然估计; 3. 指数分布的参数 的最大似然估计;
统计学--参数估计 ppt课件
误差是Δ,即:
PPT课件
5
• 极限误差是根据研究对象的变异程度和分析任务的性质来 确定的在一定概率下的允许误差范围。
• 参数估计的两个要求:
– 精度:估计误差的最大范围,通过极限误差来反映。显然,Δ越小, 估计的精度要求越高,Δ越大,估计的精度要求越低。极限误差的 确定要以实际需要为基本标准。
• 3.上面的公式计算结果如果带小数,这时样本容量不 按四舍五入法则取整数,取比这个数大的最小整数代 替。例如计算得到:n=56.03,那么,样本容量取57, 而不是56。
PPT课件
32
例:对某批木材进行检验,根据以往经验,木材长度的标准 差为0.4米,而合格率为90%。现采用重复抽样方式,要 求在95.45%的概率保证程度下,木材平均长度的极限误 差不超过0.08米,抽样合格率的极限误差不超过5%,问 必要的样本单位数应该是多少?
PPT课件
22
总体成数估计区间估计总结
• 总体成数估计区间的上下限
只考虑大样本情况(请记住大样本条件)
P1 P
P z 2
n
P1 P N n
P z 2
n
N 1
PPT课件
23
对总量指标的区间估计
• 在对总体平均数进行区间估计的基础 上,可进一步推断相应的总量指标, 即用总体单位总数N分别乘以总体平均 数的区间下限和区间上限,便得到相 应总量(Nμ)的区间范围。
P
91 100
91%
P
p(1 n
p)
(总体成数未知,用样本成数代替)
P(1 n
P)
2.86%
F(z) 95%,z 1.96 zP 1.962.86%5.61%
PPT课件
5
• 极限误差是根据研究对象的变异程度和分析任务的性质来 确定的在一定概率下的允许误差范围。
• 参数估计的两个要求:
– 精度:估计误差的最大范围,通过极限误差来反映。显然,Δ越小, 估计的精度要求越高,Δ越大,估计的精度要求越低。极限误差的 确定要以实际需要为基本标准。
• 3.上面的公式计算结果如果带小数,这时样本容量不 按四舍五入法则取整数,取比这个数大的最小整数代 替。例如计算得到:n=56.03,那么,样本容量取57, 而不是56。
PPT课件
32
例:对某批木材进行检验,根据以往经验,木材长度的标准 差为0.4米,而合格率为90%。现采用重复抽样方式,要 求在95.45%的概率保证程度下,木材平均长度的极限误 差不超过0.08米,抽样合格率的极限误差不超过5%,问 必要的样本单位数应该是多少?
PPT课件
22
总体成数估计区间估计总结
• 总体成数估计区间的上下限
只考虑大样本情况(请记住大样本条件)
P1 P
P z 2
n
P1 P N n
P z 2
n
N 1
PPT课件
23
对总量指标的区间估计
• 在对总体平均数进行区间估计的基础 上,可进一步推断相应的总量指标, 即用总体单位总数N分别乘以总体平均 数的区间下限和区间上限,便得到相 应总量(Nμ)的区间范围。
P
91 100
91%
P
p(1 n
p)
(总体成数未知,用样本成数代替)
P(1 n
P)
2.86%
F(z) 95%,z 1.96 zP 1.962.86%5.61%
统计学第七章-参数估计-PPT
(例题分析)
解:已知X~N(,102),n=25, 1- = 95%,z/2=1.96。根
据样本数据计算得:x 105.36
总体均值在1-置信水平下的置信区间为
x z 2
n
105.36 1.96
10 25
105.36 3.92
101.44,109.28
该食品平均重量的置信区间为101.44g~109.28g
The two confidence intervals that are used extensively are the 95% and the 90%.
常用的置信水平及Z值为: Z=1.96
Z=1.65
Interpretation of Confidence Intervals
For a 95% confidence interval about 95% of the similarly constructed intervals will contain the parameter being estimated.
n
36
39.5 2.13
37.37,41.63
投保人平均年龄的置信区间为37.37岁~41.63岁
总体均值的区间估计
(正态总体、 未知、小样本)
总体均值的区间估计
(小样本)
1.假定条件
– 总体服从正态分布,且方差(2) 未知
– 小样本 (n < 30)
2. 使用 t 分布统计量
t x ~ t(n 1)
t (df = 5)
z
t
不同自由度的t分布
t 值表
横坐标:自由度, df 纵坐标:概率, p, 即曲线下阴影部分的面积; 表中的数字:相应的 |t | 界值。
解:已知X~N(,102),n=25, 1- = 95%,z/2=1.96。根
据样本数据计算得:x 105.36
总体均值在1-置信水平下的置信区间为
x z 2
n
105.36 1.96
10 25
105.36 3.92
101.44,109.28
该食品平均重量的置信区间为101.44g~109.28g
The two confidence intervals that are used extensively are the 95% and the 90%.
常用的置信水平及Z值为: Z=1.96
Z=1.65
Interpretation of Confidence Intervals
For a 95% confidence interval about 95% of the similarly constructed intervals will contain the parameter being estimated.
n
36
39.5 2.13
37.37,41.63
投保人平均年龄的置信区间为37.37岁~41.63岁
总体均值的区间估计
(正态总体、 未知、小样本)
总体均值的区间估计
(小样本)
1.假定条件
– 总体服从正态分布,且方差(2) 未知
– 小样本 (n < 30)
2. 使用 t 分布统计量
t x ~ t(n 1)
t (df = 5)
z
t
不同自由度的t分布
t 值表
横坐标:自由度, df 纵坐标:概率, p, 即曲线下阴影部分的面积; 表中的数字:相应的 |t | 界值。
统计学参数估计PPT课件
实际应用中需要注意的问题
在应用参数估计时,需要注意样本的代表性、数据的准确性和可靠性等问题, 以保证估计的准确性和可靠性。
对未来研究的建议
01
进一步探讨参数估计的理论基础
可以进一步探讨参数估计的理论基础,如大数定律和中心极限定理等,
以更好地理解和掌握参数估计的方法和原理。
02
探索新的估计方法
随着统计学的发展,可以探索新的参数估计方法,以提高估计的准确性
指导决策
评估效果
基于参数估计结果,制定科学合理的 决策。
利用参数估计,评估政策、项目等实 施效果。
预测未来
通过参数估计,预测未来的趋势和变 化。
02
参数估计的基本概念
点估计
定义
点估计是用一个单一的数值来估 计未知参数的值。
举例
在调查某班级学生的平均身高时, 我们可能使用所有学生身高的总 和除以人数来估计平均身高,这 里的总和除以人数就是点估计。
最小二乘法的缺点是假设误差项独立 同分布,且对异常值敏感,可能影响 估计的稳定性。
最小二乘法的优点是简单易行,适用 于线性回归模型,且具有优良的统计 性质。
贝叶斯估计法
贝叶斯估计法是一种基于贝叶 斯定理的参数估计方法,通过 将先验信息与样本数据相结合 来估计参数。
贝叶斯估计法的优点是能够综 合考虑先验信息和样本数据, 给出更加准确的参数估计。
高维数据的参数估计问题
1 2 3
高维数据对参数估计的影响
随着数据维度的增加,参数估计的复杂度和难度 也会相应增加,容易出现维度诅咒等问题。
高维数据参数估计的方法
针对高维数据,可以采用降维、特征选择、贝叶 斯推断等方法进行参数估计,以降低维度对估计 的影响。
在应用参数估计时,需要注意样本的代表性、数据的准确性和可靠性等问题, 以保证估计的准确性和可靠性。
对未来研究的建议
01
进一步探讨参数估计的理论基础
可以进一步探讨参数估计的理论基础,如大数定律和中心极限定理等,
以更好地理解和掌握参数估计的方法和原理。
02
探索新的估计方法
随着统计学的发展,可以探索新的参数估计方法,以提高估计的准确性
指导决策
评估效果
基于参数估计结果,制定科学合理的 决策。
利用参数估计,评估政策、项目等实 施效果。
预测未来
通过参数估计,预测未来的趋势和变 化。
02
参数估计的基本概念
点估计
定义
点估计是用一个单一的数值来估 计未知参数的值。
举例
在调查某班级学生的平均身高时, 我们可能使用所有学生身高的总 和除以人数来估计平均身高,这 里的总和除以人数就是点估计。
最小二乘法的缺点是假设误差项独立 同分布,且对异常值敏感,可能影响 估计的稳定性。
最小二乘法的优点是简单易行,适用 于线性回归模型,且具有优良的统计 性质。
贝叶斯估计法
贝叶斯估计法是一种基于贝叶 斯定理的参数估计方法,通过 将先验信息与样本数据相结合 来估计参数。
贝叶斯估计法的优点是能够综 合考虑先验信息和样本数据, 给出更加准确的参数估计。
高维数据的参数估计问题
1 2 3
高维数据对参数估计的影响
随着数据维度的增加,参数估计的复杂度和难度 也会相应增加,容易出现维度诅咒等问题。
高维数据参数估计的方法
针对高维数据,可以采用降维、特征选择、贝叶 斯推断等方法进行参数估计,以降低维度对估计 的影响。
统计学(参数估计)ppt课件
相应地,用最大似然法求得的估计量称为 最大似然估计量,简记为MLE。
13
令最大似然估计的求法
14
3、矩法和最大似然法的比较
令矩估计法是采用样本矩替换总体矩来估 计参数,相当于使用了分布函数的部分信息;
令最大似然估计法是采用似然函数来求得 参数的估计,理论上相当于使用了分布函数的 全部信息;
在已知总体分布的前提下,采用最大似然 估计法的理由更充分,而在总体分布函数未知 但有关的总体矩已知的情况下,采用矩估计法 更合适。
通常可以认为,区间估计是在点估计的基 础上,给出未知总体参数的一个取值范围,及 这个范围的可靠程度。
24
区间估计——就是用一个区间去估计未知 总体参数,把未知总体参数值界定在两个数值 之间。即根据样本估计量,以一定的置信度估 计和推断总体参数的区间范围。
令总体参数的估计区间,通常是由样本统 计量加减抽样极限误差而得到的。
44
【解】 本题的总体方差未知,但属于大样本 抽样极限误差为: 所以,在90%的置信水平下,置信区间为:
表明在90%的置信水平下,投保人的平均年龄在 37.37至41.63岁之间。
45
【练习2】在大兴安岭林区,随机抽取了100块面 积为1公顷的样地,根据调查测量求得每公顷林 地平均出材量为88m3 ,标准差为10m3。
17
一、无偏性
无偏性——是指样本估计量抽样分布的均 值等于被估总体参数的真实值。
无偏性实际是指:不同的样本,会有不同 的估计值。虽然从某一个具体样本来看,估计 值有时会大于 θ ,有时会小于 θ ,有误差。但 从所有可能样本的角度来看,估计值的平均水 平等于总体参数的真实值,即平均说来,估计 是无偏的。
令样本均值、样本方差和样本比率,分别 是总体均值、总体方差和总体比率的无偏、有 效和一致的优良估计量;
13
令最大似然估计的求法
14
3、矩法和最大似然法的比较
令矩估计法是采用样本矩替换总体矩来估 计参数,相当于使用了分布函数的部分信息;
令最大似然估计法是采用似然函数来求得 参数的估计,理论上相当于使用了分布函数的 全部信息;
在已知总体分布的前提下,采用最大似然 估计法的理由更充分,而在总体分布函数未知 但有关的总体矩已知的情况下,采用矩估计法 更合适。
通常可以认为,区间估计是在点估计的基 础上,给出未知总体参数的一个取值范围,及 这个范围的可靠程度。
24
区间估计——就是用一个区间去估计未知 总体参数,把未知总体参数值界定在两个数值 之间。即根据样本估计量,以一定的置信度估 计和推断总体参数的区间范围。
令总体参数的估计区间,通常是由样本统 计量加减抽样极限误差而得到的。
44
【解】 本题的总体方差未知,但属于大样本 抽样极限误差为: 所以,在90%的置信水平下,置信区间为:
表明在90%的置信水平下,投保人的平均年龄在 37.37至41.63岁之间。
45
【练习2】在大兴安岭林区,随机抽取了100块面 积为1公顷的样地,根据调查测量求得每公顷林 地平均出材量为88m3 ,标准差为10m3。
17
一、无偏性
无偏性——是指样本估计量抽样分布的均 值等于被估总体参数的真实值。
无偏性实际是指:不同的样本,会有不同 的估计值。虽然从某一个具体样本来看,估计 值有时会大于 θ ,有时会小于 θ ,有误差。但 从所有可能样本的角度来看,估计值的平均水 平等于总体参数的真实值,即平均说来,估计 是无偏的。
令样本均值、样本方差和样本比率,分别 是总体均值、总体方差和总体比率的无偏、有 效和一致的优良估计量;
第六章---参数估计ppt课件
50
1、条件分析:总体分布为正态,且总体方差已 知,用正态法进行估计。 2、计算标准误 3、确定置信水平为0.95,查表得
51
4、计算置信区间 D=0.95时 D=0.99时
52
解释:总体均数μ落在75.61-84.39之间的可 能性为95%,超出这一范围的可能只有5%。而 作出总体μ落在74.22-85.78之间结论时的正 确概率为99%,犯错误的可能性为1%。
38
( 二)、 分布法, 未知 1、前提条件: 总体正态分布, n不论大小,
2、使用 t分布统计量
D=0.95时 D=0.99时
39
例:总体正态, 未知,
,
,
,
,
平均数0.95的置信区间是多少?
,
,试问总体
40
解: 1、条件分析:总体正态, 未知,
小
于30,只能用 分布
2、计算标准误
3、计算自由度
9
一、点估计
(一)意义 含义:直接用样本统计量的值作为总体参数的估 计值 无偏估计量:恰好等于相应总体参数的统计量。
例8-1;假设某市六岁男童平均身高110.7cm,随机 抽取113人测得平均身高110.70cm.总体的平均数, 标准差是多少
10
(二)良好点估计的条件
无偏性: 一致性: 有效性: 无偏估计量的变异性问题。
47
1 、条件分析:总体分布为非正态, 未知, >30,只能用近似正态估计法。
2、计算标准误
3、确定置信水平为0.95,查表得
48
4、计算置信区间
5、结果解释:该校的平均成绩有95%的可能落 在50.2~54.0之间。
49
课堂练习
已知某总体为正态分布,其总体标准差为10。 现从这个总体中随机抽取n1=20的样本,其平 均数分别80。试问总体参数μ在0.95和0.99的 置信区间是多少。
1、条件分析:总体分布为正态,且总体方差已 知,用正态法进行估计。 2、计算标准误 3、确定置信水平为0.95,查表得
51
4、计算置信区间 D=0.95时 D=0.99时
52
解释:总体均数μ落在75.61-84.39之间的可 能性为95%,超出这一范围的可能只有5%。而 作出总体μ落在74.22-85.78之间结论时的正 确概率为99%,犯错误的可能性为1%。
38
( 二)、 分布法, 未知 1、前提条件: 总体正态分布, n不论大小,
2、使用 t分布统计量
D=0.95时 D=0.99时
39
例:总体正态, 未知,
,
,
,
,
平均数0.95的置信区间是多少?
,
,试问总体
40
解: 1、条件分析:总体正态, 未知,
小
于30,只能用 分布
2、计算标准误
3、计算自由度
9
一、点估计
(一)意义 含义:直接用样本统计量的值作为总体参数的估 计值 无偏估计量:恰好等于相应总体参数的统计量。
例8-1;假设某市六岁男童平均身高110.7cm,随机 抽取113人测得平均身高110.70cm.总体的平均数, 标准差是多少
10
(二)良好点估计的条件
无偏性: 一致性: 有效性: 无偏估计量的变异性问题。
47
1 、条件分析:总体分布为非正态, 未知, >30,只能用近似正态估计法。
2、计算标准误
3、确定置信水平为0.95,查表得
48
4、计算置信区间
5、结果解释:该校的平均成绩有95%的可能落 在50.2~54.0之间。
49
课堂练习
已知某总体为正态分布,其总体标准差为10。 现从这个总体中随机抽取n1=20的样本,其平 均数分别80。试问总体参数μ在0.95和0.99的 置信区间是多少。
第七章 参数估计ppt课件
ˆ lim P ( ) 1
n
0 ,则称 ˆ 为θ的一致估计量
31
随着样本容量增大,估计量会越来越接近 被估计的参数。即对任意的>0,有
n
ˆ l i m{ P | | } 1
则称 ˆ 是参数θ的一致估计量。 一致估计量是大样本所呈现的性质。若某
是总体X 的一个容量
1 ˆ X X X ) 1 ( 1 2 3 3
1 ˆ 2 X 3 X X ) 2 ( 1 2 3 6
是总体均值 的估计量,它们是无偏估计 量吗?若是,哪一个更有效。
30
三、一致性
设 ˆ 为未知参数θ的估计量,当 n 时, ˆ按 概率收敛于θ。即
n
2 ( x ) i 2 2
1n X X , ˆ 解方程组,得 i i 1 n
1n 2 2 X X ˆ i i 1 n 20
2
21
7.1.4 评价估计优良的准则
无偏性 有效性 一致性
22
一、无偏性
设 ˆ 为未知参数θ的估计量,若
离 散 型 (, ) x ( X x ) j 1 , k i p i
j i 1
j
n
8
例如0-1分布的数学期望(一阶原点矩)为p, x , x , , x ) 在总体中抽出随机样本 ( , 则样本平均数 1 2 n (样本的一阶原 点矩)
为
1n p xi n i1
26
, 2 , ,X 设 XX 1 n 是总体X的样本
ˆ X 1 1
1 ˆ 2 xi n
ห้องสมุดไป่ตู้ ,ˆ
第7章 参数估计PPT课件
pˆ Z 2
pˆ(1 pˆ ) n
0.217 1.645 0.217(1 0.217) 995
0.217 0.0215
结论:我们有90%的把握认为悉尼青少年中每 天都抽烟的青少年比例在19.55%~23.85%之间。
SPSS的计算结果
均值
在SPSS中将 “是否吸烟”
均值的 90% 置信区间
1. 两个总体均值的置信区间是由两个样本均值之差 加减估计误差得到的
2. 估计误差由两部分组成:一是点估计量的标准误 差,它取决于样本统计量的抽样分布。二是估计 时所要的求置信水平为时,统计量分布两侧面积 为的分位数值,它取决于事先所要求的可靠程度
3. 两个总体均值之差(1-2)在置信水平下的置信区
9.5 50.3
标准 误
.8373
(二)总体比例的区间估计
1. 假定条件 总体服从二项分布 可以由正态分布来近似 np(成功次数)和n(1-p)(失败次数)均应该大于5
2. 使用正态分布统计量 z
z p π ~ N(0,1) π(1 π) n
3. 总体比例在1-置信水平下的置信区间为
p(1- p)
学习目标
1、掌握参数估计的基本方法和原理。 2、理解并掌握置信区间和置信水平的
含义。 3、理解并掌握评价估计量的标准。 4、掌握一个总体参数的区间估计方法,
了解两个总体参数区间估计的基本 方法。 5、掌握估计一个总体均值和总体比例 时样本量的确定方法。
一、 参数估计的一般问题
1.参数估计:总体分布类型已知,仅需对分布 的未知参数进行的估计
置信度1 - 的含义是:在同样的方法得到 的所有置信区间中,有100(1- )% 的区间 包含总体参数。
抽样分布是区间估计的理论基础。
参数估计PPT课件
参数估计
目录
• 参数估计简介 • 最小二乘法 • 最大似然估计法 • 贝叶斯估计法 • 参数估计的评估与选择
01 参数估计简介
参数估计的基本概念
参数估计是一种统计学方法,用于估计未知参数的值。通过使用样本数据和适当的统计模型,我们可 以估计出未知参数的合理范围或具体值。
参数估计的基本概念包括总体参数、样本参数、点估计和区间估计等。总体参数描述了总体特征,而 样本参数则描述了样本特征。点估计是使用单一数值来表示未知参数的估计值,而区间估计则是给出 未知参数的可能范围。
到样本数据的可能性。
最大似然估计法的原理是寻找 使似然函数最大的参数值,该 值即为所求的参数估计值。
最大似然估计法的计算过程
确定似然函数的表达式
根据数据分布和模型假设,写出似然函数的表达式。
对似然函数求导
对似然函数关于参数求导,得到导数表达式。
解导数方程
求解导数方程,找到使似然函数最大的参数值。
确定参数估计值
04
似然函数描述了样本数据与参数之间的关系,即给定参数值下观察到 样本数据的概率。
贝叶斯估计法的计算过程
首先,根据先验信息确定参数的先验分布。 然后,利用样本信息和似然函数计算参数的后验分布。 最后,根据后验分布进行参数估计,常见的估计方法包括最大后验估计(MAP)和贝叶斯线性回归等。
贝叶斯估计法的优缺点
参数估计的常见方法
最小二乘法
最小二乘法是一种常用的线性回归分析方法,通过最小化误差的平方和来估计未知参数。这种方法适用于线性回归模 型,并能够给出参数的点估计和区间估计。
极大似然法
极大似然法是一种基于概率模型的参数估计方法,通过最大化样本数据的似然函数来估计未知参数。这种方法适用于 各种概率模型,并能够给出参数的点估计和区间估计。
目录
• 参数估计简介 • 最小二乘法 • 最大似然估计法 • 贝叶斯估计法 • 参数估计的评估与选择
01 参数估计简介
参数估计的基本概念
参数估计是一种统计学方法,用于估计未知参数的值。通过使用样本数据和适当的统计模型,我们可 以估计出未知参数的合理范围或具体值。
参数估计的基本概念包括总体参数、样本参数、点估计和区间估计等。总体参数描述了总体特征,而 样本参数则描述了样本特征。点估计是使用单一数值来表示未知参数的估计值,而区间估计则是给出 未知参数的可能范围。
到样本数据的可能性。
最大似然估计法的原理是寻找 使似然函数最大的参数值,该 值即为所求的参数估计值。
最大似然估计法的计算过程
确定似然函数的表达式
根据数据分布和模型假设,写出似然函数的表达式。
对似然函数求导
对似然函数关于参数求导,得到导数表达式。
解导数方程
求解导数方程,找到使似然函数最大的参数值。
确定参数估计值
04
似然函数描述了样本数据与参数之间的关系,即给定参数值下观察到 样本数据的概率。
贝叶斯估计法的计算过程
首先,根据先验信息确定参数的先验分布。 然后,利用样本信息和似然函数计算参数的后验分布。 最后,根据后验分布进行参数估计,常见的估计方法包括最大后验估计(MAP)和贝叶斯线性回归等。
贝叶斯估计法的优缺点
参数估计的常见方法
最小二乘法
最小二乘法是一种常用的线性回归分析方法,通过最小化误差的平方和来估计未知参数。这种方法适用于线性回归模 型,并能够给出参数的点估计和区间估计。
极大似然法
极大似然法是一种基于概率模型的参数估计方法,通过最大化样本数据的似然函数来估计未知参数。这种方法适用于 各种概率模型,并能够给出参数的点估计和区间估计。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
14
两个需要注意的问题
如果用某种方法构造的所有区间中有95%的 区间包含总体参数的真值,5%的区间不包含 总体参数的真值,那么,用该方法构造的区 间称为置信水平为95%的置信区间。
置信区间是一个随机区间,它会因样本的不 同而不同,而且不是所有的区间都包含参数 真值。
15
2.抽样误差汇总
(1)参数估计是以样本的指标估计总体指标, 这两者之间必然存在着误差,假设只考虑由 于随机因素引起的误差,则称这种误差为抽 样误差。
较小的样本容量
A
X
9
例5.1
对某企业的产品进行抽样检验,设抽出100件 产品,其中不合格产品5件,试估计该企业产品 的合格率是多少?
解:通过样本的合格率来估计企业产品的合格率。
样本合格率p=95/100=95%,我们估计该企业产品
的合格率是95%。 P=p=95%
10
例5.2
男性成人的身高X服从正态分布 X N (, 2 ),其
第5章 参数估计
第一节 第二节 第三节
参数估计概述 一个总体参数的区间估计 样本容量的确定
第一节 参数估计概述
一、参数估计的概念 二、参数估计的分类 三、评价估计量的标准
2
一、参数估计的概念
1.定义: 以样本统计量作为未知总体参数的估计量,并通过
对样本各单位的实际观察取得样本数据,计算样本 统计量的取值作为总体未知参数的估计值。 估计量:用来估计总体参数的统计量的名称。 估计值:用来估计总体参数时计算出来的估计量的 具体数值。
12
å (xi - x )2
s 2 = s2 = i=1
n- 1
11
第二节 一个总体参数的区间估计
一、区间估计概述 二、总体平均数的区间估计 三、总体成数的区间估计
12
一、区间估计概述
1.基本概念
(1)区间估计:在点估计的基础上,给出总体参数估 计的一个范围,称为参数的区间估计。
(2)置信区间:由样本统计量所构造的总体参数的估 计区间,称为置信区间,其中区间的最小值称为置 信下限,最大值称为置信上限。
17
(2)区间估计的基本原理
P( x X x )
xX
x
X - D x #x X + D x x - D x #X x + D x
P(X - D x #x X + D x ) = P(x - D x #X x + D x ) = F(z)
P( x X
x)=
x- X P(
mx
?
Dx) mx
F(Dx ) = F(z) mx
样本统计量 (点估计)
置信区间
置信下限
置信上限
13
(3)置信水平:如果我们将构造置信区间的步骤重 复多次,置信区间中包含总体参数真值的次数所 占的比率,称为置信水平。
在构造置信区间时,我们可以用所希望的值作为
置信水平。比较常用的置信水平是:90%,95% 和99%,通常用 1- 表示置信水平,其中 称 为显著性水平。
5
三、评价估计量的标准
6
无偏性(unbiasedness)
无偏性:估计量的数学期望等于被估计的 总体参数。
若E(qˆ) = q,则称ˆ为 的无偏估计量。
P( X )
无偏
A
有偏
C
x, s2,p
都是无偏估计量
X
7
有效性(efficiency)
有效性:一个方差较小的无偏估计量称 为一个更有效的估计量。
3
二、参数估计的分类 点估计 区间估计
4
点估计(point estimator)
点估计又称定值估计,它是直接以样本统 计量作为总体参数的估计量,以样本统计量 的取值作为总体参数的估计值。
常用的总体参数的点估计
邋 X ? x
x ,s 2 ? s2
n
(x- x)2 ,P? p
n1
n- 1
n
重点注意
若 s qˆ1 < s qˆ2,则称 ˆ1为比 ˆ2更有效的估计量
P(X )
均值的抽样分布
B
中位数的抽样分布
A
X
8
一致性(consistency)
一致性:随着样本容量(n)的增大,点估 计量的值越来越接近被估计的总体参数。
若对于任意ε>0,有 limP{ qˆ- q < e}= 1 n 较大的样本容量 P(X ) B
18
4. F(z)、 z、 Δ、μ之间的关系
F(z)与z具有一一对应的关系,所以已知概率 保证程度F(z)就可以求出概率度z ;若已知z 也就可以知道F(z)。
给定F(z) z Δ = z×μ
样本 μ 和总体参数的点估计值
m= s n
给定Δ
抽样平均误差
Δ/μ= z
F(z)
19
5.区间估计的特点
(1)指出总体被估计参数的上限和下限, 即指出总体参数的可能范围,而不是直 接给出总体参数的估计值。
sx
21
区间估计的步骤
区间估计根据给定的条件不同,有两种估计 方法:
⑴ 给出允许误差(Δ),求概率保证程度F(z) ⑵ 给出概率保证程度F(z),求估计区间。
22
⑴ 给出Δ ,求F(z)
① 抽取样本,计算样本指标(样本平均数、样 本方差、抽样平均误差);
② 根据给定的抽样误差——允许误差Δ,计算 估计区间的上、下限;
③ 求出概率度z,查表得到F(z),对总体参
中 , 2,是未知参数,现随机测量12名成人男性的身
高(单位:米)如下:1.80 1.68 1.85 1.60 1.67 1.75 1.78
1.62 1.76 1.70 1.79 1.69,试求的点估计值 , 2
解:m= x = 1.80 + 1.68 + + 1.69 = 1.72(米) 12
(2)允许(或可以容忍)的最大抽样误差,称 为抽样极限误差。
(3)所有可能的样本估计值跟总体参数的平均 差异称为,抽样平均误差。
16
3.区间估计的基本原理
(1)区间估计的三个要素——点估计值、允 许的抽样误差范围、置信水平(概率保证程 度)。 点估计值:一般为样本平均数或样本成数p 允许误差范围(抽样极限误差) :Δ (x±Δ)就是置信区间 置信水平:F(z)= 1-
(2)指出置信区间包含总体参数的可信 度有多大。
(3)而前两者是相互矛盾的。
20
(二)总体平均数的区间估计 总体方差(2 )已知
由抽样分布定理知道,如果总体服从正态
分布,则样本平均数: x
~
N(X
,s
)2
x
如果总体正态性不成立,但是当样本容量
n充分大时,近似地也有:x
~
N(X,s源自2 x)因此,z = x - X ~ N (0,1)
两个需要注意的问题
如果用某种方法构造的所有区间中有95%的 区间包含总体参数的真值,5%的区间不包含 总体参数的真值,那么,用该方法构造的区 间称为置信水平为95%的置信区间。
置信区间是一个随机区间,它会因样本的不 同而不同,而且不是所有的区间都包含参数 真值。
15
2.抽样误差汇总
(1)参数估计是以样本的指标估计总体指标, 这两者之间必然存在着误差,假设只考虑由 于随机因素引起的误差,则称这种误差为抽 样误差。
较小的样本容量
A
X
9
例5.1
对某企业的产品进行抽样检验,设抽出100件 产品,其中不合格产品5件,试估计该企业产品 的合格率是多少?
解:通过样本的合格率来估计企业产品的合格率。
样本合格率p=95/100=95%,我们估计该企业产品
的合格率是95%。 P=p=95%
10
例5.2
男性成人的身高X服从正态分布 X N (, 2 ),其
第5章 参数估计
第一节 第二节 第三节
参数估计概述 一个总体参数的区间估计 样本容量的确定
第一节 参数估计概述
一、参数估计的概念 二、参数估计的分类 三、评价估计量的标准
2
一、参数估计的概念
1.定义: 以样本统计量作为未知总体参数的估计量,并通过
对样本各单位的实际观察取得样本数据,计算样本 统计量的取值作为总体未知参数的估计值。 估计量:用来估计总体参数的统计量的名称。 估计值:用来估计总体参数时计算出来的估计量的 具体数值。
12
å (xi - x )2
s 2 = s2 = i=1
n- 1
11
第二节 一个总体参数的区间估计
一、区间估计概述 二、总体平均数的区间估计 三、总体成数的区间估计
12
一、区间估计概述
1.基本概念
(1)区间估计:在点估计的基础上,给出总体参数估 计的一个范围,称为参数的区间估计。
(2)置信区间:由样本统计量所构造的总体参数的估 计区间,称为置信区间,其中区间的最小值称为置 信下限,最大值称为置信上限。
17
(2)区间估计的基本原理
P( x X x )
xX
x
X - D x #x X + D x x - D x #X x + D x
P(X - D x #x X + D x ) = P(x - D x #X x + D x ) = F(z)
P( x X
x)=
x- X P(
mx
?
Dx) mx
F(Dx ) = F(z) mx
样本统计量 (点估计)
置信区间
置信下限
置信上限
13
(3)置信水平:如果我们将构造置信区间的步骤重 复多次,置信区间中包含总体参数真值的次数所 占的比率,称为置信水平。
在构造置信区间时,我们可以用所希望的值作为
置信水平。比较常用的置信水平是:90%,95% 和99%,通常用 1- 表示置信水平,其中 称 为显著性水平。
5
三、评价估计量的标准
6
无偏性(unbiasedness)
无偏性:估计量的数学期望等于被估计的 总体参数。
若E(qˆ) = q,则称ˆ为 的无偏估计量。
P( X )
无偏
A
有偏
C
x, s2,p
都是无偏估计量
X
7
有效性(efficiency)
有效性:一个方差较小的无偏估计量称 为一个更有效的估计量。
3
二、参数估计的分类 点估计 区间估计
4
点估计(point estimator)
点估计又称定值估计,它是直接以样本统 计量作为总体参数的估计量,以样本统计量 的取值作为总体参数的估计值。
常用的总体参数的点估计
邋 X ? x
x ,s 2 ? s2
n
(x- x)2 ,P? p
n1
n- 1
n
重点注意
若 s qˆ1 < s qˆ2,则称 ˆ1为比 ˆ2更有效的估计量
P(X )
均值的抽样分布
B
中位数的抽样分布
A
X
8
一致性(consistency)
一致性:随着样本容量(n)的增大,点估 计量的值越来越接近被估计的总体参数。
若对于任意ε>0,有 limP{ qˆ- q < e}= 1 n 较大的样本容量 P(X ) B
18
4. F(z)、 z、 Δ、μ之间的关系
F(z)与z具有一一对应的关系,所以已知概率 保证程度F(z)就可以求出概率度z ;若已知z 也就可以知道F(z)。
给定F(z) z Δ = z×μ
样本 μ 和总体参数的点估计值
m= s n
给定Δ
抽样平均误差
Δ/μ= z
F(z)
19
5.区间估计的特点
(1)指出总体被估计参数的上限和下限, 即指出总体参数的可能范围,而不是直 接给出总体参数的估计值。
sx
21
区间估计的步骤
区间估计根据给定的条件不同,有两种估计 方法:
⑴ 给出允许误差(Δ),求概率保证程度F(z) ⑵ 给出概率保证程度F(z),求估计区间。
22
⑴ 给出Δ ,求F(z)
① 抽取样本,计算样本指标(样本平均数、样 本方差、抽样平均误差);
② 根据给定的抽样误差——允许误差Δ,计算 估计区间的上、下限;
③ 求出概率度z,查表得到F(z),对总体参
中 , 2,是未知参数,现随机测量12名成人男性的身
高(单位:米)如下:1.80 1.68 1.85 1.60 1.67 1.75 1.78
1.62 1.76 1.70 1.79 1.69,试求的点估计值 , 2
解:m= x = 1.80 + 1.68 + + 1.69 = 1.72(米) 12
(2)允许(或可以容忍)的最大抽样误差,称 为抽样极限误差。
(3)所有可能的样本估计值跟总体参数的平均 差异称为,抽样平均误差。
16
3.区间估计的基本原理
(1)区间估计的三个要素——点估计值、允 许的抽样误差范围、置信水平(概率保证程 度)。 点估计值:一般为样本平均数或样本成数p 允许误差范围(抽样极限误差) :Δ (x±Δ)就是置信区间 置信水平:F(z)= 1-
(2)指出置信区间包含总体参数的可信 度有多大。
(3)而前两者是相互矛盾的。
20
(二)总体平均数的区间估计 总体方差(2 )已知
由抽样分布定理知道,如果总体服从正态
分布,则样本平均数: x
~
N(X
,s
)2
x
如果总体正态性不成立,但是当样本容量
n充分大时,近似地也有:x
~
N(X,s源自2 x)因此,z = x - X ~ N (0,1)