抽样分布及应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体的统计假设 ( Ho ) ,然后利用样本 提供的信息去反证它是否成立。
这种证明 Ho 是否成立的过程就叫 统计假设测验,简称假设测(检)验。
如果假设测验只针对一个 Ho , 并不 同时研究其它假设, 则称为显著性检验。
还有一些假设测验问题,需要研究 两个或更多的统计假设, 必须采取包括 多重比较在内的方差分析法才能解决, 因而不再一般化地称之为假设测验, 所 以假设测验大多局限于显著性测验。
Ӯ = 44.05 g,S = 4.523g,n = 25 解 按惯例所求两尾概率即抽样误差 的绝对值达到0.55的概率,因此有:
σӮ = σ/√n = 4.65÷√25 = 0.93g u =0.55÷σ/√n = 0.59
反查附表2或顺查附表1可得:
P( | Ӯ –μ|≥0.55) = P(|u| ≥0.59)
公式,并与检验đ时依据的差数的抽样分布和计算差数平均数的标准误σđ 、 Sđ的公式相区别。
涉及教材内容:第四章第六、七节,第五章第一、二、三节。
作业布置:P66 ~ P67 T6、 T7、 T10、 T11、 T12、 T13、 T15、 T16;教材P90 T9、 T11、 T12。
第一节 单个母总体抽样
第二章要点提示
抽样分布既是本课程的基础,又是本课程的难点,学习时①要注意抽
样分布的特点及其与上一章正态分布的统一性;②要注意样本统计量如 、
Σy 、y
、y1đ的y概2 率分布类型(正态分布)及其参数与母总体概型
及其参数的联系和区别(中心极限定理);③ 应充分理解显著性检验的原
理和特点,熟悉两尾检验与一尾检验的异同;④重点掌握检验Ӯ和Ӯ1-Ӯ2 时依据的抽样分布类型及标准误σӮ、SӮ和差数标准误σӮ1- Ӯ2、SӮ1- Ӯ2的计算
0.5 2 0 0.5
3,2 3,3 3,3 3,4
Σ
4,2 4,3 4,3 4,4
2.5 3
3
3.5
48
3
3.5 3.5 4
5
6
6
6
7
7
7 96
8
6.25 9
9
12.25 148
9 12.25 12.25 16
25 36 36 49
36 49 49 64
592
0.5 0
0
0.5
8
2
0.5 0.5 0
= 2 P(u ≤ - 0.59) = 2 Φ(- 0.59) = 2 ×0.2776 = 0.5552 ≈ 0.56
以上两例已由总体标准差σ深化到总 体标准误σӮ ,使连续性变量的概率分布研
究从误差y –μ升华到抽样误差Ӯ-μӮ , 即Ӯ –μ。
但这还不够,历史上也没有因此避免 正态分布在应用上的危机,因为要获得σ 的准确数值,其难度比μ大得多。到1908 年W.S.Gossetቤተ መጻሕፍቲ ባይዱ开发表一篇论文才使抽样 误差的研究走出应用上的困境。
第一节 单个母总体抽样
前例可归纳出抽样研究的部分结论:
⑴由Nn个Ӯ构成的衍生总体;
Ӯ ~N( μӮ ,σ2Ӯ )且有: μӮ = μ, σ2Ӯ = σ2 /n 并有: u =( Ӯ - μӮ ) ÷ σӮ ⑵由Nn个Σy构成的衍生总体;
Ӯ f f Ӯ f Ӯ 2 S2 f S2 2.0 1 2 4 0 0 2.5 4 10 25 0.5 2 3.0 2 6 18 2 4
获得 | -0.36 |这种抽样误差的两尾概率
(之和)为2×0.2266 = 0.4532。
fN(Ӯ)
n=9 n =4 n=1
Ӯ
--45..24 --01-..368 0.6 1.8
3 4.2 5.4
第一节 单个母总体抽样
回眸例1.5求获得抽样误差的概率:
μ=43.5g ,σ=4.65g,N =623;
如例2.1中定义样本标准误SӮ = S /√n,
则可将抽样误差转换成另一个标准化变量
t = ( Ӯ-μ)÷S/√n = 0.55 ÷ 0.9 = 0.61 查附表3可知获得0.55的两尾概率
当在0.5以上(n-1 = 24)。
第二节 显著性检验的原理
一、什么是显著性检验? 在由样本研究总体时,先提出关于
⑶只有以自由度 n –1算得的样本方差 S2才是σ2 的无偏估计值。
( ΣS2 / Nn = 8÷16 = 1/2 = σ2 )
(但 S 不是σ的无偏估计值)
第一节 单个母总体抽样
例2.2 调查336个平方米的小地老虎 1.4
虫危害结果,μ= 4.73头 ,σ= 2.63头。 1.2
求抽样 n = 30时 Ӯ ≤ 4.37头的概率。
也摸不着” 。
第一节 单个母总体抽样
观察值 Ӯ Σy Ӯ2
(Σy) 2 s2
2,2 2,3 2,3 2,4 3,2 3,3 3,3 3,4
2 2.5 2.5 3
2.5 3
3
3.5
45
5
6
56
6
7
4 6.25 6.25 9
16 25 25 36
0 0.5 0.5 0
6.25 9 9 12.25
25 36 36 49
1
解 由上述结论⑴知,须先求标准误:
σӮ = σ/√n = 2.63÷√30 = 0.48头 u =(Ӯ-μ)÷σ/√n = - 0.75
0.8 0.6
=(4.37-4.73)÷0.48
0.4
P( Ӯ ≤ 4.37 ) = Φ( - 0.75) = 0.2266
0.2
查附表2表明本例所求结果实际为
0
例2.1 给定一有限总体{2,3,3,4},即
N = 4,μ= 3,σ2 = 1/2;现从中以n = 2进行 复置抽样,则所有可能的样本数为 Nn = 16
2,3,3,4
个,计算各样本的统计量并整理成右表 。
解 视Ӯ为变量的衍生总体参数: μӮ = ΣӮ/ Nn = 48÷16 = 3
2,2
σ2Ӯ =〔148 – 48 2÷ 16〕/ 16 = 1/4
Σy ~N( μΣy ,σ2Σy )且有:
3.0 4
μΣy = nμ, σ2Σy = nσ2 又有:
3.5 4
u = (Σy - μΣy ) ÷ σΣy ⑴和⑵表明抽样分布的类型实质上
4.0
1
Σ 还是正态分布,只是其变量特殊罢了。 16
12 36 0 0 14 49 0.5 2 4 16 0 1
48 148 — 8
视Σy为变量的衍生总体参数: μΣy = Σ(Σy) / Nn = 96÷16 = 6
2,3
σ2Σy =〔592 – 96 2÷16〕/16 = 1
以上两个衍生总体均由“一切可能的抽 2,3
样观察结果组成”,并且实际应用中遇到的
多为无限总体,可以想象得到,但“看不见,
3,4
3,3
3,3
3,2 2,4
这种证明 Ho 是否成立的过程就叫 统计假设测验,简称假设测(检)验。
如果假设测验只针对一个 Ho , 并不 同时研究其它假设, 则称为显著性检验。
还有一些假设测验问题,需要研究 两个或更多的统计假设, 必须采取包括 多重比较在内的方差分析法才能解决, 因而不再一般化地称之为假设测验, 所 以假设测验大多局限于显著性测验。
Ӯ = 44.05 g,S = 4.523g,n = 25 解 按惯例所求两尾概率即抽样误差 的绝对值达到0.55的概率,因此有:
σӮ = σ/√n = 4.65÷√25 = 0.93g u =0.55÷σ/√n = 0.59
反查附表2或顺查附表1可得:
P( | Ӯ –μ|≥0.55) = P(|u| ≥0.59)
公式,并与检验đ时依据的差数的抽样分布和计算差数平均数的标准误σđ 、 Sđ的公式相区别。
涉及教材内容:第四章第六、七节,第五章第一、二、三节。
作业布置:P66 ~ P67 T6、 T7、 T10、 T11、 T12、 T13、 T15、 T16;教材P90 T9、 T11、 T12。
第一节 单个母总体抽样
第二章要点提示
抽样分布既是本课程的基础,又是本课程的难点,学习时①要注意抽
样分布的特点及其与上一章正态分布的统一性;②要注意样本统计量如 、
Σy 、y
、y1đ的y概2 率分布类型(正态分布)及其参数与母总体概型
及其参数的联系和区别(中心极限定理);③ 应充分理解显著性检验的原
理和特点,熟悉两尾检验与一尾检验的异同;④重点掌握检验Ӯ和Ӯ1-Ӯ2 时依据的抽样分布类型及标准误σӮ、SӮ和差数标准误σӮ1- Ӯ2、SӮ1- Ӯ2的计算
0.5 2 0 0.5
3,2 3,3 3,3 3,4
Σ
4,2 4,3 4,3 4,4
2.5 3
3
3.5
48
3
3.5 3.5 4
5
6
6
6
7
7
7 96
8
6.25 9
9
12.25 148
9 12.25 12.25 16
25 36 36 49
36 49 49 64
592
0.5 0
0
0.5
8
2
0.5 0.5 0
= 2 P(u ≤ - 0.59) = 2 Φ(- 0.59) = 2 ×0.2776 = 0.5552 ≈ 0.56
以上两例已由总体标准差σ深化到总 体标准误σӮ ,使连续性变量的概率分布研
究从误差y –μ升华到抽样误差Ӯ-μӮ , 即Ӯ –μ。
但这还不够,历史上也没有因此避免 正态分布在应用上的危机,因为要获得σ 的准确数值,其难度比μ大得多。到1908 年W.S.Gossetቤተ መጻሕፍቲ ባይዱ开发表一篇论文才使抽样 误差的研究走出应用上的困境。
第一节 单个母总体抽样
前例可归纳出抽样研究的部分结论:
⑴由Nn个Ӯ构成的衍生总体;
Ӯ ~N( μӮ ,σ2Ӯ )且有: μӮ = μ, σ2Ӯ = σ2 /n 并有: u =( Ӯ - μӮ ) ÷ σӮ ⑵由Nn个Σy构成的衍生总体;
Ӯ f f Ӯ f Ӯ 2 S2 f S2 2.0 1 2 4 0 0 2.5 4 10 25 0.5 2 3.0 2 6 18 2 4
获得 | -0.36 |这种抽样误差的两尾概率
(之和)为2×0.2266 = 0.4532。
fN(Ӯ)
n=9 n =4 n=1
Ӯ
--45..24 --01-..368 0.6 1.8
3 4.2 5.4
第一节 单个母总体抽样
回眸例1.5求获得抽样误差的概率:
μ=43.5g ,σ=4.65g,N =623;
如例2.1中定义样本标准误SӮ = S /√n,
则可将抽样误差转换成另一个标准化变量
t = ( Ӯ-μ)÷S/√n = 0.55 ÷ 0.9 = 0.61 查附表3可知获得0.55的两尾概率
当在0.5以上(n-1 = 24)。
第二节 显著性检验的原理
一、什么是显著性检验? 在由样本研究总体时,先提出关于
⑶只有以自由度 n –1算得的样本方差 S2才是σ2 的无偏估计值。
( ΣS2 / Nn = 8÷16 = 1/2 = σ2 )
(但 S 不是σ的无偏估计值)
第一节 单个母总体抽样
例2.2 调查336个平方米的小地老虎 1.4
虫危害结果,μ= 4.73头 ,σ= 2.63头。 1.2
求抽样 n = 30时 Ӯ ≤ 4.37头的概率。
也摸不着” 。
第一节 单个母总体抽样
观察值 Ӯ Σy Ӯ2
(Σy) 2 s2
2,2 2,3 2,3 2,4 3,2 3,3 3,3 3,4
2 2.5 2.5 3
2.5 3
3
3.5
45
5
6
56
6
7
4 6.25 6.25 9
16 25 25 36
0 0.5 0.5 0
6.25 9 9 12.25
25 36 36 49
1
解 由上述结论⑴知,须先求标准误:
σӮ = σ/√n = 2.63÷√30 = 0.48头 u =(Ӯ-μ)÷σ/√n = - 0.75
0.8 0.6
=(4.37-4.73)÷0.48
0.4
P( Ӯ ≤ 4.37 ) = Φ( - 0.75) = 0.2266
0.2
查附表2表明本例所求结果实际为
0
例2.1 给定一有限总体{2,3,3,4},即
N = 4,μ= 3,σ2 = 1/2;现从中以n = 2进行 复置抽样,则所有可能的样本数为 Nn = 16
2,3,3,4
个,计算各样本的统计量并整理成右表 。
解 视Ӯ为变量的衍生总体参数: μӮ = ΣӮ/ Nn = 48÷16 = 3
2,2
σ2Ӯ =〔148 – 48 2÷ 16〕/ 16 = 1/4
Σy ~N( μΣy ,σ2Σy )且有:
3.0 4
μΣy = nμ, σ2Σy = nσ2 又有:
3.5 4
u = (Σy - μΣy ) ÷ σΣy ⑴和⑵表明抽样分布的类型实质上
4.0
1
Σ 还是正态分布,只是其变量特殊罢了。 16
12 36 0 0 14 49 0.5 2 4 16 0 1
48 148 — 8
视Σy为变量的衍生总体参数: μΣy = Σ(Σy) / Nn = 96÷16 = 6
2,3
σ2Σy =〔592 – 96 2÷16〕/16 = 1
以上两个衍生总体均由“一切可能的抽 2,3
样观察结果组成”,并且实际应用中遇到的
多为无限总体,可以想象得到,但“看不见,
3,4
3,3
3,3
3,2 2,4