生物统计学2抽样分布及应用

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第二章抽样分布及其应用㈠
第一节第二节第三节第四节
第五节
单个母总体抽样显著性检验的原理两个母总体抽样检验两个样本平均数差异
（含F分布、方差的齐性检验）
配对数据的显著性检验
第二章要点提示
抽样分布既是本课程的基础，又是本课程的难点，学习时①要注意抽
样分布的特点及其与上一章正态分布的统一性；②要注意样本统计量如、
以上两个衍生总体均由“一切可能的抽 2，3
样观察结果组成”，并且实际应用中遇到的
多为无限总体，可以想象得到，但“看不见，
3，4
3，3
3，3
3，2 2，4
也摸不着” 。
第一节单个母总体抽样
观察值 Ӯ Σy Ӯ2
(Σy) 2 s2
2，2 2，3 2，3 2，4 3，2 3，3 3，3 3，4
2 2.5 2.5 3
3 4.2 5.4
第一节单个母总体抽样
回眸例1.5求获得抽样误差的概率：
μ=43.5g ，σ=4.65g，N =623；
Ӯ = 44.05 g，S = 4.523g，n = 25 解按惯例所求两尾概率即抽样误差的绝对值达到0.55的概率，因此有：
σӮ = σ/√n = 4.65÷√25 = 0.93g u =0.55÷σ/√n = 0.59
反查附表2或顺查附表1可得：
P( | Ӯ –μ|≥0.55) = P(|u| ≥0.59)
= 2 P(u ≤ - 0.59) = 2 Φ(- 0.59) = 2 ×0.2776 = 0.5552 ≈ 0.56
以上两例已由总体标准差σ深化到总体标准误σӮ ，使连续性变量的概率分布研
究从误差y –μ升华到抽样误差Ӯ－μӮ ，即Ӯ –μ。
例2.2 调查336个平方米的小地老虎 1.4
虫危害结果，μ= 4.73头，σ= 2.63头。 1.2
求抽样 n = 30时 Ӯ ≤ 4.37头的概率。
1
解由上述结论⑴知，须先求标准误：
σӮ = σ/√n = 2.63÷√30 = 0.48头 u =（Ӯ－μ）÷σ/√n = - 0.75
0.8 0.6
当在0.5以上（n－1 = 24）。
第二节显著性检验的原理
一、什么是显著性检验？在由样本研究总体时，先提出关于
总体的统计假设 ( Ho ) ，然后利用样本提供的信息去反证它是否成立。
这种证明 Ho 是否成立的过程就叫统计假设测验，简称假设测（检）验。
涉及教材内容：第四章第六、七节，第五章第一、二、三节。
作业布置：P56 ～ P57 T6、 T7、 T10、 T11、 T12、 T13、 T15、 T16；教材P78 T9、 T11、 T12。
第一节单个母总体抽样
例2.1 给定一有限总体｛2，3，3，4｝,即
N = 4,μ= 3,σ2 = 1/2；现从中以n = 2进行复置抽样，则所有可能的样本数为 Nn = 16
8
6.25 9
9
12.25 148
9 12.25 12.25 16
25 36 36 49
36 49 49 64
592
0.5 0
0
0.5
8
2
0.5 0.5 0
第一节单个母总体抽样
前例可归纳出抽样研究的部分结论：
⑴由Nn个Ӯ构成的衍生总体；
Ӯ ～N（ μӮ ，σ2Ӯ ）且有： μӮ = μ， σ2Ӯ = σ2 /n 并有： u =（ Ӯ － μӮ ） ÷ σӮ ⑵由Nn个Σy构成的衍生总体；
4.0
1
Σ 还是正态分布，只是其变量特殊罢了。 16
12 36 0 0 14 49 0.5 2 4 16 0 1
48 148 — 8
⑶只有以自由度 n –1算得的样本方差 S2才是σ2 的无偏估计值。
（ ΣS2 / Nn = 8÷16 = 1/2 = σ2 ）
（但 S 不是σ的无偏估计值）
第一节单个母总体抽样
Σy 、y
、y1đ的y概2 率分布类型（正态分布）及其参数与母总体概型
及其参数的联系和区别（中心极限定理）；③ 应充分理解显著性检验的原
理和特点，熟悉两尾检验与一尾检验的异同；④重点掌握检验Ӯ和Ӯ1－Ӯ2 时依据的抽样分布类型及标准误σӮ、SӮ和差数标准误σӮ1- Ӯ2、SӮ1- Ӯ2的计算
公式，并与检验đ时依据的差数的抽样分布和计算差数平均数的标准误σđ 、 Sđ的公式相区别。
Ӯ f f Ӯ f Ӯ 2 S2 f S2 2.0 1 2 4 0 0 2.5 4 10 25 0.5 2 3.0 2 6 18 2 4
Σy ～N（ μΣy ，σ2Σy ）且有：
3.0 4
ቤተ መጻሕፍቲ ባይዱ
μΣy = nμ， σ2Σy = nσ2 又有：
3.5 4
u = （Σy － μΣy ） ÷ σΣy ⑴和⑵表明抽样分布的类型实质上
=（4.37－4.73）÷0.48
0.4
P( Ӯ ≤ 4.37 ) = Φ( - 0.75) = 0.2266
0.2
查附表2表明本例所求结果实际为
0
获得 | -0.36 |这种抽样误差的两尾概率
（之和）为2×0.2266 = 0.4532。
fN(Ӯ)
n=9 n =4 n=1
Ӯ
--45..24 --01-..368 0.6 1.8
2.5 3
3
3.5
45
5
6
56
6
7
4 6.25 6.25 9
16 25 25 36
0 0.5 0.5 0
6.25 9 9 12.25
25 36 36 49
0.5 2 0 0.5
3，2 3，3 3，3 3，4
Σ
4，2 4，3 4，3 4，4
2.5 3
3
3.5
48
3
3.5 3.5 4
5
6
6
6
7
7
7 96
但这还不够，历史上也没有因此避免正态分布在应用上的危机，因为要获得σ 的准确数值，其难度比μ大得多。到1908 年W.S.Gosset公开发表一篇论文才使抽样误差的研究走出应用上的困境。
如例2.1中定义样本标准误SӮ = S /√n，
则可将抽样误差转换成另一个标准化变量
t = ( Ӯ－μ)÷S/√n = 0.55 ÷ 0.9 = 0.61 查附表3可知获得0.55的两尾概率
2，3，3，4
个，计算各样本的统计量并整理成右表。
解视Ӯ为变量的衍生总体参数： μӮ = ΣӮ/ Nn = 48÷16 = 3
2，2
σ2Ӯ =〔148 – 48 2÷ 16〕/ 16 = 1/4
视Σy为变量的衍生总体参数： μΣy = Σ(Σy) / Nn = 96÷16 = 6
2，3
σ2Σy =〔592 – 96 2÷16〕/16 = 1