e第四章 抽样分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节
从一个正态总体中抽取的 样本统计量的分布
一、样本平均数的分布
(一)标准差已知时的平均数的分布——正态分布
从平均数为m,标准差为s 的正态总体中,独立随机地抽 取含量为n的样本,样本平均数是一服从正态分布的随 机变量,记为Y, 服从N(m ,s 2/n)。 将平均数标准化,则
u y m
s
5、t分布的临界值
t分布的双侧临界值:将t分布曲线下α面积平分到两 侧尾区,则每一尾区的曲线下面积只有α/ 2, 满 足P(|t | > tα/ 2)=α 时的tα/ 2称为α的 t分布双侧临界 值。 双侧临界值表示为: P(| t | > tα/ 2,df)=α 不同自由度下t分布的某些单侧和双侧临界值可 由附表4a和附表4b t分布的临界值表查出。
解:查附表7F检验的临界值表知:
df1=4,df2=20,α=0.01的上侧临界值
F4, 20, 0.01=4.431
df1=20,df2=4,α=0.01的 上侧临界值 F20, 4, 0.01=14.02
【例4.4】
df1=4,df2=20,α=0.01的下侧临界值? df1=4,df2=20,α=0.99的上侧临界值?
sy
s n
自由度(degree of freedom, df):独立观测值的个数,即 在保证样本平均数和样本含量不变的前提下,可以自 由调度的观测值个数。一般情况下 df=n-1。
• 标准差在国家计量技术规范中, 正式名称是标准偏 差,简称标准差,用符号σ表示。名称有10 余种,如总 体标准差、母体标准差、均方根误差、均方根偏差、 均方误差、均方差、单次测量标准差和理论标准差 等。 • 样本平均数的标准误或简称标准误(standard error of mean),反映了样本平均数的离散程度。标准误 越小, 说明样本平均数与总体平均数越接近;否则, 表明样本平均数比较离散。 • 标准差是表示个体间变异大小的指标,反映了整个样 本对样本平均数的离散程度,是数据精密度的衡量 指标;而标准误反映样本平均数对总体平均数的变 异程度,从而反映抽样误差的大小,是量度结果精 密度的指标。
5、F分布临界值
F分布的上侧临界值:F分布曲线右侧尾区α面积下 所 对 应 的 F 值 Fdf1,df2,α 满 足 P(F>Fdf1,df2,α)=α , Fdf1,df2,α称为α的F分布上侧临界值。 F分布的下侧临界值:F分布曲线右侧尾区1-α面积 下所对应的F值Fdf1,df2,1-α 满足P(F>Fdf1,df2,1-α)=1-α, Fdf1,df2,1-α称为α的F分布下侧临界值。 不同自由度下F分布的某些上侧临界值 可由附表7 F检验的临界值表查出。
抽样分布
总体
统计推断
样本
抽样分布:从一个已知总体中,独立随机 地抽取含量为n的样本,研究所得样本的 各种统计量(平均数、方差)的概率分 布,即抽样分布。
第四章 抽样分布
sampling distribution
本章内容
第一节 从一个正态总体中抽取的样本统计量的分布 样本平均数的分布——正态分布或t分布 样本方差的分布—— x2分布 第二节 从两个正态总体中抽取的样本统计量的分布 两个平均数的和与差的分布——正态分布 或t分布 两个样本方差比的分布—— F分布
【例4.1】
t0.05,10=?
解:查附表4可知:
t0.05,10=1.812
f (t)
t0.05/2,10=?
t0.05/2,10=〒2.228
f (t)
df=10的t分布图
t
1.812
-2.228
2.228
双侧t0.05/2,9=2.262 =单侧t0.025,9
单侧t0.05,9=1.833
n
标准误差:标准差除以样本含量的 平方根称为平均数的标准误差。
s
y
s
n
(二)标准差未知时的平均数的分布——t分布
1、t分布的引出
s 未知时,用样本标准差代替总体标准差,标准化变量
服从具n-1自由度的t分布,
t ym s n ,具 n - 1自由度
样本标准误差:样本标准差除以样本含量 的平方根称为样本平均数的标准误差。
一、标准差si已知时,两个平均数的 和与差的分布——正态分布
标准差si已知时,两个样本平均数的和与差的分布 服从
将 y 1 y 2 标准化,则
u
y1
y 2 - m 1 m 2
s1
2
s
2 2
n1
n2
标准化的变量服从标准正态分布,籍此可以推断 在si已知时,两个样本平均数的差异是否显著。
解:df1=4,df2=20,α=0.01的下侧临界值就是
df1=4,df2=20,α=0.99的上侧临界值 F4, 20, 0.01, 下 =F4, 20, 0.99 =1/F20, 4, 0.01 =1/14.02 =0.0714
【例4.5】
F12, 17, 0.05 = ?
15, 0.05=2.475,F12,20, 0.05=2.278
F分布是為了紀念著名的統計學家R.A. Fisher(1890-1962)而得名。
2、F分布的密度函数和特征数
F分布是由一对自由度df1和df2确定的,其密度函 数为:
S1
2 2
S2
F分布的特征数:
3、F分布的特征
F分布曲线形状是由计算F值时分子与分母的自
由度决定的,曲线明显右倾。
S1
2 2
S2
解:F的临界值表中没有给出,用线性内插法求出,
先查F12, 由以下计算: F12, 17, 0.05 =2.475+[(2.278-2.475)/(20-15)] .(17-15) =2.475-0.0788 =2.3962
小 结
(1)概率、随机变量、概率分布、抽 样分布是统计推断的基础。 (2) 二项分布描述二项分布变量两种 观察结果的出现规律。泊松分布是二 项分布的特例,常用于事件发生率很 小,样本含量很大的情况。
2、t分布的密度函数和特征数
t分布是一种对称分布,只有一个参数,即自由度。 t分布的密度函数为:
t分布的特征数:
随 df 的 增 加 , t 分 布愈来愈接近于标 准正态分布。
3、t分布的特征
①以0为中心,左右对称的 单峰分布; ②t分布曲线是一簇曲线, 其形态变化与自由度的 大小有关。自由度越小, 则t值越分散,曲线越 低平;自由度越大,则 t值越集中,曲线越高 耸。 ③自由度逐渐增大时,t分 布逐渐逼近标准正态分 布;当趋于∞时,t分 布即为标准正态分布。
6、F检验的临界值表——附表7
附表7中,表头是分子自由度df1 ,第一纵 列是分母自由度df2 ,第二纵列是α,表中 内容是对应的α和自由度下F分布的上侧临 界值Fdf1,df2,α 。
【例4.3】
df1=4,df2=20,α=0.01的F分布上侧临界值? df1=20,df2=4,α=0.01的F分布上侧临界值?
将样本方差s 2标准化,标准化后的x2df 称 为s 2具n-1自由度的卡方,服从x2分布。
2、x2分布的密度函数和特征数
x2分布是概率曲线随自由度df而改变的一类分布, 它的密度函数为:
x2分布的特征数:
随df的增加, x2分 布愈来愈接近于正 态分布。
3、x2分布的特征
①自由度为1的x2 分 布记为x21, 图形从 纵轴某个点开始单 调下降,先凸后凹。 ②自由度为大于1的 x2 分布记为x2df 或简 记 为 x2 。 图 形 为 单 峰,正偏峰;自由度 很大时,近似地服从 正态分布。
双侧t0.01/2,9=3.250 =单侧t0.005,9 单侧t0.01,9=2.821 双侧t0.05/2,∞=1.96 =单侧t0.025,∞ 单侧t0.05,∞ =1.645
二、样本方差的分布——x2分布
1、卡方
x2df
wenku.baidu.com
从方差为s 2的正态总体中,随机抽取含量 为n的样本,计算出样本方差s 2,通过:
(3)正态分布是其他分布的极限分布, 是许多统计方法的理论基础。很多生 物学现象服从正态分布或近似服从正 态分布。 (4)样本统计量的分布(或抽样分布) 包括:正态分布、t分布、x2分布、F 分布等。这些分布规律是u检验、t检 验、x2 检验、F检验、方差分析等统 计假设检验的基础。
5、t分布的临界值
t分布的上侧临界值:t分布曲线右侧尾区α面 积下所对应的t值tα满足P(t > tα)=α,tα称为 α的t分布上侧临界值。 t分布的下侧临界值:t分布曲线左侧尾区α面 积下所对应的t值-tα满足P(t < -tα)=α,-tα称为 α的t分布下侧临界值。 t分布的单侧临界值表示为: P(t >tα,df)= P(t < -tα,df)=α
6、x2分布的上侧临界值表——附表6
附表6中,表头是α,第一纵列是自由度, 表中内容是对应的α和自由度下x2 分布的 上侧临界值x2α,df 。
【例4.2】
df=9,α=0.05的x2分布上侧和下侧临界值?
解:查附表6可知:
df=9,α=0.05的上侧临界值 x20.05, 9=16.919 df=9,α=0.05的下侧临界值 x21-0.05,9=3.325
1.4 1.2 1.0 0.8 0.6 0.4 0.2 0.0 0
f( F)
1 1, 2 5
1 5, 2 5
1 10, 2 10
1
不同自由度下的F 分布曲线
2F
3
4
4、F分布曲线下面积与概率
F分布曲线下总的面积等于1,即F值落
入区间(0,∞)内的概率为1。 F值 落入某一区间内的概率等于该区间内 曲线和横轴所夹的面积。
2 1 s 2 1 1 n n 1 2 1
当n1= n2= n时,
t2n2
y1
y 2 - m 1 m 2 s1 s 2
2 2
n
三、两个样本方差比的分布
——F分布
1、F 分布
两个样本方差标准化后的比称为F, 服从 F分布。
不同自由度下的x2分布图
4、x2分布曲线下面积与概率
x2分布曲线下总的面积等于1,即x2值落入区 间(0,∞)内的概率为1。 x2值落入某一
区间内的概率等于该区间内曲线和横轴所
夹的面积。
5、x2分布临界值
x2分布的上侧临界值:x2分布曲线右侧尾区α面积 下所对应的x2值x2α,df 满足P(x2 > x2α,df)=α,x2α,df 称为α的x2分布上侧临界值。 x2分布的下侧临界值:x2分布曲线右侧尾区1-α面积下 所对应的x2值x21-α,df 满足P(x2 > x21-α,df)=1-α,x21-α,df 称为α的x2分布下侧临界值。 不同自由度下x2分布的某些上侧临界值 可由附表6 x2分布的上侧临界值查出。
-5.0 -4.0 -3.0 -2.0
f(t)
df ─>∞(标准正态曲线) df =4
df =1
-1.0
0.0
1.0
2.0
3.0
4.0
5.0
t
不同自由度下的t 分布图
4、t分布曲线下面积与概率
t分布曲线下总的面积等于1,即t值落入区间 (-∞,∞)内的概率为1。t值落入任一区间 (t1,t2)内的概率等于该区间内曲线和横轴 所夹的面积。
第二节
从两个正态总体中抽取的 样本统计量的分布
有两个正态总体N1(m1,s21)和 N2(m2, s22 ),从这两个总体中分别独立随机 地抽取样本, 样本1:n1 ,y1, s21 样本2:n2 ,y2, s22 对这两个样本进行比较分析,也就是研 究两样本平均数的差以及两样本方差的 比的情况。
二、标准差si未知但相等时两个平均数的 和与差的分布——t分布
标准差si未知但相等时,两个样本平均数的和与差 的分布服从df1+ df2即n1+ n2-2自由度的t分布。
t n1 n 2 2
y1
y 2 - m 1 m 2
n 1 1 s 12 n 2 n1 1 n 2