第三章 抽样分布精品PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
➢ 从方差为σ2的正态总体中,随机抽取含量为n的样本,可计 算出样本方差s2。在讨论样本方差s2的分布时,通常并不直 接谈s2的分布,而是将它标准化,得到一个不带任何单位的 纯数。该纯数服从n-1自由度的卡方分布。
➢ 卡方值:χ2df=(n-1) s2 /σ2
➢ χ2分布是概率曲线随自由度而改变的一类分布(其密度函数 较复杂 ,不要求掌握)
0.5
0.1
0.5
1
2F
0.1 0.5
0.997
n
n
n
得,F
0.1 0.5
n
0.0015
所以, 0.1 2.97 0.5 n
n 442
➢ σ未知时可用样本标准差s代替,标准化变量并不服从正态分
布,而服从具n-1自由度的
t
分布
t
x
s
,其分母为样本标准
误差。
n
➢ 自由度:独立观测值的个数。在这里因为计算s时所使用的n 个观测值,受到平均数x的约束,这就等于有一个观测值不能独 立取值,因此自由度 df =n-1。
程。
总体
☺ ☺☺☺☺
☺
☺ ☺☺☺
☺☺
☺ ☺☺☺☺
随机样本
☺X均=值5☺0
随机样本 均值
X = 50
随机样本
☺X均=值52☺
一、 样本平均数的分布
1、总体标准差已知时,样本平均数的分布服从u 分布(正态分
布)
从平均数为μ,标准差为σ的正态总体中,独立随机地抽取含量为n的样本,
则
,
x
x
n
由此可知,样本平均数是一服从正态分布的随机变量,记为
1
F
83
2
80
F
77
2
80
= 1-[F(1.5)-F(-1.5)]
= 2 [ 1-F(1.5)]
= 0.1336
例2:在总体X~N(μ,0.5)中要以99.7%的概率保证偏差 ∣X -μ∣<0.1,问抽取的样本其容量n应取多大?
解:P {∣ X -μ∣<0.1}= 0.997
即,P
X
X 服从 N (, 2 )
n
将平均数标准化,则
u
x
,其中标准化的分母为平均数的标准误。
n
从一正态总体中抽样
集中趋势 x
离散趋势 (样本平均数间的差异程度)
x
百度文库
n
总体分布
= 10
= 50 X
➢样本平均数正态分布的标准化
u
x
n
n=4 X = 5
抽样分布
n =16 X = 2.5
X- = 50 X
第三章 抽样分布
生物统计学的最基本问题
➢ 生物统计学的最基本问题是研究总体与样本间的关系。 总体有两类:一是由实际研究对象构成的总体;二是 数字的总体。前者可转化为后者。生物统计研究的是 数字总体。
➢ 总体与样本之间的关系,有以下两个途径:
• 总体已知,研究样本的分布规律,即由总体到样 本;
• 总体未知,由样本推断,即由样本到总体。 ➢ 本章研究的是第一个问题:即从总体到样本的研究过
➢ t 分布的密度函数:(不要求掌握)
➢ t 分布的特征数:t 0(df 1)
t
df (df 2) df 2
t 分布曲线
• t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。
• t分布密度曲线以纵轴为对称轴,左右对称,且在t=0时,分布
密度函数取得最大值。
• 与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而
( x1 x2 )
1
2
,
( x1 x2 )
1
2
,
( x1 x2 )
2 1
2 2
,
n1 n2
( x1 x2 )
2 1
2 2
n1 n2
➢ 标准化(
u (x1 x2) (1 2)
2 1
2 2
n1 n2
)后的变量服从
标准的正态分布,这样可以推断在标准差已
知时,两个样本平均数的差异是否显著。
二、总体标准差未知但相等时,两个样本平均数和与差 的分布---t分布
➢ 当σ1和 σ2未知时,可用 s1和s2 代替; ➢ 若两个总体相互独立且都是正态分布的,同时σ1=σ2,则
变量服从自由度为df1+df2的 t分布。 ➢ 根据df 值和α值可查出t值(附表4),用于统计推断。
例1:在总体X~N(80,202)中随机地抽取一容量为100 的样本,问样本均值与总体均值的差的绝对值大于 3的概率是多少?
解:设W是样本均值变量,因总体服从正态分布, 所以W~N(μ,σ2/n)
这里μ=80,σ2=202,n=100,即W~N(80,22)
P{∣W-μ∣>3}=P{∣W-80∣>3} = 1-P{∣W-80∣≤3} = 1-P{77≤W≤83}
例:自由度为9的t分布图如下图所示,求t1的值,使其满足
• 右边阴影的面积=0.05
t1 =1.83 • 全部阴影的面积=0.05
t1 =2.26 • 全部非阴影面积=0.99
t1 =3.25 • 左边阴影的面积=0.01
t1 =2.82 • 左边的总面积 =0.90
t1 =1.38
二、 样本方差s2的分布——χ2分布
平。df 越小这种趋势越明显。df 越大,t分布越趋近于标准正
态分布。
➢当n >30时,t分布与标准正态
分布的区别很小;
➢n >100时,t分布基本与标准
正态分布相同;
➢n→∞时,t 分布与标准正态分
布完全一致。
t 分布的单侧分位数与双侧分位数的查表方法(附表4) 与正态分布表的查法一致,表示方式也与u分布相同。
s2 2
s2 2
2 df
➢s2的理论平均数(数学期望)是σ2。
➢s2的偏斜度及峭度均只跟自由度有 关,随着df 的增加,γ1、γ2越来越 接近于0(近似于正态分布)
χ 2分布查表方法
➢ χ 2分布的上侧和下侧分位点见下图。 ➢ 根据(df,α)查χ 2分布的上侧分位数。 (附表6) ➢ 若查下侧分位数,只要查出1-α时的分位数即可。
例1:查df=9,α=0.05的χ 2值 例2:设随机变量k服从分布χ 2(5),求λ的值使其满足 P{k≤λ}=0.05
假定有两个正态总体,分别具有(μ1,σ1)和(μ2,σ2)。 从第一个总体中随机抽取含量为n1的样本,并独立地从第二 个总体中抽取含量为n2的样本。求出x1,s1和x2,s2。下面我们 研究x1±x2的分布。
χ2分布曲线:
➢ χ2分布是连续型变量的分 布,每个不同的自由度都 有一个相应的χ 2分布曲线;
➢ 对于较小的自由度,其分 布 曲 线 明 显 右 倾 , df=1 时曲线以纵轴为渐近线;
➢ 随着自由度的增加,其偏 斜度和峭度接近于0,这 时的分布近似于正态分布。
样本方差(卡方)分布的几个特征数:
➢ 卡方值:χ2df=(n-1) s2 /σ2
➢ χ2分布是概率曲线随自由度而改变的一类分布(其密度函数 较复杂 ,不要求掌握)
0.5
0.1
0.5
1
2F
0.1 0.5
0.997
n
n
n
得,F
0.1 0.5
n
0.0015
所以, 0.1 2.97 0.5 n
n 442
➢ σ未知时可用样本标准差s代替,标准化变量并不服从正态分
布,而服从具n-1自由度的
t
分布
t
x
s
,其分母为样本标准
误差。
n
➢ 自由度:独立观测值的个数。在这里因为计算s时所使用的n 个观测值,受到平均数x的约束,这就等于有一个观测值不能独 立取值,因此自由度 df =n-1。
程。
总体
☺ ☺☺☺☺
☺
☺ ☺☺☺
☺☺
☺ ☺☺☺☺
随机样本
☺X均=值5☺0
随机样本 均值
X = 50
随机样本
☺X均=值52☺
一、 样本平均数的分布
1、总体标准差已知时,样本平均数的分布服从u 分布(正态分
布)
从平均数为μ,标准差为σ的正态总体中,独立随机地抽取含量为n的样本,
则
,
x
x
n
由此可知,样本平均数是一服从正态分布的随机变量,记为
1
F
83
2
80
F
77
2
80
= 1-[F(1.5)-F(-1.5)]
= 2 [ 1-F(1.5)]
= 0.1336
例2:在总体X~N(μ,0.5)中要以99.7%的概率保证偏差 ∣X -μ∣<0.1,问抽取的样本其容量n应取多大?
解:P {∣ X -μ∣<0.1}= 0.997
即,P
X
X 服从 N (, 2 )
n
将平均数标准化,则
u
x
,其中标准化的分母为平均数的标准误。
n
从一正态总体中抽样
集中趋势 x
离散趋势 (样本平均数间的差异程度)
x
百度文库
n
总体分布
= 10
= 50 X
➢样本平均数正态分布的标准化
u
x
n
n=4 X = 5
抽样分布
n =16 X = 2.5
X- = 50 X
第三章 抽样分布
生物统计学的最基本问题
➢ 生物统计学的最基本问题是研究总体与样本间的关系。 总体有两类:一是由实际研究对象构成的总体;二是 数字的总体。前者可转化为后者。生物统计研究的是 数字总体。
➢ 总体与样本之间的关系,有以下两个途径:
• 总体已知,研究样本的分布规律,即由总体到样 本;
• 总体未知,由样本推断,即由样本到总体。 ➢ 本章研究的是第一个问题:即从总体到样本的研究过
➢ t 分布的密度函数:(不要求掌握)
➢ t 分布的特征数:t 0(df 1)
t
df (df 2) df 2
t 分布曲线
• t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。
• t分布密度曲线以纵轴为对称轴,左右对称,且在t=0时,分布
密度函数取得最大值。
• 与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而
( x1 x2 )
1
2
,
( x1 x2 )
1
2
,
( x1 x2 )
2 1
2 2
,
n1 n2
( x1 x2 )
2 1
2 2
n1 n2
➢ 标准化(
u (x1 x2) (1 2)
2 1
2 2
n1 n2
)后的变量服从
标准的正态分布,这样可以推断在标准差已
知时,两个样本平均数的差异是否显著。
二、总体标准差未知但相等时,两个样本平均数和与差 的分布---t分布
➢ 当σ1和 σ2未知时,可用 s1和s2 代替; ➢ 若两个总体相互独立且都是正态分布的,同时σ1=σ2,则
变量服从自由度为df1+df2的 t分布。 ➢ 根据df 值和α值可查出t值(附表4),用于统计推断。
例1:在总体X~N(80,202)中随机地抽取一容量为100 的样本,问样本均值与总体均值的差的绝对值大于 3的概率是多少?
解:设W是样本均值变量,因总体服从正态分布, 所以W~N(μ,σ2/n)
这里μ=80,σ2=202,n=100,即W~N(80,22)
P{∣W-μ∣>3}=P{∣W-80∣>3} = 1-P{∣W-80∣≤3} = 1-P{77≤W≤83}
例:自由度为9的t分布图如下图所示,求t1的值,使其满足
• 右边阴影的面积=0.05
t1 =1.83 • 全部阴影的面积=0.05
t1 =2.26 • 全部非阴影面积=0.99
t1 =3.25 • 左边阴影的面积=0.01
t1 =2.82 • 左边的总面积 =0.90
t1 =1.38
二、 样本方差s2的分布——χ2分布
平。df 越小这种趋势越明显。df 越大,t分布越趋近于标准正
态分布。
➢当n >30时,t分布与标准正态
分布的区别很小;
➢n >100时,t分布基本与标准
正态分布相同;
➢n→∞时,t 分布与标准正态分
布完全一致。
t 分布的单侧分位数与双侧分位数的查表方法(附表4) 与正态分布表的查法一致,表示方式也与u分布相同。
s2 2
s2 2
2 df
➢s2的理论平均数(数学期望)是σ2。
➢s2的偏斜度及峭度均只跟自由度有 关,随着df 的增加,γ1、γ2越来越 接近于0(近似于正态分布)
χ 2分布查表方法
➢ χ 2分布的上侧和下侧分位点见下图。 ➢ 根据(df,α)查χ 2分布的上侧分位数。 (附表6) ➢ 若查下侧分位数,只要查出1-α时的分位数即可。
例1:查df=9,α=0.05的χ 2值 例2:设随机变量k服从分布χ 2(5),求λ的值使其满足 P{k≤λ}=0.05
假定有两个正态总体,分别具有(μ1,σ1)和(μ2,σ2)。 从第一个总体中随机抽取含量为n1的样本,并独立地从第二 个总体中抽取含量为n2的样本。求出x1,s1和x2,s2。下面我们 研究x1±x2的分布。
χ2分布曲线:
➢ χ2分布是连续型变量的分 布,每个不同的自由度都 有一个相应的χ 2分布曲线;
➢ 对于较小的自由度,其分 布 曲 线 明 显 右 倾 , df=1 时曲线以纵轴为渐近线;
➢ 随着自由度的增加,其偏 斜度和峭度接近于0,这 时的分布近似于正态分布。
样本方差(卡方)分布的几个特征数: