三大抽样分布课件
合集下载
统计学(8)抽样分布ppt课件
23
三、两个样本方差比的抽样分 布
1. 两个总体都为正态分布,即X1~N(μ1,σ12)的一个样本, Y1,Y2,… ,Yn2是来自正态总体X2~N(μ2,σ22 )
2. 从两个总体中分别抽取容量为n1和n2的独立样本
3. 两个样本方差比的抽样分布,服从分子自由度为(n1-1), 分母自由度为(n2-1) F分布,即
第八章 抽样分布
ppt课件完整
1
• 统计方法
描述统计
推断统计
参数估计
假设检验
ppt课件完整
2
所谓统计推断,就是根据概率论所揭示的随机变 量的一般规律性,利用抽样调查所获得的样本信息, 对总体的某些性质或数量特征进行推断。
参数估计
统计推断 假设检验
这两类问题的基本原理是一致的,只是侧重点不同 而已。 参数估计问题侧重于用样本统计量估计总体的某一 未知参数; 假设检验问题侧重于用样本资料验证总体是否具有 某种性质或数量特征。
21
一、两个样本均值之差的抽样分 布
1. 两个总体都为正态分布,即 X1 ~N(1,12,) X2 ~N(2,22)
2. 两个样本均值之差 X1 X2的抽样分布服从正态分 布,其分布的数学期望为两个总体均值之差
E(X1X2)12
•
方差为各自的方差之和
2
2
2 X1X2
1
2
n n 1
2
ppt课件完整
X
n
ppt课件完整
15
二、样本比例的抽样分 布
比例:
1. 比例:指总体(或样本)中具有某种属性的单位与 全部单位总数之比。
• 例1:不同性别的人与全部人数之比
• 例2:合格品与全部产品总数之比
《抽样和抽样分布》课件
《抽样和抽样分布》ppt课件
$number {01}
目录
• 抽样调查的基本概念 • 抽样分布的基础知识 • 抽样分布的原理 • 抽样误差的评估 • 实际应用中的抽样技术 • 案例分析
01
抽样调查的基本概念
抽样的定义和意义
定义
抽样是从总体中选取一部分个体 进行研究的方法。
意义
通过对部分个体的研究,推断出 总体的特征,以节省时间和资源 。
适用场景
当总体中存在周期性变化 或某种明显的模式时,系 统抽样能够提高样本的代 表性。
注意事项
要确保抽样的间隔与总体 中的变化模式相匹配,以 避免偏差。
分层抽样
分层抽样
注意事项
将总体分成若干层,然后从每层中随 机抽取一定数量的样本。
要确保分层依据合理,且层内样本的 抽取方法一致,以避免层间和层内的 偏差。
抽样误差的衡量指标
抽样平均误差
抽样平均误差是衡量抽样误差大小的指标,它反映了样本统 计量与总体参数之间的平均偏差。
抽样变异系数
抽样变异系数是衡量非系统抽样误差的指标,它反映了由于 随机性引起的样本统计量与总体参数之间的偏差程度。
05
实际应用中的抽样技术系统ຫໍສະໝຸດ 样010203
系统抽样
按照某种规则,每隔一定 数量的个体进行抽样,直 到达到所需的样本量。
步骤 1. 明确研究目的和要求。 2. 确定总体和样本规模。
抽样的原则和步骤
01 02 03
3. 选择合适的抽样方法。 4. 制定详细的抽样计划。
5. 实施抽样调查。
02
抽样分布的基础知识
总体和样本
1 2
3
总体
研究对象的全体集合。
样本
$number {01}
目录
• 抽样调查的基本概念 • 抽样分布的基础知识 • 抽样分布的原理 • 抽样误差的评估 • 实际应用中的抽样技术 • 案例分析
01
抽样调查的基本概念
抽样的定义和意义
定义
抽样是从总体中选取一部分个体 进行研究的方法。
意义
通过对部分个体的研究,推断出 总体的特征,以节省时间和资源 。
适用场景
当总体中存在周期性变化 或某种明显的模式时,系 统抽样能够提高样本的代 表性。
注意事项
要确保抽样的间隔与总体 中的变化模式相匹配,以 避免偏差。
分层抽样
分层抽样
注意事项
将总体分成若干层,然后从每层中随 机抽取一定数量的样本。
要确保分层依据合理,且层内样本的 抽取方法一致,以避免层间和层内的 偏差。
抽样误差的衡量指标
抽样平均误差
抽样平均误差是衡量抽样误差大小的指标,它反映了样本统 计量与总体参数之间的平均偏差。
抽样变异系数
抽样变异系数是衡量非系统抽样误差的指标,它反映了由于 随机性引起的样本统计量与总体参数之间的偏差程度。
05
实际应用中的抽样技术系统ຫໍສະໝຸດ 样010203
系统抽样
按照某种规则,每隔一定 数量的个体进行抽样,直 到达到所需的样本量。
步骤 1. 明确研究目的和要求。 2. 确定总体和样本规模。
抽样的原则和步骤
01 02 03
3. 选择合适的抽样方法。 4. 制定详细的抽样计划。
5. 实施抽样调查。
02
抽样分布的基础知识
总体和样本
1 2
3
总体
研究对象的全体集合。
样本
抽样与抽样分布.pptx
参数估计也就是用样本统计量去估计总体的 参数。比如,用样本均值估计总体均值估计 总体均值,用样本方差估计总体方差,用样 本比例估计总体比例等。
用计来量估,计用总符体号参 数表的示统计量的名称,称为估
用来估计总体参数时计算出来的估计量的具 体数值,称为估计值
点估计与区间估计
参数估计的方法有点估计和区间估计 ◆(一)点估计
x 的分布形式与原有总体和样本容量n的大
小有关 .3 总体分布
.3 P ( x ) 抽样分布
.2
.2
.1
0 1
234
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
= 2.5
σ2 =1.25
当总体服从正态分布N(μ, 2 )n时,样本均值的抽
样分布仍然是服从正态分布的,其均值仍为 μ , 方差为 ,即2 n样本均值的方差比原总体的方差 要小,而且样本容量n越大,方差越小。
点估计又称定值估计。它是用实际样本指标 数值代替总体指标数值,即总体平均数的点 估计值就是样本平均数,总体成数的点估计 值就是样本成数。这种估计不考虑是否有抽 样误差。
例如,对一批某种型号的电子元件10000只 进行耐用时间检查,随机抽取100只,测试的 平均耐用时间子元件的平均耐用时 间为1055小时,全部电子元件的合格率也是 91%。
.2
.1 0
1
234
现从总体中抽取n=2的简单随机样本,在重复抽样条件 下,共有42=16个样本。所有样本的结果为
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
用计来量估,计用总符体号参 数表的示统计量的名称,称为估
用来估计总体参数时计算出来的估计量的具 体数值,称为估计值
点估计与区间估计
参数估计的方法有点估计和区间估计 ◆(一)点估计
x 的分布形式与原有总体和样本容量n的大
小有关 .3 总体分布
.3 P ( x ) 抽样分布
.2
.2
.1
0 1
234
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
= 2.5
σ2 =1.25
当总体服从正态分布N(μ, 2 )n时,样本均值的抽
样分布仍然是服从正态分布的,其均值仍为 μ , 方差为 ,即2 n样本均值的方差比原总体的方差 要小,而且样本容量n越大,方差越小。
点估计又称定值估计。它是用实际样本指标 数值代替总体指标数值,即总体平均数的点 估计值就是样本平均数,总体成数的点估计 值就是样本成数。这种估计不考虑是否有抽 样误差。
例如,对一批某种型号的电子元件10000只 进行耐用时间检查,随机抽取100只,测试的 平均耐用时间子元件的平均耐用时 间为1055小时,全部电子元件的合格率也是 91%。
.2
.1 0
1
234
现从总体中抽取n=2的简单随机样本,在重复抽样条件 下,共有42=16个样本。所有样本的结果为
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
统计学第3章抽样与抽样分布PPT资料(正式版)
统计学第3章抽样与抽样分布
3.1 常用的抽样方法
概率抽样
(probability sampling)
1. 也称随机抽样
按一定的概率以随机原则抽取样本
简单随机抽样
(simple random sampling)
1. 从总体N个单位中随机地抽取n个单位作为样本, 每个单位入抽样本的概率是相等的
2. 有重复抽样和不重复抽样
3 2.0 2.5 3.0 3.5
4
.3
2.5
.2
3.0
3.5 .1
4.0 0
P (X ) 1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
样本均值的抽样分布
样本均值的分布与总体分布的比较 P101
总体分布
.3
.2
.1 0
1
234
= 2.5
σ2
.3 P ( X ) 抽样分布
.2
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布
有重复抽样和不重复抽样
既可以 对总体 参数进 行估计 ,也可 以对 从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的
各层的目标量进行估计
3.1.3 系统抽样
(systematic sampling)
1. 将总体中的所有单位按一定顺序排列,按 某规则确定一个随机起点, 然后每隔一定 的间隔抽取一个单位,直到抽取n个样本单 位.
2. 优点:操作简便,可提高估计的精度
3.1.4 整群抽样
1. 将总体中若干个单位合并为组(群),抽样 时直接抽取群,然后对中选群中的所有单 位全部实施调查
3.1 常用的抽样方法
概率抽样
(probability sampling)
1. 也称随机抽样
按一定的概率以随机原则抽取样本
简单随机抽样
(simple random sampling)
1. 从总体N个单位中随机地抽取n个单位作为样本, 每个单位入抽样本的概率是相等的
2. 有重复抽样和不重复抽样
3 2.0 2.5 3.0 3.5
4
.3
2.5
.2
3.0
3.5 .1
4.0 0
P (X ) 1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
样本均值的抽样分布
样本均值的分布与总体分布的比较 P101
总体分布
.3
.2
.1 0
1
234
= 2.5
σ2
.3 P ( X ) 抽样分布
.2
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布
有重复抽样和不重复抽样
既可以 对总体 参数进 行估计 ,也可 以对 从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的
各层的目标量进行估计
3.1.3 系统抽样
(systematic sampling)
1. 将总体中的所有单位按一定顺序排列,按 某规则确定一个随机起点, 然后每隔一定 的间隔抽取一个单位,直到抽取n个样本单 位.
2. 优点:操作简便,可提高估计的精度
3.1.4 整群抽样
1. 将总体中若干个单位合并为组(群),抽样 时直接抽取群,然后对中选群中的所有单 位全部实施调查
3个重要分布与抽样定理培训课件(PPT共 70张)
25.188
24.352 26.056
27.722
26.124 27.877
29.588
9 10
2 ( 5 ) 16.75 0 . 005
0.412 0 ( 5 ) . 995
2
讲讲练练
例 1 设 X , X , , X 是来自总 X ~ N ( 0 , 1 ) 1 2 5
试确定k1,k2 ,使得Y 服从2分布。
3 X 4 X 3 4 ~N ( 0 , 1 ) 100
比较得:a=1/20, b=1/100, n=2
例6.2.1
求 P {
i 1 10 2 X .44 }. i 1
2 设 X , X , X 是来自总体 X ~ N(0.0. ) 的样 1 2 10
X i N ( 0 , 1 ) X ~ N ( 0 . 0 . 3 ) ~ i 0 . 3
A B C D
XY ~N (0 ,1 ) X Y ~ N ( 0 , 3 ) 3 1 2 2 (X Y ) ~ ( 1 ) 3
1 2 2 2 X Y 服从 2 分布; 3 3 1 2 1 2 X Y 服从 2 分布; 2 2 1 ( X Y ) 2 服从 2 分布; 3 1 ( X Y ) 2 服从 2 分布; 2
1 比较: k1 3
1 比较: k 2 2
,X ,X ,X 设X 为正态总体 1 2 3 4 的一个简单随机样本,
,则当
练一 练
N(0 ,4)
2 2 X a ( X 2 X ) b ( 3 X 4 X ) 1 2 3 4
a ?
2
,
b
? ,时,统计量 .
X 服从
24.352 26.056
27.722
26.124 27.877
29.588
9 10
2 ( 5 ) 16.75 0 . 005
0.412 0 ( 5 ) . 995
2
讲讲练练
例 1 设 X , X , , X 是来自总 X ~ N ( 0 , 1 ) 1 2 5
试确定k1,k2 ,使得Y 服从2分布。
3 X 4 X 3 4 ~N ( 0 , 1 ) 100
比较得:a=1/20, b=1/100, n=2
例6.2.1
求 P {
i 1 10 2 X .44 }. i 1
2 设 X , X , X 是来自总体 X ~ N(0.0. ) 的样 1 2 10
X i N ( 0 , 1 ) X ~ N ( 0 . 0 . 3 ) ~ i 0 . 3
A B C D
XY ~N (0 ,1 ) X Y ~ N ( 0 , 3 ) 3 1 2 2 (X Y ) ~ ( 1 ) 3
1 2 2 2 X Y 服从 2 分布; 3 3 1 2 1 2 X Y 服从 2 分布; 2 2 1 ( X Y ) 2 服从 2 分布; 3 1 ( X Y ) 2 服从 2 分布; 2
1 比较: k1 3
1 比较: k 2 2
,X ,X ,X 设X 为正态总体 1 2 3 4 的一个简单随机样本,
,则当
练一 练
N(0 ,4)
2 2 X a ( X 2 X ) b ( 3 X 4 X ) 1 2 3 4
a ?
2
,
b
? ,时,统计量 .
X 服从
三大抽样分布课件
三大抽样分布课件
欢迎来到我们的三大抽样分布课件!在这个课件中,我们将介绍离散型随机 变量概率分布、连续型随机变量概率分布以及抽样分布的概念、特点和应用。 让我们一起来探索这个精彩的主题吧!
离散型随机变量概率分布
概念介绍
了解离散型随机变量的概率分布和概率质量函数是建立在此领域的基础
二项分布
掌握二项分布的概念、参数和求解方法对于实际问题的应用至关重要
连续型随机变量概率分布
概念介绍
了解连续型随机变量的概率分布和概率密度函数是 理解其特性和应用的基础
正态分布
深入探讨正态分布的特性、标准正态明白总体与样本的区别以及抽样分布的
t分布
2
概念对于实际数据分析至关重要
了解t分布的特点和应用举例,可以更好
地理解样本均值的抽样分布
3
F分布
学习F分布的特点和应用举例,加深对 抽样分布的认识
总结与回顾
三大抽样分布的概念
回顾离散型、连续型随机变量概率分布和抽样分布的基本概念
不同分布的特点和应用
总结各个分布的特点,以及它们在实际问题中的应用场景
欢迎来到我们的三大抽样分布课件!在这个课件中,我们将介绍离散型随机 变量概率分布、连续型随机变量概率分布以及抽样分布的概念、特点和应用。 让我们一起来探索这个精彩的主题吧!
离散型随机变量概率分布
概念介绍
了解离散型随机变量的概率分布和概率质量函数是建立在此领域的基础
二项分布
掌握二项分布的概念、参数和求解方法对于实际问题的应用至关重要
连续型随机变量概率分布
概念介绍
了解连续型随机变量的概率分布和概率密度函数是 理解其特性和应用的基础
正态分布
深入探讨正态分布的特性、标准正态明白总体与样本的区别以及抽样分布的
t分布
2
概念对于实际数据分析至关重要
了解t分布的特点和应用举例,可以更好
地理解样本均值的抽样分布
3
F分布
学习F分布的特点和应用举例,加深对 抽样分布的认识
总结与回顾
三大抽样分布的概念
回顾离散型、连续型随机变量概率分布和抽样分布的基本概念
不同分布的特点和应用
总结各个分布的特点,以及它们在实际问题中的应用场景
抽样和抽样分布培训课件(PPT 49张)
0.07 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989
7
自有限总体的抽样
• 无放回抽样:一个元素一旦选入样本,就从总体中剔除, 不能再次被选入。 • 放回抽样:一个元素一旦选入样本,仍被放回总体中。
先前被选入的元素可能再次被选,并且在样本中可出现
多次(多于一次)。
8
自无限总体的抽样
• 无限总体经常被定义为一个持续进行的过程,总体的元 素由在相同条件下过程无限运行下去产生的每一项构成。 在这种情况下,对总体内所有项排列是不可能的。
14
点估计
样本均值 51814.00美元 样本标准差
3347.72美元
样本比率 0.63
点估计的 统计过程
15
由30名管理人员组成的简单随机样本的点估计值
16
由30名管理人员组成的500个简单随机样本的点估计值
17
由30名管理人员组成的500个简单随机样本的抽样分布
• 抽样分布:样本统计量所有可能值构成的概率分布。
0.04 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988
抽样与抽样分布PPT-PPT精品文档
特点:
(1)遵循随机原则; (2)推断被调查对象的总体特征; (3)计算推断的准确性与可靠性。 江西财经大学统计学院
1
统计学
所谓抽样
第三章
抽样和抽样分布
抽签 编号 摇号 随机数字表
75 18 26 53 86
90 85 89 64 97
96 18 48 81 06
91 63 57 95 12
江西财经大学统计学院
7
统计学
第三章
抽样和抽样分布
[例]10人年龄资料如下。N=10 n=3。 人: A B C D E F G H I J 年龄: 5 8 12 40 42 46 48 70 72 76 分类: N1=3 N2=4 N3=3 N=10 1=2.87 2=3.16 3=2.49 =8.52 n1=? n2=? n3=? n=3 1、等额分配:n1= n2= n3= 1 2、等比例分配:n1/N1= n2/N2= … = n/N ∵ n/N =0.3 ∴n1/N1=0.3 n1=0.3×N1=0.3 ×3= 0.9 3、最优分配: i/ =ni/Ni ∵ 1/ =2.87/8.52=0.34 ∴ n1/N1=0.34 n1=0.34×3 =1.02 江西财经大学统计学院 8 二、抽样误差的计算
Z x
2
t 概率度 抽样平均误差 x n
s替代 不知 ˆ替代 p P不知
江西财经大学统计学院
3
x x x tx x x x tx
统计学
第三章
抽样和抽样分布
[例]某公司出口一种名茶,规定每包规格重量不低于150g,现用
x x P { x } 1 F ( t ) x x x x P { x x } 1 F ( t ) x x x x
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§5.4 三大抽样分布
▪ 本次课教学目的: 掌握三大抽样分布的构造性定义并熟悉一些重要结论
▪ 重点难点: 三大抽样分布的构造及其抽样分布 一些重要结论
▪ 教学基本内容及其时间分配 三大抽样分布的构造性定义——————30分钟 定理及其三个推论以及证明——————70分钟
根据本节课的特点所采取的教学方法和手段: 启发式讲授,图文结合加深对三大分布的印象
n
22
n 2
n 1 y
y2 e 2,
数字特征:
y0
E 2 n, Var( 2 ) 2n
图像: 密度函数的图像是一个只取非负值的偏态分布
n4 n6
n 10
n4 n6
n 10
n 20
当随机变量 2~ 2 (n) 时,对给定的 (0 1) ,称满足
P(
2
2 1
(n))
1
的
2 1
y
m 2
11
m
n
mn
y 2
2 2
这就是自由度为m与n的F分布的密度函数。
n 40 n 10
n4 n 1
若F ~ F (m, n), 对给定的 (0 1), 称满足
PF F1 m, n 1
的F1 (m, n)是自由度为m与n的F分布的1 分位数.
F (4,10)
引言
▪ 有许多统计推断是基于正态分布的假设的,以标准正态 变量为基石而构造的三个著名统计量在实际中有广泛的 应用,这是因为这三个统计量不仅有明确背景,而且其 抽样分布的密度函数有明显表达式,他们被称为统计中 的“三大抽样分布”.
▪ 若设 x1, x2 xn , y1, y2,, ym 是来自标准正态分布的两个
0 1
P
1 F
F
n,
m
P F
F
1
n,
m
,
P F
F
1
n,
m
1
PF F1 m, n 1
F n, m
1
F1 m, n
例5.4.1 若取m=10,n=5, =0.05,那么从附表5上查得
F10,05 10,5 F0.9510,5 4.74
由F n, m
F1
1
m, n
F0.05 10,5
相互独立的样本,则此三个统计量的构造及其抽样分布 如表5.4.1所示.
5.4.1 2分布(卡方分布)
问题:如何确定 2 的分布?
Xi
~
N (0,1)
Xi2
~
Ga
1 2
,
1 2
伽玛分布的可加性
2
n i 1
Xi2
~ Ga n , 1 2 2
2n
于是 2 n分布的密度函数为
p( y)
1
(n)是自由度为n的卡方分布的
1-
分位数.
12-0.0(5 10)= 02.9(5 10)=18.31
2 (10)
5.4.2 F分布
定义5.4.2 设 X1 ~ 2 m, X 2 ~ 2 n, X1 与X 2 独立,则称
F= X1 m 的分布是自由度为m与n的F分布,记为
X2 n
F ~ F m,n
1
从而t与-t有相同分布。
P(0 t y) P(0 t y) P( y t 0)
P(0 t y) 1 P(t2 y2) 2
由于t 2
X
2 1
X
2 2
/
n
~
F (1, n)
所以在上式两边同时关于y求导得t分布的密度函数为:
pt ( y)
ypF ( y2 )
(1
n
)(
1
)
1 2
pX c X~N(0,1)
c=2 0.0455
c=2.5 0.0124
c=3
c=3.5
0.0027 0.000465
X~t(4) 0.1161 0.0668 0.0399 0.0249
当随机变量 t ~ t(n) 时称满足 P(t t1 (n)) 1 的 t1 (n) 是自由度为n的t分布的1-a分位数。
1
F0.95 5,10
1 3.33
0.3
5.4.3 t 分布
▪ 定义5.4.3 设随机变量X1与X2 独立且 X1 ~ N 0,1,X 2 ~ 2 n
则称 t X1 的分布为自由度为n的t分布,记为 t ~ tn
X2 /n
问题:如何确定 t 的分布?
由标准正态密度函数的对称性知,X1与
X
有相同分布,
2
n
x2
e n 1
2
x2 2
,
2
x1 0 x2 0
Z的密度函数为
pZ (z)
x2 p1 zx2 p2
0
做变换令u
x2 dx2
x2 1 z
2
m 1
z2
m 2
n 2
2
mn 2
x e dx
mn 1 22
x2 1z
2
2
0
m n
于是
pz
z
m 1
z2
1
PF F1 m, n 1
给定 0.05, m 4, n 10,查表知
PF (4,10) 3.48 0.95
于是F0.95(4,10) 3.48即是自由度为(4,10)的 F分布的0.95分位数
问题:当比较大(1 比较小)的时候,如何确定分位数?
有F分布的构造知,若F~F(m,n),则有1/F~ F(n,m),故对给定
N (0,1)
t(4)
t(1)
●自由度为1的t分布就是标准柯西分布,它的均值不存在; ●n>1时,t分布的数学期望存在且为0。 ●n<1时,t分布的方差存在,且为n/(n-2); ●当自由度较大比如n 30 时,t分布可以用N(0,1)分布近似 (见下页图)
N (0,1)
t(40)
N(0,1)和t(4)的尾部概率比较
2n
(1)( n )
(
y
2
)
1 2
1
(1
1 n
y
2
1n
)2
y
22
( n 1)
n
2 (
n
)
(1
y2
n1
)2
,
n
2
y .
这就是自由度为n的t分布的密度函数。
t分布的密度函数的图象是一个关于纵轴对称的分布 与标准正态分布的密度函数形状类似,只是峰比标准正态
分布低一些,尾部的概率比标准正态分布的大一些。
其中m称为分子自由度,n称为分母自由度.
问题:如何确定 F 的分布?
首先,我们导出 Z X1 的密度函数
X2
第二步,我们导出 F
n
Z
的密度函数
m
首先,我们导出 Z X1 的密度函数
X2 m
12
X1
~
2(m)
p1( x1)
2
m
m
x1 2
1e
x1 2
,
2
n
1 2
X2
~
2(n)
p2 ( x2 )
z
mn 2m n u来自mn 21e
u
du
0
2
2 2
m
2
n
m1
z2
1
z
mn 2
m n
2 2
z0
第二步,我们导出 F n Z 的密度函数 m
pF y
pZ
m n
y •
m n
m
2
n
m
n
m n
m 1
y 2 1
m n
mn
y 2
•
m n
2 2
)
m
m n m 2 2 n m n
▪ 本次课教学目的: 掌握三大抽样分布的构造性定义并熟悉一些重要结论
▪ 重点难点: 三大抽样分布的构造及其抽样分布 一些重要结论
▪ 教学基本内容及其时间分配 三大抽样分布的构造性定义——————30分钟 定理及其三个推论以及证明——————70分钟
根据本节课的特点所采取的教学方法和手段: 启发式讲授,图文结合加深对三大分布的印象
n
22
n 2
n 1 y
y2 e 2,
数字特征:
y0
E 2 n, Var( 2 ) 2n
图像: 密度函数的图像是一个只取非负值的偏态分布
n4 n6
n 10
n4 n6
n 10
n 20
当随机变量 2~ 2 (n) 时,对给定的 (0 1) ,称满足
P(
2
2 1
(n))
1
的
2 1
y
m 2
11
m
n
mn
y 2
2 2
这就是自由度为m与n的F分布的密度函数。
n 40 n 10
n4 n 1
若F ~ F (m, n), 对给定的 (0 1), 称满足
PF F1 m, n 1
的F1 (m, n)是自由度为m与n的F分布的1 分位数.
F (4,10)
引言
▪ 有许多统计推断是基于正态分布的假设的,以标准正态 变量为基石而构造的三个著名统计量在实际中有广泛的 应用,这是因为这三个统计量不仅有明确背景,而且其 抽样分布的密度函数有明显表达式,他们被称为统计中 的“三大抽样分布”.
▪ 若设 x1, x2 xn , y1, y2,, ym 是来自标准正态分布的两个
0 1
P
1 F
F
n,
m
P F
F
1
n,
m
,
P F
F
1
n,
m
1
PF F1 m, n 1
F n, m
1
F1 m, n
例5.4.1 若取m=10,n=5, =0.05,那么从附表5上查得
F10,05 10,5 F0.9510,5 4.74
由F n, m
F1
1
m, n
F0.05 10,5
相互独立的样本,则此三个统计量的构造及其抽样分布 如表5.4.1所示.
5.4.1 2分布(卡方分布)
问题:如何确定 2 的分布?
Xi
~
N (0,1)
Xi2
~
Ga
1 2
,
1 2
伽玛分布的可加性
2
n i 1
Xi2
~ Ga n , 1 2 2
2n
于是 2 n分布的密度函数为
p( y)
1
(n)是自由度为n的卡方分布的
1-
分位数.
12-0.0(5 10)= 02.9(5 10)=18.31
2 (10)
5.4.2 F分布
定义5.4.2 设 X1 ~ 2 m, X 2 ~ 2 n, X1 与X 2 独立,则称
F= X1 m 的分布是自由度为m与n的F分布,记为
X2 n
F ~ F m,n
1
从而t与-t有相同分布。
P(0 t y) P(0 t y) P( y t 0)
P(0 t y) 1 P(t2 y2) 2
由于t 2
X
2 1
X
2 2
/
n
~
F (1, n)
所以在上式两边同时关于y求导得t分布的密度函数为:
pt ( y)
ypF ( y2 )
(1
n
)(
1
)
1 2
pX c X~N(0,1)
c=2 0.0455
c=2.5 0.0124
c=3
c=3.5
0.0027 0.000465
X~t(4) 0.1161 0.0668 0.0399 0.0249
当随机变量 t ~ t(n) 时称满足 P(t t1 (n)) 1 的 t1 (n) 是自由度为n的t分布的1-a分位数。
1
F0.95 5,10
1 3.33
0.3
5.4.3 t 分布
▪ 定义5.4.3 设随机变量X1与X2 独立且 X1 ~ N 0,1,X 2 ~ 2 n
则称 t X1 的分布为自由度为n的t分布,记为 t ~ tn
X2 /n
问题:如何确定 t 的分布?
由标准正态密度函数的对称性知,X1与
X
有相同分布,
2
n
x2
e n 1
2
x2 2
,
2
x1 0 x2 0
Z的密度函数为
pZ (z)
x2 p1 zx2 p2
0
做变换令u
x2 dx2
x2 1 z
2
m 1
z2
m 2
n 2
2
mn 2
x e dx
mn 1 22
x2 1z
2
2
0
m n
于是
pz
z
m 1
z2
1
PF F1 m, n 1
给定 0.05, m 4, n 10,查表知
PF (4,10) 3.48 0.95
于是F0.95(4,10) 3.48即是自由度为(4,10)的 F分布的0.95分位数
问题:当比较大(1 比较小)的时候,如何确定分位数?
有F分布的构造知,若F~F(m,n),则有1/F~ F(n,m),故对给定
N (0,1)
t(4)
t(1)
●自由度为1的t分布就是标准柯西分布,它的均值不存在; ●n>1时,t分布的数学期望存在且为0。 ●n<1时,t分布的方差存在,且为n/(n-2); ●当自由度较大比如n 30 时,t分布可以用N(0,1)分布近似 (见下页图)
N (0,1)
t(40)
N(0,1)和t(4)的尾部概率比较
2n
(1)( n )
(
y
2
)
1 2
1
(1
1 n
y
2
1n
)2
y
22
( n 1)
n
2 (
n
)
(1
y2
n1
)2
,
n
2
y .
这就是自由度为n的t分布的密度函数。
t分布的密度函数的图象是一个关于纵轴对称的分布 与标准正态分布的密度函数形状类似,只是峰比标准正态
分布低一些,尾部的概率比标准正态分布的大一些。
其中m称为分子自由度,n称为分母自由度.
问题:如何确定 F 的分布?
首先,我们导出 Z X1 的密度函数
X2
第二步,我们导出 F
n
Z
的密度函数
m
首先,我们导出 Z X1 的密度函数
X2 m
12
X1
~
2(m)
p1( x1)
2
m
m
x1 2
1e
x1 2
,
2
n
1 2
X2
~
2(n)
p2 ( x2 )
z
mn 2m n u来自mn 21e
u
du
0
2
2 2
m
2
n
m1
z2
1
z
mn 2
m n
2 2
z0
第二步,我们导出 F n Z 的密度函数 m
pF y
pZ
m n
y •
m n
m
2
n
m
n
m n
m 1
y 2 1
m n
mn
y 2
•
m n
2 2
)
m
m n m 2 2 n m n