三大抽样分布课件(PPT42页)
合集下载
统计学(8)抽样分布ppt课件
23
三、两个样本方差比的抽样分 布
1. 两个总体都为正态分布,即X1~N(μ1,σ12)的一个样本, Y1,Y2,… ,Yn2是来自正态总体X2~N(μ2,σ22 )
2. 从两个总体中分别抽取容量为n1和n2的独立样本
3. 两个样本方差比的抽样分布,服从分子自由度为(n1-1), 分母自由度为(n2-1) F分布,即
第八章 抽样分布
ppt课件完整
1
• 统计方法
描述统计
推断统计
参数估计
假设检验
ppt课件完整
2
所谓统计推断,就是根据概率论所揭示的随机变 量的一般规律性,利用抽样调查所获得的样本信息, 对总体的某些性质或数量特征进行推断。
参数估计
统计推断 假设检验
这两类问题的基本原理是一致的,只是侧重点不同 而已。 参数估计问题侧重于用样本统计量估计总体的某一 未知参数; 假设检验问题侧重于用样本资料验证总体是否具有 某种性质或数量特征。
21
一、两个样本均值之差的抽样分 布
1. 两个总体都为正态分布,即 X1 ~N(1,12,) X2 ~N(2,22)
2. 两个样本均值之差 X1 X2的抽样分布服从正态分 布,其分布的数学期望为两个总体均值之差
E(X1X2)12
•
方差为各自的方差之和
2
2
2 X1X2
1
2
n n 1
2
ppt课件完整
X
n
ppt课件完整
15
二、样本比例的抽样分 布
比例:
1. 比例:指总体(或样本)中具有某种属性的单位与 全部单位总数之比。
• 例1:不同性别的人与全部人数之比
• 例2:合格品与全部产品总数之比
三大抽样分布课件
在方差分析中,t分布用于检验 各个组之间的均值是否存在显著
差异。
04
CATALOGUE
卡方分布
卡方分布的定义
定义
卡方分布是一种连续概率分布,描述 了随机变量的取值与自由度的平方之 间的比例关系。
公式
若随机变量X符合卡方分布,则X的概 率密度函数为f(x)=x^(n/2-1)e^(x/2)/2^(n/2)Γ(n/2),其中n为自由度 ,Γ为伽玛函数。
正态分布
正态分布的定义
01
正态分布是一种连续概率分布, 其概率密度函数呈钟形,对称轴 为均值所在直线,形状由标准差 决定。
02
正态分布是自然界中最常见的分 布形态,许多随机变量都服从或 近似服从正态分布。
正态分布的性质
01
02
03
集中性
正态分布曲线以均值为中 心,两侧分布对称。
均匀性
正态分布曲线是关于标准 差对称的,形状由标准差 决定。
t分布
t分布的定义
定义
t分布(也称为学生t分布)是一种 连续概率分布,其形状由自由度 参数决定。
描述
当数据来自正态分布的总体,且样 本量较小(通常n<30)时,t分布 近似于正态分布。
公式
t分布的密度函数和分布函数可以用 一系列复杂的数学公式来描述。
t分布的性质
形状
峰度
随着自由度的增加,t分布的形状逐渐 接近正态分布。
t分布的峰度大于正态分布的峰度,且 随着自由度的增加而减小。
偏度
t分布通常是偏态的,其偏度随着自由 度的增加而减小。
t分布在统计学中的应用
假设检验
在样本量较小时,t分布在假设 检验中常用作正态分布的替代,
用于检验统计假设。
差异。
04
CATALOGUE
卡方分布
卡方分布的定义
定义
卡方分布是一种连续概率分布,描述 了随机变量的取值与自由度的平方之 间的比例关系。
公式
若随机变量X符合卡方分布,则X的概 率密度函数为f(x)=x^(n/2-1)e^(x/2)/2^(n/2)Γ(n/2),其中n为自由度 ,Γ为伽玛函数。
正态分布
正态分布的定义
01
正态分布是一种连续概率分布, 其概率密度函数呈钟形,对称轴 为均值所在直线,形状由标准差 决定。
02
正态分布是自然界中最常见的分 布形态,许多随机变量都服从或 近似服从正态分布。
正态分布的性质
01
02
03
集中性
正态分布曲线以均值为中 心,两侧分布对称。
均匀性
正态分布曲线是关于标准 差对称的,形状由标准差 决定。
t分布
t分布的定义
定义
t分布(也称为学生t分布)是一种 连续概率分布,其形状由自由度 参数决定。
描述
当数据来自正态分布的总体,且样 本量较小(通常n<30)时,t分布 近似于正态分布。
公式
t分布的密度函数和分布函数可以用 一系列复杂的数学公式来描述。
t分布的性质
形状
峰度
随着自由度的增加,t分布的形状逐渐 接近正态分布。
t分布的峰度大于正态分布的峰度,且 随着自由度的增加而减小。
偏度
t分布通常是偏态的,其偏度随着自由 度的增加而减小。
t分布在统计学中的应用
假设检验
在样本量较小时,t分布在假设 检验中常用作正态分布的替代,
用于检验统计假设。
《抽样和抽样分布》课件
《抽样和抽样分布》ppt课件
$number {01}
目录
• 抽样调查的基本概念 • 抽样分布的基础知识 • 抽样分布的原理 • 抽样误差的评估 • 实际应用中的抽样技术 • 案例分析
01
抽样调查的基本概念
抽样的定义和意义
定义
抽样是从总体中选取一部分个体 进行研究的方法。
意义
通过对部分个体的研究,推断出 总体的特征,以节省时间和资源 。
适用场景
当总体中存在周期性变化 或某种明显的模式时,系 统抽样能够提高样本的代 表性。
注意事项
要确保抽样的间隔与总体 中的变化模式相匹配,以 避免偏差。
分层抽样
分层抽样
注意事项
将总体分成若干层,然后从每层中随 机抽取一定数量的样本。
要确保分层依据合理,且层内样本的 抽取方法一致,以避免层间和层内的 偏差。
抽样误差的衡量指标
抽样平均误差
抽样平均误差是衡量抽样误差大小的指标,它反映了样本统 计量与总体参数之间的平均偏差。
抽样变异系数
抽样变异系数是衡量非系统抽样误差的指标,它反映了由于 随机性引起的样本统计量与总体参数之间的偏差程度。
05
实际应用中的抽样技术系统ຫໍສະໝຸດ 样010203
系统抽样
按照某种规则,每隔一定 数量的个体进行抽样,直 到达到所需的样本量。
步骤 1. 明确研究目的和要求。 2. 确定总体和样本规模。
抽样的原则和步骤
01 02 03
3. 选择合适的抽样方法。 4. 制定详细的抽样计划。
5. 实施抽样调查。
02
抽样分布的基础知识
总体和样本
1 2
3
总体
研究对象的全体集合。
样本
$number {01}
目录
• 抽样调查的基本概念 • 抽样分布的基础知识 • 抽样分布的原理 • 抽样误差的评估 • 实际应用中的抽样技术 • 案例分析
01
抽样调查的基本概念
抽样的定义和意义
定义
抽样是从总体中选取一部分个体 进行研究的方法。
意义
通过对部分个体的研究,推断出 总体的特征,以节省时间和资源 。
适用场景
当总体中存在周期性变化 或某种明显的模式时,系 统抽样能够提高样本的代 表性。
注意事项
要确保抽样的间隔与总体 中的变化模式相匹配,以 避免偏差。
分层抽样
分层抽样
注意事项
将总体分成若干层,然后从每层中随 机抽取一定数量的样本。
要确保分层依据合理,且层内样本的 抽取方法一致,以避免层间和层内的 偏差。
抽样误差的衡量指标
抽样平均误差
抽样平均误差是衡量抽样误差大小的指标,它反映了样本统 计量与总体参数之间的平均偏差。
抽样变异系数
抽样变异系数是衡量非系统抽样误差的指标,它反映了由于 随机性引起的样本统计量与总体参数之间的偏差程度。
05
实际应用中的抽样技术系统ຫໍສະໝຸດ 样010203
系统抽样
按照某种规则,每隔一定 数量的个体进行抽样,直 到达到所需的样本量。
步骤 1. 明确研究目的和要求。 2. 确定总体和样本规模。
抽样的原则和步骤
01 02 03
3. 选择合适的抽样方法。 4. 制定详细的抽样计划。
5. 实施抽样调查。
02
抽样分布的基础知识
总体和样本
1 2
3
总体
研究对象的全体集合。
样本
统计学之抽样与抽样分布课件
连续型随机变量的数值特征:
期望 —
E X x f x dx
方差 — σ 2 X x E X 2 f x dx
标准差 — σX x E X 2 f x dx
2020/8/8
第四章 抽样和抽样分布
13
第四章 抽样与抽样分布
第三节 抽样分布
3.1 抽样及抽样分布的含义 3.2 重置抽样下的抽样分布 3.3 不重置抽样下的抽样分布
1
F x P3X/4 x
1
4
当
2/4
3 4 当
1/4
4 4 当
0 x1 1 x2 2 x
2020/8/8
1
2
X
第四章 抽样和抽样分布
8
2.2 连续型随机变量概率分布
连续X❖型的密 随概率机度分变函布量数函的数的概性 率分质布:
1.
f
F
xx
0;x
f x dx
2. f x dx 1 ;
X 的概率密度函数
由于连续型随机变量在某点处的概率等于零。 对于连续性随机变量:
P x1 X x2 F x2 F x1
2020/8/8
第四章 抽样和抽样分布
5
2.2 离散型随机变量概率分布
设:正面向上的次数为 X,
则 X = 0、1、2
P X 0 1 1 1
22 4
PX
1
1 2
1 2
1 2
1 2
方差:σ 2 X X i E X 2 Pi i 1
N
标准差: σ X X i E X 2 Pi i 1
2020/8/8
第四章 抽样和抽样分布
11
2.3 随机变量的数字特征
概 数学期望 率 论
期望 —
E X x f x dx
方差 — σ 2 X x E X 2 f x dx
标准差 — σX x E X 2 f x dx
2020/8/8
第四章 抽样和抽样分布
13
第四章 抽样与抽样分布
第三节 抽样分布
3.1 抽样及抽样分布的含义 3.2 重置抽样下的抽样分布 3.3 不重置抽样下的抽样分布
1
F x P3X/4 x
1
4
当
2/4
3 4 当
1/4
4 4 当
0 x1 1 x2 2 x
2020/8/8
1
2
X
第四章 抽样和抽样分布
8
2.2 连续型随机变量概率分布
连续X❖型的密 随概率机度分变函布量数函的数的概性 率分质布:
1.
f
F
xx
0;x
f x dx
2. f x dx 1 ;
X 的概率密度函数
由于连续型随机变量在某点处的概率等于零。 对于连续性随机变量:
P x1 X x2 F x2 F x1
2020/8/8
第四章 抽样和抽样分布
5
2.2 离散型随机变量概率分布
设:正面向上的次数为 X,
则 X = 0、1、2
P X 0 1 1 1
22 4
PX
1
1 2
1 2
1 2
1 2
方差:σ 2 X X i E X 2 Pi i 1
N
标准差: σ X X i E X 2 Pi i 1
2020/8/8
第四章 抽样和抽样分布
11
2.3 随机变量的数字特征
概 数学期望 率 论
抽样与抽样分布 ppt课件
可以按自然区域或行政区域进行分层,使抽样的组织 和实施都比较方便
分层抽样的样本分布在各个层内,从而使样本在总体 中的分布比较均匀
如果分层抽样做得好,便可以提高估计的精度
系统抽样
(systematic sampling)
1. 将总体中的所有单位(抽样单位)按一定顺 序排列,在规定的范围内随机地抽取一个 单位作为初始单位,然后按事先规定好的 规则确定其他样本单位
样本容量。样本中所包含的个体的数量,一般用n表示。 在实际工作中,人们通常把n≥30的样本称为大样本, 而把n<30的样本称为小样本。
对于某一既定的总体,由于抽样的方式方法不同,样本 容量也可大可小,因而,样本是不确定的、可变的。
抽样的目的一部分,而且样本的抽取又具有随机性, 因此,样本的内部构成与总体的内部构成总是具有一定 的差异,样本不能完全代表总体,抽样估计总是存在一 定的代表性误差。
1. 将总体中若干个单位合并为组(群),抽样 时直接抽取群,然后对中选群中的所有单 位全部实施调查
2. 特点
抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用,方便
调查的实施 缺点是估计的精度较差
多阶段抽样
(multi-stage sampling)
1. 先抽取群,但并不是调查群内的所有单位,而是再 进行一步抽样,从选中的群中抽取出若干个单位进 行调查
1. 由简单随机抽样形成的样本 2. 从总体N个单位中随机地抽取n个单位作为
样本,使得每一个容量为n样本都有相同 的机会(概率)被抽中 3. 参数估计和假设检验所依据的主要是简单 随机样本
简单随机抽样
(用Excel对分类数据随机抽样)
【例】某 班级共有 30 名 学 生 , 他们的名 单如右表。 用 Excel 抽 出一个由5 个学生构 成的随机 样本
分层抽样的样本分布在各个层内,从而使样本在总体 中的分布比较均匀
如果分层抽样做得好,便可以提高估计的精度
系统抽样
(systematic sampling)
1. 将总体中的所有单位(抽样单位)按一定顺 序排列,在规定的范围内随机地抽取一个 单位作为初始单位,然后按事先规定好的 规则确定其他样本单位
样本容量。样本中所包含的个体的数量,一般用n表示。 在实际工作中,人们通常把n≥30的样本称为大样本, 而把n<30的样本称为小样本。
对于某一既定的总体,由于抽样的方式方法不同,样本 容量也可大可小,因而,样本是不确定的、可变的。
抽样的目的一部分,而且样本的抽取又具有随机性, 因此,样本的内部构成与总体的内部构成总是具有一定 的差异,样本不能完全代表总体,抽样估计总是存在一 定的代表性误差。
1. 将总体中若干个单位合并为组(群),抽样 时直接抽取群,然后对中选群中的所有单 位全部实施调查
2. 特点
抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用,方便
调查的实施 缺点是估计的精度较差
多阶段抽样
(multi-stage sampling)
1. 先抽取群,但并不是调查群内的所有单位,而是再 进行一步抽样,从选中的群中抽取出若干个单位进 行调查
1. 由简单随机抽样形成的样本 2. 从总体N个单位中随机地抽取n个单位作为
样本,使得每一个容量为n样本都有相同 的机会(概率)被抽中 3. 参数估计和假设检验所依据的主要是简单 随机样本
简单随机抽样
(用Excel对分类数据随机抽样)
【例】某 班级共有 30 名 学 生 , 他们的名 单如右表。 用 Excel 抽 出一个由5 个学生构 成的随机 样本
三概率分布与抽样分布【共44张PPT】
下表是工商07级1班、2班某门课的考试成绩。
比如,有些产品出厂时不仅需要标注其性能参数均值,而且要标明均值的方差(标准差)。
二项分布、几何分布都是贝努利试验导出的分布。
其中N为产品总数,n为试验次数也即抽取出的产品数;
实际中,要求n≥30。
二项分布、几何分布都是贝努利试验导出的分布。
二项分布与几何分布都是在n重或可列重相互独立的贝努利试验中形成的。
概率是曲线下的面积
P( aXb) bf( x) dx a f(x)
ab
x
从概率的角度重新看这几个指标:
随机变量的均值 E(X)
n
xip(xi )
xif (x)dx
i1
(和的均值 均值之和)
随机变量的方差 var(X)
n
(xi E(X))2 p(xi )
(xi
E(X))2 f
中心极限定理(Central Limit Theorem):
对于样本比例(成数)来说,中心极限定理也同样成立:
设从成数为P0的总体中抽取大小为n的样本,当n充分大
时,样本成数总是近似服从
N(P0,的P0正(1态n分P布0)。)即:
E(p)
P0,D(p)
n1P0(1P0)
p~N(P0,
n1P0(1P0))
P(AB)=P(B)P(A¦B) 将上式中A、B的位置对调,可得:
P(AB)=P(A)P(B¦A) 以上两式统称概率乘法公式。
全概率公式与逆概率公式:
1 1、完备事件组 、完备事件组
其中N为产品总数,n为试验次数也即抽取出的产品数;
若事件A 、A 、…A 互不相容(互斥),且其中之一必然 随机变量:离散型、连续型。
简单随机抽样(三种抽样方法).ppt
笑一笑,十年少
一天,爸爸叫儿子去买一盒火柴,临出 门前,爸爸嘱咐儿子要买能划燃的火柴,儿 子拿着钱出门了,过了好一会儿,儿子才回 到家。
“火柴能划燃吗?”爸爸问。 “都能划燃。” “你这么肯定?” 儿子递过一盒划过的火柴,兴奋地说: “我每根都试过啦。”
问:这则笑话中,儿子采用的是什么调查方式? 这其中的全体是什么?这种调查方式好不好?
一个著名的案例1936年美国总统选举前,一份颇有名气的杂志 的工作人员做了一次民意测验,调查兰顿(时任堪萨斯州州长) 和罗斯福(时任总统)中谁将当选下一任总统。为了解公众意向, 调查者通过电话和车辆登记薄上的名单给一大批人发了调查表 (注意1936年电话和汽车只有少数富人拥有)。通过分析收回的 调查表,显示兰顿非常受欢迎,于是杂志预测兰顿将获胜。
实际选举结果正好相反,罗斯福在选举中获胜!
你认为预测结果出错的原因是什么?
那么,怎样从总体中抽取样本呢?如何表示样本数 据?如何从样本数据中提取基本信息(样本分布、样本 数字特征等),来推断总体的情况呢?这些正是本章要 解决的问题。
抽样方法 2.1.1简单随机抽样
要了解全国高中生的视力情况,在全国抽取了 15所中学的全部高中生15000人进行视力测试。
谈谈你的看法:
统计的基本思想:
用样本估计总体,即通常不直接去研究总 体,而是通过从总体中抽取一个样本,根据 样本的情况去估计总体的相应情况。
妈妈:“儿子,帮妈妈买盒火柴去。” 妈妈:“这次注意点,上次你买的火柴好多划不着。” ……… 儿子高兴地跑回来。 孩子:“妈妈,这次的火柴全划得着,我每根都试过了。”
N
简单随机抽样法之一——抽签法
步骤: 1、把总体中的N个个体编号;
2、 把号码写在号签上,将号签放在一个容器中 搅拌均匀;
抽样和抽样分布培训课件(PPT 49张)
0.07 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989
7
自有限总体的抽样
• 无放回抽样:一个元素一旦选入样本,就从总体中剔除, 不能再次被选入。 • 放回抽样:一个元素一旦选入样本,仍被放回总体中。
先前被选入的元素可能再次被选,并且在样本中可出现
多次(多于一次)。
8
自无限总体的抽样
• 无限总体经常被定义为一个持续进行的过程,总体的元 素由在相同条件下过程无限运行下去产生的每一项构成。 在这种情况下,对总体内所有项排列是不可能的。
14
点估计
样本均值 51814.00美元 样本标准差
3347.72美元
样本比率 0.63
点估计的 统计过程
15
由30名管理人员组成的简单随机样本的点估计值
16
由30名管理人员组成的500个简单随机样本的点估计值
17
由30名管理人员组成的500个简单随机样本的抽样分布
• 抽样分布:样本统计量所有可能值构成的概率分布。
0.04 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988
抽样与抽样分布PPT-PPT精品文档
特点:
(1)遵循随机原则; (2)推断被调查对象的总体特征; (3)计算推断的准确性与可靠性。 江西财经大学统计学院
1
统计学
所谓抽样
第三章
抽样和抽样分布
抽签 编号 摇号 随机数字表
75 18 26 53 86
90 85 89 64 97
96 18 48 81 06
91 63 57 95 12
江西财经大学统计学院
7
统计学
第三章
抽样和抽样分布
[例]10人年龄资料如下。N=10 n=3。 人: A B C D E F G H I J 年龄: 5 8 12 40 42 46 48 70 72 76 分类: N1=3 N2=4 N3=3 N=10 1=2.87 2=3.16 3=2.49 =8.52 n1=? n2=? n3=? n=3 1、等额分配:n1= n2= n3= 1 2、等比例分配:n1/N1= n2/N2= … = n/N ∵ n/N =0.3 ∴n1/N1=0.3 n1=0.3×N1=0.3 ×3= 0.9 3、最优分配: i/ =ni/Ni ∵ 1/ =2.87/8.52=0.34 ∴ n1/N1=0.34 n1=0.34×3 =1.02 江西财经大学统计学院 8 二、抽样误差的计算
Z x
2
t 概率度 抽样平均误差 x n
s替代 不知 ˆ替代 p P不知
江西财经大学统计学院
3
x x x tx x x x tx
统计学
第三章
抽样和抽样分布
[例]某公司出口一种名茶,规定每包规格重量不低于150g,现用
x x P { x } 1 F ( t ) x x x x P { x x } 1 F ( t ) x x x x
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
引言
▪ 有许多统计推断是基于正态分布的假设的,以标准正态 变量为基石而构造的三个著名统计量在实际中有广泛的 应用,这是因为这三个统计量不仅有明确背景,而且其 抽样分布的密度函数有明显表达式,他们被称为统计中 的“三大抽样分布”.
▪ 若设 x1, x2 xn , y1, y2, , ym 是来自标准正态分布的两个 相互独立的样本,则此三个统计量的构造及其抽样分布 如表5.4.1所示.
X2
第二步,我们导出 F
n
Z
的密度函数
m
首先,我们导出 Z X1 的密度函数
X2
m
12
X1
~
2(m)
p1( x1)
2
m
m
x1 2
1e
x1 2
,
2
n
1 2
X2
~
2(n)
p2 ( x2 )
2
n
x2
e n 1
2
x2 2
,
2
x1 0 x2 0
Z的密度函数为
pZ (z)
n 40 n 10
n4 n 1
若F ~ F(m, n),对给定的 (0 1),称满足
PF F1 m, n 1
的F1 (m, n)是自由度为m与n的F分布的1 分位数.
F (4,10)
PF F1 m,n 1
给定 0.05, m 4, n 10,查表知
PF (4,10) 3.48 0.95
s
2 y
/
2 1
/
2 2
~
F(m 1, n 1)
特别,若
2 1
2 2
,则
F
s
2 x
/
s
2 y
~
F(m 1, n
1)
证明: 由两样本独立可知,
s
2 x
与
s
2 y
相互独立且
(m
1)s
2 x
~
2 (m 1)
2 1
(n
1)
s
2 y
~
2 (n 1)
2 2
由F分布定义可知F~F(m-1,n-1)
推论5.4.3
分位数 t1 (n) 可以从附表4中查到。譬如n=10,a=0.05, 那么从附表4 上查到
t10.05 (10) t0.95 (10) 1.812
由于t分布的密度函数关于0对称,故其分位数间有如下关系
譬如
t (n) t1 (n)
t0.05 (10) t0.95 (10) 1.812
。
5.4.4 一些重要结论
x ~ N (0,1) / n
(5.4.5)
将5.4.4 左端改写为 n(x ) s
x / n (n 1) s2 / 2
n 1
(5.4.6)
由于分子是标准正态变量,分母的根号里是自由度为n-1 的t变量除以它的自由度,且分子与分母相互独立,由t分布定 义可知,t~t(n-1),推论证完。
F n, m
1
F1 m, n
例5.4.1 若取m=10,n=5, =0.05,那么从附表5上查得
F10,05 10,5 F0.9510,5 4.74
由F n, m
1
F1 m, n
F0.0510,5
1
F0.95 5,10
1 3.33
0.3
5.4.3 t 分布
▪ 定义5.4.3 设随机变量X1与X2 独立且 X1 ~ N0,1,X 2 ~ 2 n
2(10)
5.4.2 F分布
定义5.4.2 设 X1 ~ 2 m, X 2 ~ 2 n, X1 与X 2 独立,则称
F= X1 m 的分布是自由度为m与n的F分布,记为 X2 n
F ~ Fm,n
其中m称为分子自由度,n称为分母自由度.
问题:如何确定 F 的分布?
首先,我们导出 Z X1 的密度函数
N (0,1)
t(40)
N(0,1)和t(4)的尾部概率比较
pX c X~N(0,1)
c=2 0.0455
c=2.5 0.ห้องสมุดไป่ตู้124
c=3
c=3.5
0.0027 0.000465
X~t(4) 0.1161 0.0668 0.0399 0.0249
当随机变量 t ~ t(n) 时称满足 P(t t1 (n)) 1 的 t1 (n) 是自由度为n的t分布的1-a分位数。
X12
X
2 2
/
n
~
F (1, n)
所以在上式两边同时关于y求导得t分布的密度函数为:
pt ( y)
ypF ( y2 )
(1
n
)(
1
)
1 2
2n
(1)( n )
(
y
2
)
1 2
1
(1
1 n
y
2
1n
)2
y
22
( n 1) 2
(1
y2
n1
) 2,
n ( n ) n
2
y .
这就是自由度为n的t分布的密度函数。
图像: 密度函数的图像是一个只取非负值的偏态分布
n4 n6
n 10
n4 n6
n 10
n 20
当随机变量 2~ 2 (n) 时,对给定的 (0 1) ,称满足
P(
2
2 1
(n))
1
的
2 1
(n)是自由度为n的卡方分布的
1-
分位数.
12-0.0(5 10)= 02.9(5 10)=18.31
n x)2 yi2 y12 yi2
i 1
i 1
这证明了结论(1)
由于
yi ~ N 0, 2
yi
~ N (0,1)
(n
1) s2
2
n ( yi
i2
)2
~
2(n
1)
这证明了结论(3)
推论5.4.1 在定理5.4.1的记号下,有 t
n(x ) ~ t(n 1)
s
证明 由定理5.4.1(2)可以推出
x
y
N
(1
2 , (
1 m
1 n
)
2
)
(x - y) - (1 2 ) ~ N (0,1). 1 1
mn
由定理5.4.1知,
(m 1)sx2
2
~
2 (m 1)
(n
1)
s
2 y
2
~
2 (n 1)
独立,
2分布可加性
(m
n
2
2)sw2
(m
1)sx2
(n
1)
s
2 y
2
~
2(m n 2)
又x y与sw2 相互独立,根据t分布的定义即可得到(5.4.8).
推论5.4.2 设 x1, , xm 是来自N(1,12 )的样本,y1, , yn 是来自
N
(
2,
2 2
)
的样本且此两样本相互独立,记
s
2 x
1 m 1
m i 1
(xi
x
)
2
,
s
2 y
1 n 1
n
( yi
i 1
y)2 ,
其中 x
1 m
m i 1
xi ,
y
1 n
n i 1
yi
则有
F
s
2 x
z0
第二步,我们导出 F n Z 的密度函数 m
pF
y
pZ
m n
y •
m n
m
2
n
m n
m n
m 1
y 2 1
m n
mn
y 2
•
m n
2 2
)
m
m n m 2 2 n
m n
y
m 2
1
1
m
mn
y 2
n
2 2
这就是自由度为m与n的F分布的密度函数。
于是F0.95(4,10) 3.48即是自由度为(4,10)的 F分布的0.95分位数
问题:当比较大(1 比较小)的时候,如何确定分位数?
有F分布的构造知,若F~F(m,n),则有1/F~ F(n,m),故对给定
0 1
P
1 F
F
n,
m
P F
F
1
n,
m
,
P F
F
1
n,
m
1
PF F1 m,n 1
其均值和方差分别为
n
EY
A
EX
0
0
Var(Y ) AVar(X) AT A 2I AT 2 AAT 2I 由此,Y ( y1, , yn )T 的各个分量相互独立,且都服从正态
分布,其方差均为 2 ,而均值不完全相同,
E( y1) n
E( y2 ) 0 E( yn ) 0
在推论5.4.2的记号下,设
2 1
2 2
2
,并记
m
n
s
2 w
(m
1)s
2 x
(n
1)
s
2 y
mn2
(xi
i 1
x)2 (yi
i 1
mn2
y)2
则
(x y) (1 2 ) ~ t(m n 2)
sw
1 1 mn
(5.4.8)
证明 由 x ~ N 1, 2 / m , y ~ N (2, 2 / n) x 与 y 独立
E ( X )
Var( X ) 2I