常用的三种抽样分布.pptx
合集下载
统计学(8)抽样分布ppt课件
23
三、两个样本方差比的抽样分 布
1. 两个总体都为正态分布,即X1~N(μ1,σ12)的一个样本, Y1,Y2,… ,Yn2是来自正态总体X2~N(μ2,σ22 )
2. 从两个总体中分别抽取容量为n1和n2的独立样本
3. 两个样本方差比的抽样分布,服从分子自由度为(n1-1), 分母自由度为(n2-1) F分布,即
第八章 抽样分布
ppt课件完整
1
• 统计方法
描述统计
推断统计
参数估计
假设检验
ppt课件完整
2
所谓统计推断,就是根据概率论所揭示的随机变 量的一般规律性,利用抽样调查所获得的样本信息, 对总体的某些性质或数量特征进行推断。
参数估计
统计推断 假设检验
这两类问题的基本原理是一致的,只是侧重点不同 而已。 参数估计问题侧重于用样本统计量估计总体的某一 未知参数; 假设检验问题侧重于用样本资料验证总体是否具有 某种性质或数量特征。
21
一、两个样本均值之差的抽样分 布
1. 两个总体都为正态分布,即 X1 ~N(1,12,) X2 ~N(2,22)
2. 两个样本均值之差 X1 X2的抽样分布服从正态分 布,其分布的数学期望为两个总体均值之差
E(X1X2)12
•
方差为各自的方差之和
2
2
2 X1X2
1
2
n n 1
2
ppt课件完整
X
n
ppt课件完整
15
二、样本比例的抽样分 布
比例:
1. 比例:指总体(或样本)中具有某种属性的单位与 全部单位总数之比。
• 例1:不同性别的人与全部人数之比
• 例2:合格品与全部产品总数之比
统计学抽样与抽样分布ppt课件
4. 在大规模的抽样调查中,经常被采用的方法
精选
21
概率抽样(小结)
精选
22
非概率抽样
n也叫非随机抽样,是指从研究目的出发,根据调查者的 经验或判断,从总体中有意识地抽取若干单位构成样本。 n重点调查、典型调查、配额抽样(是按照一定标准或一 定条件分配样本单位数量,然后由调查者在规定的数额内 主观地抽取样本)、方便抽样(指调查者按其方便任意选 取样本。如商场柜台售货员拿着厂家的调查表对顾客的调 查)等就属于非随机抽样。 n优点:及时了解总体大致情况,总结经验教训,在进行 大规模抽样调查之前的试点。 n缺点:非随机抽样容易产生倾向性误差,并且误差不能 计算和控制 ,也就无法说明调查结果的可靠程度。
4. 特别是在标志值相差悬殊时,由于划分了类型,一
方面缩小了组内方差,另一方面也保证各组都能抽 取一定的样本单位,所以,分层抽样较之纯随机抽 样可以提高样本的代表性,能获得更为满意的效果
精选
16
分层抽样
(stratified sampling)续
Ü 优点:
Ü 除了可以对总体进行估计外,还可以对各层的子总 体进行估计
精选
23
概率抽样与非概率抽样
概率抽样
抽样类型
非概率抽样
简单随机抽样 分层随机抽样 整群抽样 系统抽样 多阶段抽样
方便抽样 判断抽样
其他非概率抽样
精选
24
重复抽样与非重复抽样
n重复抽样,又称回置抽样,是指从总体的N个
单位中,每次抽取一个单位后,再将其放回总 体中参加下一次抽选,连续抽n次,即得到一 个样本。
n重复:42=16个。它们是
n
AA AB AC AD; BA BB BC BD
n
精选
21
概率抽样(小结)
精选
22
非概率抽样
n也叫非随机抽样,是指从研究目的出发,根据调查者的 经验或判断,从总体中有意识地抽取若干单位构成样本。 n重点调查、典型调查、配额抽样(是按照一定标准或一 定条件分配样本单位数量,然后由调查者在规定的数额内 主观地抽取样本)、方便抽样(指调查者按其方便任意选 取样本。如商场柜台售货员拿着厂家的调查表对顾客的调 查)等就属于非随机抽样。 n优点:及时了解总体大致情况,总结经验教训,在进行 大规模抽样调查之前的试点。 n缺点:非随机抽样容易产生倾向性误差,并且误差不能 计算和控制 ,也就无法说明调查结果的可靠程度。
4. 特别是在标志值相差悬殊时,由于划分了类型,一
方面缩小了组内方差,另一方面也保证各组都能抽 取一定的样本单位,所以,分层抽样较之纯随机抽 样可以提高样本的代表性,能获得更为满意的效果
精选
16
分层抽样
(stratified sampling)续
Ü 优点:
Ü 除了可以对总体进行估计外,还可以对各层的子总 体进行估计
精选
23
概率抽样与非概率抽样
概率抽样
抽样类型
非概率抽样
简单随机抽样 分层随机抽样 整群抽样 系统抽样 多阶段抽样
方便抽样 判断抽样
其他非概率抽样
精选
24
重复抽样与非重复抽样
n重复抽样,又称回置抽样,是指从总体的N个
单位中,每次抽取一个单位后,再将其放回总 体中参加下一次抽选,连续抽n次,即得到一 个样本。
n重复:42=16个。它们是
n
AA AB AC AD; BA BB BC BD
n
211简单随机抽样(三种抽样方法)ppt课件(2024)
系统抽样的结果可能受到总体排序方 式的影响。
16
系统抽样优缺点及适用场景
01
适用场景
2024/1/30
02
03
04
适用于总体规模较大、无法进 行全面调查的情况。
适用于需要快速、简便地获取 样本的情况。
适用于对抽样误差有一定要求 ,但不需要非常高的精度的情
况。
17
分层抽样
04
2024/1/30
18
分层抽样定义
将总体分成若干个互不重叠的层,每 个层内的个体具有相同的特征,然后 从每个层内随机抽取一定数量的样本 ,构成一个样本量较大的样本。
是一种常用的抽样方法,适用于总体 中个体差异较大,且需要更精确地估 计总体参数的情况。
2024/1/30
19
分层抽样步骤
确定分层变量
选择能够反映总体个体差异的变量作为分层 变量。
2024/1/30
8
简单随机抽样步骤
将总体中的所有单位进行编号,编号 无关紧要,只要从1到N即可;
利用随机数表或随机数字发生器从编 号1到N中随机抽取n个不同的数字, 这些数字对应的单位就构成了样本;
2024/1/30
确定抽取的样本量n,通常要求n远小 于N,且n和N都是已知的;
对样本进行必要的检查和调整,确保 样本的代表性。
9
简单随机抽样优缺点
优点
简单易行,样本具有较好的代表性,能够客观地反映总体情况;每个单位被抽 中的概率相等,保证了抽样的公正性;
缺点
当总体容量N较大时,样本的抽取比较困难;需要对总体中的所有单位进行编 号,工作量较大;如果总体中单位特征差异较大,简单随机抽样可能导致样本 的偏差。
2024/1/30
16
系统抽样优缺点及适用场景
01
适用场景
2024/1/30
02
03
04
适用于总体规模较大、无法进 行全面调查的情况。
适用于需要快速、简便地获取 样本的情况。
适用于对抽样误差有一定要求 ,但不需要非常高的精度的情
况。
17
分层抽样
04
2024/1/30
18
分层抽样定义
将总体分成若干个互不重叠的层,每 个层内的个体具有相同的特征,然后 从每个层内随机抽取一定数量的样本 ,构成一个样本量较大的样本。
是一种常用的抽样方法,适用于总体 中个体差异较大,且需要更精确地估 计总体参数的情况。
2024/1/30
19
分层抽样步骤
确定分层变量
选择能够反映总体个体差异的变量作为分层 变量。
2024/1/30
8
简单随机抽样步骤
将总体中的所有单位进行编号,编号 无关紧要,只要从1到N即可;
利用随机数表或随机数字发生器从编 号1到N中随机抽取n个不同的数字, 这些数字对应的单位就构成了样本;
2024/1/30
确定抽取的样本量n,通常要求n远小 于N,且n和N都是已知的;
对样本进行必要的检查和调整,确保 样本的代表性。
9
简单随机抽样优缺点
优点
简单易行,样本具有较好的代表性,能够客观地反映总体情况;每个单位被抽 中的概率相等,保证了抽样的公正性;
缺点
当总体容量N较大时,样本的抽取比较困难;需要对总体中的所有单位进行编 号,工作量较大;如果总体中单位特征差异较大,简单随机抽样可能导致样本 的偏差。
2024/1/30
三大抽样分布课件
在方差分析中,t分布用于检验 各个组之间的均值是否存在显著
差异。
04
CATALOGUE
卡方分布
卡方分布的定义
定义
卡方分布是一种连续概率分布,描述 了随机变量的取值与自由度的平方之 间的比例关系。
公式
若随机变量X符合卡方分布,则X的概 率密度函数为f(x)=x^(n/2-1)e^(x/2)/2^(n/2)Γ(n/2),其中n为自由度 ,Γ为伽玛函数。
正态分布
正态分布的定义
01
正态分布是一种连续概率分布, 其概率密度函数呈钟形,对称轴 为均值所在直线,形状由标准差 决定。
02
正态分布是自然界中最常见的分 布形态,许多随机变量都服从或 近似服从正态分布。
正态分布的性质
01
02
03
集中性
正态分布曲线以均值为中 心,两侧分布对称。
均匀性
正态分布曲线是关于标准 差对称的,形状由标准差 决定。
t分布
t分布的定义
定义
t分布(也称为学生t分布)是一种 连续概率分布,其形状由自由度 参数决定。
描述
当数据来自正态分布的总体,且样 本量较小(通常n<30)时,t分布 近似于正态分布。
公式
t分布的密度函数和分布函数可以用 一系列复杂的数学公式来描述。
t分布的性质
形状
峰度
随着自由度的增加,t分布的形状逐渐 接近正态分布。
t分布的峰度大于正态分布的峰度,且 随着自由度的增加而减小。
偏度
t分布通常是偏态的,其偏度随着自由 度的增加而减小。
t分布在统计学中的应用
假设检验
在样本量较小时,t分布在假设 检验中常用作正态分布的替代,
用于检验统计假设。
差异。
04
CATALOGUE
卡方分布
卡方分布的定义
定义
卡方分布是一种连续概率分布,描述 了随机变量的取值与自由度的平方之 间的比例关系。
公式
若随机变量X符合卡方分布,则X的概 率密度函数为f(x)=x^(n/2-1)e^(x/2)/2^(n/2)Γ(n/2),其中n为自由度 ,Γ为伽玛函数。
正态分布
正态分布的定义
01
正态分布是一种连续概率分布, 其概率密度函数呈钟形,对称轴 为均值所在直线,形状由标准差 决定。
02
正态分布是自然界中最常见的分 布形态,许多随机变量都服从或 近似服从正态分布。
正态分布的性质
01
02
03
集中性
正态分布曲线以均值为中 心,两侧分布对称。
均匀性
正态分布曲线是关于标准 差对称的,形状由标准差 决定。
t分布
t分布的定义
定义
t分布(也称为学生t分布)是一种 连续概率分布,其形状由自由度 参数决定。
描述
当数据来自正态分布的总体,且样 本量较小(通常n<30)时,t分布 近似于正态分布。
公式
t分布的密度函数和分布函数可以用 一系列复杂的数学公式来描述。
t分布的性质
形状
峰度
随着自由度的增加,t分布的形状逐渐 接近正态分布。
t分布的峰度大于正态分布的峰度,且 随着自由度的增加而减小。
偏度
t分布通常是偏态的,其偏度随着自由 度的增加而减小。
t分布在统计学中的应用
假设检验
在样本量较小时,t分布在假设 检验中常用作正态分布的替代,
用于检验统计假设。
抽样与抽样分布.pptx
参数估计也就是用样本统计量去估计总体的 参数。比如,用样本均值估计总体均值估计 总体均值,用样本方差估计总体方差,用样 本比例估计总体比例等。
用计来量估,计用总符体号参 数表的示统计量的名称,称为估
用来估计总体参数时计算出来的估计量的具 体数值,称为估计值
点估计与区间估计
参数估计的方法有点估计和区间估计 ◆(一)点估计
x 的分布形式与原有总体和样本容量n的大
小有关 .3 总体分布
.3 P ( x ) 抽样分布
.2
.2
.1
0 1
234
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
= 2.5
σ2 =1.25
当总体服从正态分布N(μ, 2 )n时,样本均值的抽
样分布仍然是服从正态分布的,其均值仍为 μ , 方差为 ,即2 n样本均值的方差比原总体的方差 要小,而且样本容量n越大,方差越小。
点估计又称定值估计。它是用实际样本指标 数值代替总体指标数值,即总体平均数的点 估计值就是样本平均数,总体成数的点估计 值就是样本成数。这种估计不考虑是否有抽 样误差。
例如,对一批某种型号的电子元件10000只 进行耐用时间检查,随机抽取100只,测试的 平均耐用时间子元件的平均耐用时 间为1055小时,全部电子元件的合格率也是 91%。
.2
.1 0
1
234
现从总体中抽取n=2的简单随机样本,在重复抽样条件 下,共有42=16个样本。所有样本的结果为
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
用计来量估,计用总符体号参 数表的示统计量的名称,称为估
用来估计总体参数时计算出来的估计量的具 体数值,称为估计值
点估计与区间估计
参数估计的方法有点估计和区间估计 ◆(一)点估计
x 的分布形式与原有总体和样本容量n的大
小有关 .3 总体分布
.3 P ( x ) 抽样分布
.2
.2
.1
0 1
234
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
= 2.5
σ2 =1.25
当总体服从正态分布N(μ, 2 )n时,样本均值的抽
样分布仍然是服从正态分布的,其均值仍为 μ , 方差为 ,即2 n样本均值的方差比原总体的方差 要小,而且样本容量n越大,方差越小。
点估计又称定值估计。它是用实际样本指标 数值代替总体指标数值,即总体平均数的点 估计值就是样本平均数,总体成数的点估计 值就是样本成数。这种估计不考虑是否有抽 样误差。
例如,对一批某种型号的电子元件10000只 进行耐用时间检查,随机抽取100只,测试的 平均耐用时间子元件的平均耐用时 间为1055小时,全部电子元件的合格率也是 91%。
.2
.1 0
1
234
现从总体中抽取n=2的简单随机样本,在重复抽样条件 下,共有42=16个样本。所有样本的结果为
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
5-4三大抽样分布
n1 n2
由 (n1
1)S12
2
~
2 (n1
1),
(n2 1)S22
2
~
2(n2
1),
且它们相互独立, 故由 2 分布的可加性知
V
(n1
1)S12
2
(n2
1)S22
2
~
2(n1
n2
2),
由于 U 与V 相互独立 , 按 t 分布的定义 .
U V /(n1 n2 2)
( X Y ) (1 2)
则有:
( X Y ) (1 2 )
(n1
1)S12
(n2
1)S
2 2
11
~ t(n1 n2 2)
n1 n2 2
n1 n2
证:X
Y
~
N
(1
2
,
2
n1
2
) n2
所以 ( X Y ) (1 2 ) ~ N (0,1) 1/ n1 1/ n2
(n1 1)S12
2
~
2 (n1
1),
定理二
设 X1, X2 , , Xn 是总体 N ( , 2 ) 的样本,
X , S 2 分别是样本均值和样本方差, 则有
(1)
(n 1)S 2
2
~
2(n 1);
(2) X 与 S 2 独立.
推论1 设 X1, X2, , Xn 是总体 N ( , 2 ) 的
样本, X , S 2 分别是样本均值和样本方差, 则有
2
P( X
2
t2
(n))
2
P(Y
t2
12
(n))
所以
t2
12
由 (n1
1)S12
2
~
2 (n1
1),
(n2 1)S22
2
~
2(n2
1),
且它们相互独立, 故由 2 分布的可加性知
V
(n1
1)S12
2
(n2
1)S22
2
~
2(n1
n2
2),
由于 U 与V 相互独立 , 按 t 分布的定义 .
U V /(n1 n2 2)
( X Y ) (1 2)
则有:
( X Y ) (1 2 )
(n1
1)S12
(n2
1)S
2 2
11
~ t(n1 n2 2)
n1 n2 2
n1 n2
证:X
Y
~
N
(1
2
,
2
n1
2
) n2
所以 ( X Y ) (1 2 ) ~ N (0,1) 1/ n1 1/ n2
(n1 1)S12
2
~
2 (n1
1),
定理二
设 X1, X2 , , Xn 是总体 N ( , 2 ) 的样本,
X , S 2 分别是样本均值和样本方差, 则有
(1)
(n 1)S 2
2
~
2(n 1);
(2) X 与 S 2 独立.
推论1 设 X1, X2, , Xn 是总体 N ( , 2 ) 的
样本, X , S 2 分别是样本均值和样本方差, 则有
2
P( X
2
t2
(n))
2
P(Y
t2
12
(n))
所以
t2
12
常用抽样分布.ppt
P
1 F
F1
1 (n,
m)
1
P
1 F
F1
1 (n,
m)
1
故
P
1 F
F1
1 (n, m)
,
由于 1 ~ F(m, n) F
因而
F1
1 (n,
m)
F
(m,
n)
例1 F0.95 (5,4) ? 0.6
解 查P.268表, 0.5 0.4
F0.05 (4,5) 5.19 0.3
0.2
F1
(n,
m)
x)
f (x1 ,, xn )dx1 dxn
n
i 1
X
2 i
x
1
(2 )n / 2
i 1
exp(
1 2
n
X
2 i
x
n i 1
xi2
)dx1 dxn
i 1
作 n元极坐标变换
x1 r cos1 cos2 cosn1 x2 r cos1 cos2 sin n1
x3 r c os1 cos2 sin n2
2
2
t e dt 令
t
nzm 2
v
2
n m z n m n 1 2 22
nm
2
(
n 2
)(
m 2
)
nz
2
m
nm 2
0
nm 1
2
t
nm
n2m2
zn 2
1
1
nm
2 n m
(
n 2
)(
m 2
)
nz
m
2
(
nm 2
心理统计ppt08抽样分布
THANKS FOR WATCHING
感谢您的观看
正态分布由两个参数决定,即均值和标准差。在正态分布中, 约68%的观测值落在均值±标准差的区间内,约95%的观测值 落在均值±2标准差的区间内,约99%的观测值落在均值±3标准 差的区间内。
正态分布的特点
集中性
正态分布的曲线是钟形的, 峰值出现在均值处,表示 大多数观测值都集中在均 值附近。
对称性
心理统计ppt08抽样分布
目录
• 抽样分布概述 • 正态分布 • 其他常见的抽样分布 • 抽样分布与中心极限定理 • 抽样分布的实际应用
01 抽样分布概述
定义与意义
定义
抽样分布是样本统计量(如样本 均值、样本方差)的概率分布。
意义
通过研究抽样分布,可以了解样 本统计量的性质和变化规律,为 统计推断提供基础。
应用
F分布是一种连续概率分布,用于描述 两个比例或两个方差之间的比较。
在统计推断中,F分布用于方差分析、 回归分析和相关分析等统计方法。
特点
F分布具有两个参数,即分子自由度和 分母自由度。随着自由度的增加,F分 布趋近于正态分布。
卡方分布
定义
卡方分布是一种离散概率分布, 用于描述独立随机变量平方和的
假设检验
假设检验的基本原理
假设检验是利用样本信息来判断总体 参数是否显著差异的统计方法,其基 本原理是利用抽样分布的特性来构建 合适的统计量,并依据该统计量的分 布来做出决策。
假设检验的步骤
假设检验通常包括提出假设、构造统 计量、确定临界值和做出决策等步骤, 其中临界值的选择对于假设检验的准 确性至关重要。
中心极限定理的限制条件
虽然中心极限定理在许多情况下 都适用,但它也有一些限制条件。
简单随机抽样(三种抽样方法).ppt
笑一笑,十年少
一天,爸爸叫儿子去买一盒火柴,临出 门前,爸爸嘱咐儿子要买能划燃的火柴,儿 子拿着钱出门了,过了好一会儿,儿子才回 到家。
“火柴能划燃吗?”爸爸问。 “都能划燃。” “你这么肯定?” 儿子递过一盒划过的火柴,兴奋地说: “我每根都试过啦。”
问:这则笑话中,儿子采用的是什么调查方式? 这其中的全体是什么?这种调查方式好不好?
一个著名的案例1936年美国总统选举前,一份颇有名气的杂志 的工作人员做了一次民意测验,调查兰顿(时任堪萨斯州州长) 和罗斯福(时任总统)中谁将当选下一任总统。为了解公众意向, 调查者通过电话和车辆登记薄上的名单给一大批人发了调查表 (注意1936年电话和汽车只有少数富人拥有)。通过分析收回的 调查表,显示兰顿非常受欢迎,于是杂志预测兰顿将获胜。
实际选举结果正好相反,罗斯福在选举中获胜!
你认为预测结果出错的原因是什么?
那么,怎样从总体中抽取样本呢?如何表示样本数 据?如何从样本数据中提取基本信息(样本分布、样本 数字特征等),来推断总体的情况呢?这些正是本章要 解决的问题。
抽样方法 2.1.1简单随机抽样
要了解全国高中生的视力情况,在全国抽取了 15所中学的全部高中生15000人进行视力测试。
谈谈你的看法:
统计的基本思想:
用样本估计总体,即通常不直接去研究总 体,而是通过从总体中抽取一个样本,根据 样本的情况去估计总体的相应情况。
妈妈:“儿子,帮妈妈买盒火柴去。” 妈妈:“这次注意点,上次你买的火柴好多划不着。” ……… 儿子高兴地跑回来。 孩子:“妈妈,这次的火柴全划得着,我每根都试过了。”
N
简单随机抽样法之一——抽签法
步骤: 1、把总体中的N个个体编号;
2、 把号码写在号签上,将号签放在一个容器中 搅拌均匀;
抽样与抽样分布PPT-PPT精品文档
特点:
(1)遵循随机原则; (2)推断被调查对象的总体特征; (3)计算推断的准确性与可靠性。 江西财经大学统计学院
1
统计学
所谓抽样
第三章
抽样和抽样分布
抽签 编号 摇号 随机数字表
75 18 26 53 86
90 85 89 64 97
96 18 48 81 06
91 63 57 95 12
江西财经大学统计学院
7
统计学
第三章
抽样和抽样分布
[例]10人年龄资料如下。N=10 n=3。 人: A B C D E F G H I J 年龄: 5 8 12 40 42 46 48 70 72 76 分类: N1=3 N2=4 N3=3 N=10 1=2.87 2=3.16 3=2.49 =8.52 n1=? n2=? n3=? n=3 1、等额分配:n1= n2= n3= 1 2、等比例分配:n1/N1= n2/N2= … = n/N ∵ n/N =0.3 ∴n1/N1=0.3 n1=0.3×N1=0.3 ×3= 0.9 3、最优分配: i/ =ni/Ni ∵ 1/ =2.87/8.52=0.34 ∴ n1/N1=0.34 n1=0.34×3 =1.02 江西财经大学统计学院 8 二、抽样误差的计算
Z x
2
t 概率度 抽样平均误差 x n
s替代 不知 ˆ替代 p P不知
江西财经大学统计学院
3
x x x tx x x x tx
统计学
第三章
抽样和抽样分布
[例]某公司出口一种名茶,规定每包规格重量不低于150g,现用
x x P { x } 1 F ( t ) x x x x P { x x } 1 F ( t ) x x x x
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
单侧t0.05,9=1.833 双侧t0.01/2,9=3.250
=单侧t0.005,9 单侧t0.01,9=2.821 双侧t0.05/2,∞=1.96
=单侧t0.025,∞ 单侧t0.05,∞ =1.64
三、 F 分布
令 2 (1) 和 2 ( 2 ) 分别为服从自由度为 1 和 2 的
独立变量的卡方分布,则称 F 2 (1) 1 服从分子自由度
18.51 19.00 19.16 19.25 19.30 19.33 2
98.49 99.00 99.17 99.25 99.30 99.33
4.24 3.39 2.99 2.76 2.60 2.49 25
7.77 5.57 4.68 4.18 3.85 3.63
F 分布曲线下面积与概率
小结
• 10、人的志向通常和他们的能力成正比例。18:36:1318:36:1318:3611/16/2020 6:36:13 PM
• 11、夫学须志也,才须学也,非学无以广才,非志无以成学。20.11.1618:36:1318:36Nov-2016-Nov-20
• 12、越是无能的人,越喜欢挑剔别人的错儿。18:36:1318:36:1318:36Monday, November 16, 2020
F 分布曲线
1 1, 2 5
1 5, 2 5
1 10, 2 10
F 界值表
5
附表5 F界值表(方差分析用,单侧界值) 上行:P=0.05 下行:P=0.01
分母自由度
分子的自由度,υ1
υ2
1
2
3
4
5
6
161 200 216 225 230 234 1
4052 4999 5403 5625 5764 5859
P(t 1.812) 0.05 或 P(t 1.812) 0.05
② 10,双 =0.05,t 2, t0.05/ 2,10 2.228 ,则有
P(t 2.228) P(t 2.228) 0.05 t t 0.10/ 2,30 0.05,30
t分布曲线下面积(附表2)
双侧t0.05/2,9=2.262 =单侧t0.025,9
常用的抽样分布
如果总体服从正态分布N(m,s2),
则从该正态总体中抽取样本,得到的
样本均数也服从正态分布,但该分布
为N(m,s2/n ),此时的方差是总 体的1/n倍,即有
mx m,
sx
s
n
中心极限定理
• 如果总体不是正态总体,但其均数和标
准差分别为μ和σ,则当样本含量n不断
增大时,样本均数的分布也趋近于正态
由度的大小有关。
自由度越小,则t值越分散,曲线越低平; 自由度逐渐增大时,t分布逐渐逼近Z分 布(标准正态分布);当趋于∞时,t分布即 为Z分布。
t 界值表
(P279,附表2)
问单侧t0.025,10 ?
f (t) ν=10的t分布图
✓ 举例:
t
1.812 -2.228
2.228
① 10,单 =0.05,t , t0.05,10 1.812 ,则有
为
1
和分母SS自1222 由度为
2
的
F
2 ( 2 )
分布,记为
2
F~
F
(
1,
2
)
。
对于样本方差
s12
和
s
2 2
,自由度分别为
1
和
2
的
正态总体,因为有 1s12 s2
~
2
( 1 )
,
2s22 s2
~ 2 ( 2 ) ,
所以有 F
= s12 s22
~ F (1, 2 )
F分布的概率密度函数
F 分佈是為了紀念著名的統計學家R.A. Fisher(1890-1962)而得名。
自由度:n-1
f(t)
ν─>∞(标准正态曲线)
ν=5
ν=1
f (t) ( 1) 2 (1 t 2 / )( 1) 2
( 2)
-5.0
-4.0
-3.0-2.0源自-1.00.01.0
2.0
3.0
4.0
5.0
t
图4-2 不同自由度下的t 分布图
t分布的特征
①以0为中心,左右对称的单峰分布;
②t分布曲线是一簇曲线,其形态变化与自
3.84
(1.96)2
Z2 0.05/ 2
2 0.01(1)
6.63
(2.5758)2
Z2 0.01/ 2
χ2分布(chi-square distribution)
纵高
0.5 0.4 0.3 0.2 0.1 0.0
0
f
( 2)
1
2( / 2)
2
2
( / 21)
e2 / 2
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
1122.59 15
18
卡方值
5.99
附表 3 中列出了各种自由度的上α分位点
对应的概率,如
2 0.05
(2)
5.99
。
对于正态总体,若总体均数μ未知,则由
数理统计知识可知: (n 1)S 2
s2
即 s2 s2
服从χ2 ( ) ,
由此可对方差的抽样误差进行假设检验。
χ2分布
• (1)随机变量、概率分布、抽样分布 是统计学推断的基础。
• (2) 二项分布描述二项分类变量两种 观察结果的出现规律。泊松分布是二项 分布的特例,常用于事件发生率很小, 样本含量很大的情况。
• (3)正态分布是其他分布的极限分布, 许多统计方法的理论基础。不少医学 现象也服从正态分布或近似服从正态 分布。
f(χ2)
χ2
χ2分布曲线下的面积与概率
二、 t 分布(t-distribution)
随机变量X N(m,s2)
Z X m s
Z变换
标准正态分布
N(0,12)
均数 X
N (m,s 2 n)
Z X m
sn
标准正态分布
N(0,12)
Student t分布
t X m X m , v n 1 SS n SX
分布,且其均数为μ,标准差为 s
n
• 不论总体的分布形式如何,只要样本含
量n足够大时,样本均数的分布就近似正
态分布 ,此称为中心极限定理。 (下章通过抽样实验证实)
常用的三种抽样分布
• 一、 2 分布
• 二、t分布 • 三、F 分布
均为连续型随
机变量分布,分布 只与自由度,即样 本含量有关
2 0.05(1)
• (4)检验统计量分布(或抽样分布)
包括:卡方分布,t分布,F分布等。 这些分布是卡方检验、t检验、方差分
析等假设检验的基础。
练习作业
实习册 1,2,3,4
• 9、春去春又回,新桃换旧符。在那桃花盛开的地方,在这醉人芬芳的季节,愿你生活像春天一样阳光,心情像桃花一样美丽,日子像桃子一样甜蜜。20. 11.1620.11.16Monday, November 16, 2020
=单侧t0.005,9 单侧t0.01,9=2.821 双侧t0.05/2,∞=1.96
=单侧t0.025,∞ 单侧t0.05,∞ =1.64
三、 F 分布
令 2 (1) 和 2 ( 2 ) 分别为服从自由度为 1 和 2 的
独立变量的卡方分布,则称 F 2 (1) 1 服从分子自由度
18.51 19.00 19.16 19.25 19.30 19.33 2
98.49 99.00 99.17 99.25 99.30 99.33
4.24 3.39 2.99 2.76 2.60 2.49 25
7.77 5.57 4.68 4.18 3.85 3.63
F 分布曲线下面积与概率
小结
• 10、人的志向通常和他们的能力成正比例。18:36:1318:36:1318:3611/16/2020 6:36:13 PM
• 11、夫学须志也,才须学也,非学无以广才,非志无以成学。20.11.1618:36:1318:36Nov-2016-Nov-20
• 12、越是无能的人,越喜欢挑剔别人的错儿。18:36:1318:36:1318:36Monday, November 16, 2020
F 分布曲线
1 1, 2 5
1 5, 2 5
1 10, 2 10
F 界值表
5
附表5 F界值表(方差分析用,单侧界值) 上行:P=0.05 下行:P=0.01
分母自由度
分子的自由度,υ1
υ2
1
2
3
4
5
6
161 200 216 225 230 234 1
4052 4999 5403 5625 5764 5859
P(t 1.812) 0.05 或 P(t 1.812) 0.05
② 10,双 =0.05,t 2, t0.05/ 2,10 2.228 ,则有
P(t 2.228) P(t 2.228) 0.05 t t 0.10/ 2,30 0.05,30
t分布曲线下面积(附表2)
双侧t0.05/2,9=2.262 =单侧t0.025,9
常用的抽样分布
如果总体服从正态分布N(m,s2),
则从该正态总体中抽取样本,得到的
样本均数也服从正态分布,但该分布
为N(m,s2/n ),此时的方差是总 体的1/n倍,即有
mx m,
sx
s
n
中心极限定理
• 如果总体不是正态总体,但其均数和标
准差分别为μ和σ,则当样本含量n不断
增大时,样本均数的分布也趋近于正态
由度的大小有关。
自由度越小,则t值越分散,曲线越低平; 自由度逐渐增大时,t分布逐渐逼近Z分 布(标准正态分布);当趋于∞时,t分布即 为Z分布。
t 界值表
(P279,附表2)
问单侧t0.025,10 ?
f (t) ν=10的t分布图
✓ 举例:
t
1.812 -2.228
2.228
① 10,单 =0.05,t , t0.05,10 1.812 ,则有
为
1
和分母SS自1222 由度为
2
的
F
2 ( 2 )
分布,记为
2
F~
F
(
1,
2
)
。
对于样本方差
s12
和
s
2 2
,自由度分别为
1
和
2
的
正态总体,因为有 1s12 s2
~
2
( 1 )
,
2s22 s2
~ 2 ( 2 ) ,
所以有 F
= s12 s22
~ F (1, 2 )
F分布的概率密度函数
F 分佈是為了紀念著名的統計學家R.A. Fisher(1890-1962)而得名。
自由度:n-1
f(t)
ν─>∞(标准正态曲线)
ν=5
ν=1
f (t) ( 1) 2 (1 t 2 / )( 1) 2
( 2)
-5.0
-4.0
-3.0-2.0源自-1.00.01.0
2.0
3.0
4.0
5.0
t
图4-2 不同自由度下的t 分布图
t分布的特征
①以0为中心,左右对称的单峰分布;
②t分布曲线是一簇曲线,其形态变化与自
3.84
(1.96)2
Z2 0.05/ 2
2 0.01(1)
6.63
(2.5758)2
Z2 0.01/ 2
χ2分布(chi-square distribution)
纵高
0.5 0.4 0.3 0.2 0.1 0.0
0
f
( 2)
1
2( / 2)
2
2
( / 21)
e2 / 2
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
1122.59 15
18
卡方值
5.99
附表 3 中列出了各种自由度的上α分位点
对应的概率,如
2 0.05
(2)
5.99
。
对于正态总体,若总体均数μ未知,则由
数理统计知识可知: (n 1)S 2
s2
即 s2 s2
服从χ2 ( ) ,
由此可对方差的抽样误差进行假设检验。
χ2分布
• (1)随机变量、概率分布、抽样分布 是统计学推断的基础。
• (2) 二项分布描述二项分类变量两种 观察结果的出现规律。泊松分布是二项 分布的特例,常用于事件发生率很小, 样本含量很大的情况。
• (3)正态分布是其他分布的极限分布, 许多统计方法的理论基础。不少医学 现象也服从正态分布或近似服从正态 分布。
f(χ2)
χ2
χ2分布曲线下的面积与概率
二、 t 分布(t-distribution)
随机变量X N(m,s2)
Z X m s
Z变换
标准正态分布
N(0,12)
均数 X
N (m,s 2 n)
Z X m
sn
标准正态分布
N(0,12)
Student t分布
t X m X m , v n 1 SS n SX
分布,且其均数为μ,标准差为 s
n
• 不论总体的分布形式如何,只要样本含
量n足够大时,样本均数的分布就近似正
态分布 ,此称为中心极限定理。 (下章通过抽样实验证实)
常用的三种抽样分布
• 一、 2 分布
• 二、t分布 • 三、F 分布
均为连续型随
机变量分布,分布 只与自由度,即样 本含量有关
2 0.05(1)
• (4)检验统计量分布(或抽样分布)
包括:卡方分布,t分布,F分布等。 这些分布是卡方检验、t检验、方差分
析等假设检验的基础。
练习作业
实习册 1,2,3,4
• 9、春去春又回,新桃换旧符。在那桃花盛开的地方,在这醉人芬芳的季节,愿你生活像春天一样阳光,心情像桃花一样美丽,日子像桃子一样甜蜜。20. 11.1620.11.16Monday, November 16, 2020