第二讲 抽样分布与分位数

合集下载

概率论-分布及其分位数

概率论-分布及其分位数
分布及其分位数
U—分布 正态总体样本均值的分布
设总体 X ~ N , 2 , X1, X2,..., Xn 是 X 的一
个样本, 则样本均值服从正态分布X1 nFra bibliotekn i 1
Xi
~
N
,
2
n
U
X
1 n
n i1
Xi
~
N 0,1
n n
概率分布的分位数(分位点)
定义 对总体X和给定的 (0<<1),若存在x,
f(y)
上分位数或上侧临界值,
其几何意义见图5-5所示.
其中f(y)是 2-分布的概率密度. O
图5-5 2(n) x
显然,在自由度n取定以后,2(n)的值只与有关.
例如,当n=21,=0.05时,由附表3(P254)可查得,
02.05(21) 32.67 即 P 2(21) 32.67 0.05.
即 t(n)≈u , n>45.
一般的t分布临界值表中,详列至n=30,当 n>30就用标准正态分布N(0, 1)来近似.
四、F分布
定义5.5 设随机变量X~ 2(n1)、Y~ 2(n2),且
与相互独立,则称随机变量
F
X Y
n1 n2
服从第一自由度为n1,第二自由度为n2的F分布,
记作 F~F(n1,n2).
02.1(9)≈查 14.684.



14.684x
16 9
≈26.105
n2) F 2
图6-4
(n1,
n2)
x
例 设总体X~N( , 42), X1,X2,…,X10是n=10简
单随机样本, S2为样本方差,已知P{S2>}=0.1,求

《抽样和抽样分布》课件

《抽样和抽样分布》课件
《抽样和抽样分布》ppt课件
$number {01}
目录
• 抽样调查的基本概念 • 抽样分布的基础知识 • 抽样分布的原理 • 抽样误差的评估 • 实际应用中的抽样技术 • 案例分析
01
抽样调查的基本概念
抽样的定义和意义
定义
抽样是从总体中选取一部分个体 进行研究的方法。
意义
通过对部分个体的研究,推断出 总体的特征,以节省时间和资源 。
适用场景
当总体中存在周期性变化 或某种明显的模式时,系 统抽样能够提高样本的代 表性。
注意事项
要确保抽样的间隔与总体 中的变化模式相匹配,以 避免偏差。
分层抽样
分层抽样
注意事项
将总体分成若干层,然后从每层中随 机抽取一定数量的样本。
要确保分层依据合理,且层内样本的 抽取方法一致,以避免层间和层内的 偏差。
抽样误差的衡量指标
抽样平均误差
抽样平均误差是衡量抽样误差大小的指标,它反映了样本统 计量与总体参数之间的平均偏差。
抽样变异系数
抽样变异系数是衡量非系统抽样误差的指标,它反映了由于 随机性引起的样本统计量与总体参数之间的偏差程度。
05
实际应用中的抽样技术系统ຫໍສະໝຸດ 样010203
系统抽样
按照某种规则,每隔一定 数量的个体进行抽样,直 到达到所需的样本量。
步骤 1. 明确研究目的和要求。 2. 确定总体和样本规模。
抽样的原则和步骤
01 02 03
3. 选择合适的抽样方法。 4. 制定详细的抽样计划。
5. 实施抽样调查。
02
抽样分布的基础知识
总体和样本
1 2
3
总体
研究对象的全体集合。
样本

统计学之抽样与抽样分布课件

统计学之抽样与抽样分布课件
连续型随机变量的数值特征:
期望 —
E X x f x dx
方差 — σ 2 X x E X 2 f x dx
标准差 — σX x E X 2 f x dx
2020/8/8
第四章 抽样和抽样分布
13
第四章 抽样与抽样分布
第三节 抽样分布
3.1 抽样及抽样分布的含义 3.2 重置抽样下的抽样分布 3.3 不重置抽样下的抽样分布
1
F x P3X/4 x
1
4

2/4
3 4 当
1/4
4 4 当
0 x1 1 x2 2 x
2020/8/8
1
2
X
第四章 抽样和抽样分布
8
2.2 连续型随机变量概率分布
连续X❖型的密 随概率机度分变函布量数函的数的概性 率分质布:
1.
f
F
xx
0;x
f x dx
2. f x dx 1 ;
X 的概率密度函数
由于连续型随机变量在某点处的概率等于零。 对于连续性随机变量:
P x1 X x2 F x2 F x1
2020/8/8
第四章 抽样和抽样分布
5
2.2 离散型随机变量概率分布
设:正面向上的次数为 X,
则 X = 0、1、2
P X 0 1 1 1
22 4
PX
1
1 2
1 2
1 2
1 2
方差:σ 2 X X i E X 2 Pi i 1
N
标准差: σ X X i E X 2 Pi i 1
2020/8/8
第四章 抽样和抽样分布
11
2.3 随机变量的数字特征
概 数学期望 率 论

统计学 第七章 抽样与抽样分布(课件)

统计学 第七章  抽样与抽样分布(课件)

抽签、抓阄
最符合随机原则
编号 摇号
特点编号困难
随机数字表
基础抽样方式
随机数字表
75 90 96 91 16 01 66 15 08 48 18 85 18 63 56 82 16 66 33 98 26 89 48 57 26 54 31 40 07 89 53 64 81 95 33 17 29 38 41 52 86 97 06 12 24 32 42 51 61 71
p ˆ~NP,P(1P) n
第四章 区间估计
STAT
第一节 参数估计的基本原理
一、估计量与估计值(estimator and estimate )
1、待估参数:待估的总体参数;
2、估计量:作为估计依据的样本统计量ˆ
3、估计值:估计量的取值。
[例]1000只灯泡的使用寿命及标准差均未知,今随机取得4只 灯泡,测得寿命为1502,1453,1367,1650(小时),试估计总体 平均使用寿命及其标准差。
[例]假定吸烟者买烟的月支出近似服从正态分布。一机构随机抽
取了容量为26的样本进行调查,得到样本平均数为80元,样本
标准差为20元。试以95%的把握估计全部吸烟者月平均烟钱支出
的置信区间。 已 X ~ N ( , 知 2 ) x 8s 0 2n 0 26
X~N,n2
Z x ~ N (0 ,1 ) t x s ~ t(n 1 )
2
2
经证 x 2n 明M 2 e : 2 n
第四章 区间估计
STAT
3、一致性(consistency,大样本有益性)
( 1 )对于 0 任 ,如意 l果 im P 的 ˆ1 n 则ˆ为 称 的一致估计量。
( 2)对于有,当 限 n 总 N、 体 ˆ。

抽样分布及其上分位数

抽样分布及其上分位数
概率论与数理统计
例4 对Z ~ N (0,1),Tn ~ t(n),有
P( Z z /2 ) , P( Z z /2 ) 1 ,
P( Tn t /2(n)) , P( Tn t /2(n)) 1
证明: P( Z z / 2 ) P(Z z / 2 ) P(Z z / 2 )
对标准正态密度函数( x)有
sup pn( x) ( x) 0.0041
x
特别,当n 时, 有
lim
n
pn
u
1
u2
e 2 (u)
2
概率论与数理统计
t分布的性质
定理3.5: 如果Z~N(0,1) , ~ 2(n), 且Z与 相互独立,则有
Z ~ t(n)
n
概率论与数理统计
定理 3.6
如果X1,X2,…,Xn是来自正态总体 N (, 2 )
的样本, Xn和S 2分别为样本均值和样本方差,
则有
Xn ~ t(n 1)
Sn
概率论与数理统计
证明:由定理3.4
Z
Xn / n
~
N (0,1),
(n 1)S 2
2
~
2(n 1).
且它们独立. 则由定理3.5得到
Z
Xn
/(n 1) / n
F分布的性质
定理3.7:如果 ~ 2(n), ~ 2(m),和独立,则 F n ~ F (n, m) m 1 m ~ F (m, n) F n
概率论与数理统计
设X1, X2 , , Xn是来自总体X的样本, Y1,Y2 , ,Ym是来自总体Y的样本. 如果总体X 和总体Y 独立,则来自这 两个总体的样本也相互独立.于是
/2 /2
P( Z z / 2 ) 1 P( Z z / 2 ) 1 ,

第3节 常用统计分布(三个常用分布)

第3节 常用统计分布(三个常用分布)

例2
设X
~
N
(
,
2
),
Y
2
~
2 (n),且X ,Y相互独立,
试求 T X 的概率分布.
Yn
解 因为X ~ N(, 2),所以 X ~ N(0,1)
又Y
2
~
2 (n),且X ,Y独立,则
X
与Y
2
独立,
由定理得
T (X ) / X ~ t(n) (Y / 2) / n Y n
n
事实上,它们受到一个条件的约束:
Xi nX
i 1
n
i 1
Xi
X
1
n
(
i 1
Xi
nX )
1
0
0.
例1
设X1 ,
X 2 ,
,
X

6





体N
(0,1)的



本,
求C1
,
C
使
2

Y C1( X1 X 2 )2 C2( X 3 X4 X5 X6 )2
服 从 2分 布.

X1
2
4
则C1 1 2 ,C2 1 4 .
3. t 分布 定义 设 X ~ N (0, 1), Y ~ 2 (n), 且 X , Y
独立,则称随机变量 T X 服从自由度为 n Y /n
的 t 分布, 记为T ~ t(n).
t 分布又称学生氏(Student)分布. t(n) 分布的概率密度函数为
2. 2分布(卡方分布)
定义、设 X1, X 2 ,L , X n 相互独立,同服从 N (0, 1)

第二章 理论分布与抽样分布(二)

第二章 理论分布与抽样分布(二)

照正态分布计算的相应理论分布分位数的差(称为分位数的残差)作为纵坐标,把样本表现为直角坐
标系的散点,所描绘的图形。如果资料服从正态分布,残差散点基本在Y=0上下均匀分布。(分位数
的残差图)。
Detrended Normal P-P Plot of 血清总胆固醇
.08
Detrended Normal Q-Q Plot of 血清总胆固醇
34
4. 探索分析
➢结果分析
35
4. 探索分析
➢结果分析
M估计值
36
4. 探索分析
➢结果分析
分别利用Kolmogorov-Smimov检验和Shapiro-Wilk检验两种方法来确 定变量是否服从正态分布。其中,Statistic表示检验统计量的值,df 代表自由度,Sig.表示显著性水平。一般来说,Sig.>0.05则代表接受 零假设,即接受变量服从正态分布的假设。本例中,两个变量的两 种方法的Sig.值均大于0.05,因此两个变量均服从正态分布。
7
2 频数分析
频数分析过程的操作界面
(4)Statistics按钮 单击该按钮会弹出新的对话框,该对话框主要用于确定将要在输出结果 中出现的统计量,选中统计量前的复选框表示输出该统计量。 (5)Charts按钮 用于确定将输出的图形类型和图形取值。 (6)Format按钮 定义输出频数表的格式
8
2 频数分析
4
1.基本描述性统计量的定义及计算
描述离散趋势的统计量 ✓ 样本方差(Variance) ✓ 样本标准差(Std. deviation) ✓ 极差(Range) ✓ 均值标准误差(Standard Error of Mean) 描述总体分布形态的统计量 ✓ 偏度(Skewness) ✓ 峰度(Kurtosis)

第2讲 抽样分布

第2讲 抽样分布

1 q npq
n
n 1
0.95963970 ( 0.95957230)
其中n=5000, p=0,001, q=0.999. 可见误差不大于0.0001
(2)连续总体分布密度
e x , x 0 如: f ( x) x0 0,
分布密度函数的几何意义:区间发 生的概率,是该区间之上密度函数以下 曲边梯形的面积
f ( x)
Excel命令: expondist(x,λ, false)
F ( x) P( X x)
Excel命令: expondist (x,λ, true)
二、随机变量函数的三种重要分布
1、χ2分布 X1,X2,…,Xn相互独立,为标准正态分布 总体X的样本,则 样本函数
X
i 1
n
t分布的密度函数图形
特点:随n而变,n越小则峰越低、n越大
峰越高,当n很大时近似于标准正态分布
3.F分布 F-distribution
X ~ 2 n1 , Y ~ 2 n2 ,且X与Y相互独立
函数 ( X / n1 ) (Y n2 ) 服从于自由度为(n1,n2)的F分布 记为 ( X / n1 ) (Y n2 ) ~ F (n1 , n2 ) 如果统计量服从F分布,称为F统计量, 相应的检验称作F检验
第2讲
内容提要:
第一章
第三节 抽样分布
常见的概率分布 三个重要的抽样分布 分位数

抽样分布定理
本次课程要求:
1.了解 常见的概率分布 2.理解 抽样分布、分位数的含义
3.掌握 分位数
重点 抽样分布定理、分位数 难点 抽样分布、分位数的应用
知识回顾
数理统计(mathematical statistics) 数理统计是数学的一个分支,是通过概率 手段解决随机试验规律性的一门学科。

第二讲 抽样分布与分位数

第二讲 抽样分布与分位数
P{X } 0.95
(2)若 P{X } 0.025 求 (3)若



(1)P{X 2.18}
0.975
P{ X 20.09} 1 P{ X 20.09} 1 0.01 0.99
(2)P{X } 0.025 17.534 (3) P{X } 0.95
三 F 分布
P138
F分布是以统计学家费歇(R.A.Fisher)姓氏的第一 个字母命名的 费歇(R.A.Fisher,1890-1962),英国 统计学家,遗传学家,现代数理统计的主 要奠基人之一。他是使统计成为一门有 坚实理论基础并获得广泛应用的主要统 计学家。对数理统计有众多贡献,内容涉 及估计理论,假设检验,实验设计和方差 分析等重要领域,他还是一位举世闻名 的遗传学家,优生学家,他用统计方法 对这些领域进行研究,作出了许多重要 贡献。由于他的成就,他曾多次获得美 国和许多国家的荣誉。
第二讲 抽样分布与分位数 P135
一 c2 分布(卡方分布) 二 t 分布(student分布) 三 F 分布 四 抽样分布五大定理 五 单侧分位数
统计量g(X1,X2,…,Xn)既然是依赖于样 本的,而后者又是随机变量,故统计量也 是随机变量,因而就有一定的分布,这个 分布叫做统计量的“抽样分布” .
2 2
取自Y的样本, X和Y 分别是这两个样本的样本
2 均值, S12和S2 分别是这两个样本的样本方差,
则有
X Y ( 1 2 )
2 ( n1 1) S12 ( n2 1) S2 n1 n2 2
1 1 n1 n2
~ t ( n1 n2 2)
定理 5 (两总体方差比的分布)

数理统计CH抽样分布pt课件

数理统计CH抽样分布pt课件
第2章 抽样分布
Sample Distribution
2024/10/5
1
2 抽样分布
本章内容
2.1 总体与样本 2.2 抽样分布 2.3 统计量分位数 2.4 抽样分布定理 2.5 中心极限定理
2024/10/5
2
2 抽样分布
2.3 统计量分位数
Statistic Fractile
2024/10/5
➢定理三:设X1,X2,…,Xn是总体X~N(μ,σ2)旳
样本,X 和S2分别是样本均值和样本方差,

T X ~ tn 1
Sn
➢样本均值减去 它旳期望再除以
它旳原则误称作
Standard Error SX
S n
样本均值旳近似 原则化变换
2024/10/5
36
2.4 抽样分布定理
(4)正态总体近似原则化样本均值及分布
P X x
2024/10/5
5
2.3 统计量分位数
(3)统计量观察值表为xα便于应用
➢处理两类问题:
✓已知x求事件X>x旳概率 ✓已知概率反求观察值x
➢xα蕴含统计量 观察值xα、随机 事件X>xα、事件 概率α三方面旳信 息
2024/10/5
6
2.3 统计量分位数
(4)分布函数F(xα)与xα旳关系
8,10 10,8
2024/10/5
29
2 抽样分布
2.4 抽样分布定理
Sample Distribution
几种正态总体抽样 统计量所服从旳分布
2024/10/5
30
2.4 抽样分布定理
(1)任意总体样本均值旳期望和方差
➢设任意总体X旳期望E(X)=μ和方差Var(X)=σ2

01-抽样分布(3)

01-抽样分布(3)
-U/2 = U1-/2
2 分布的上侧 分位数
定义 设随机变量 X 服从自由度为n的 2 分布,对于
给定的 ,
0 1
,
若有
2 a
(
n
)
,使
P { 2
2
(n)}
f ( x)dx
2 a
则称
2
(n)
为XБайду номын сангаас的
上侧 分位数.
χ2(n)分布
α
2
(
n
)
x
t
定义 设随机变量 T 服从自由度为 n 的 t 分布.对于

P{ 1
P { F F (n, m)}
1 } 1 .
P{ 1 F
1 }
F (n, m )
F F (n, m )
由上侧α分位数定义有
1
P{ 1 F
F1 ( m , n)},
1

F1 (m, n)
. F (n, m)
则称数
P{ F F (n1 , n2 )}
F ( n 1 , n 2 ) 为F 分布的上侧
分位数
F(n1, n2 )分布
α
Fα(n1, n2 )
x
结论 证明
1
F1 ( m , n)
. F (n, m )
由定理5.6的推论知 F ~ F(n,m) 1 ~ F ( m , n ) ,
F
由上侧α分位数定义有
5.4 抽样分布 1. 几个常见的重要分布 2. 分位数
5.4.2 分位数 分位数常常被用来表示概率分布的临界值.
定义 设 X 为随机变量,其分布函数为F ( x ), 为 给定常数, 0 < < 1 若

62抽样分布与分位数

62抽样分布与分位数
推断的个体.
简单随机样本: 满足以下两个条件的样本 代表性: 即要求样本的抽取是随机的; 独立性: 即要求每次观察的结果既不影响其它 观察结果,也不受别的观察结果的影响.
样本观察值: 记作 x1, x2,L, xn 样本: 记 X1, X2,L Xn
定义6.1 设总体 ξ 是具有分布函数 F(x) 的随机变量,若 ξ1,ξ2,Lξn 是一组相互独立,且都具有相同的分布函数F(x) 的随机变量,则称 ξ1,ξ2,Lξn 是一组取自总体 F(x) 的容量 为 n 的简单随机样本(简称样本)
i=1
−ξ
)2
=
n
1 −1
n
∑[(ξi
i=1

µ)


− µ)]2
=
n
1 −1
⎡n
⎢ ∑ (ξi
⎣i=1
− µ)2
− n(ξ

µ
)2
⎤ ⎥

[ ] [ ] 所以
E(S
2
)
=
n
1 −
1
⎧n
⎨∑ E
⎩i=1
(ξi
− µ )2
− nE (ξ
− µ )2
⎫ ⎬ ⎭
[ ] =
1 n −1

2

nD(ξ
)
=
假设总是连续弄分布,密度函数为 f (x) ,那么样本 ξ1,ξ2,Lξn的联合密度函数为
n
f (x1,Lxn ) = f (x1)L f (xn ) = ∏ f (xi )
i=1
例6.2 设总体 ξ ~ π (λ),写出n=5的样本空间和 (ξ1,Lξ5)
的联合分布律.
解:
因为 ξ

三种重要的统计分布和分位数

三种重要的统计分布和分位数

0.5 n=2
n=4
0.4
n=8
n=16
0.3
0.2
0.1
00
5
10
15
20
图 13.1 不同自由度 2 分布的密度函数 **********************************************************
2 分布有重要意义的原因之一是下面的定理。
定理 设 X1, X2,, X n 是来自正态总体 N , 2 的样本,其样本均值和样本方
Y
~
2 n或Y
~

2 n

2 分布随机变量具有可加性,即若 X1`, X2 独立, X1 ~ 2 m, X 2 ~ 2 n ,则 X1 X 2 ~ 2 m n。且若 X ~ 2 n ,则 E X n, Var X 2n。
**********************************************************
最大似然估计量,并判断是否为无偏估计,若不是无偏估计尝试给出无偏校正, 并比较估计的有效性。
验证 1

2X
和2

n1 n
max
1 k n
Xk
都是参数 的无偏估计,并比较它们的有效
性。
例 14.4.2 设元件的寿命服从指数分布 f x e x x 0。为了了解元件寿

2
1 2

P
X

u0.975


1
2P
X

u0.975

1 2 1 0.975 0.95.
**********************************************************

抽样与抽样分布PPT-PPT精品文档

抽样与抽样分布PPT-PPT精品文档

特点:
(1)遵循随机原则; (2)推断被调查对象的总体特征; (3)计算推断的准确性与可靠性。 江西财经大学统计学院
1
统计学
所谓抽样
第三章
抽样和抽样分布
抽签 编号 摇号 随机数字表
75 18 26 53 86
90 85 89 64 97
96 18 48 81 06
91 63 57 95 12
江西财经大学统计学院
7
统计学
第三章
抽样和抽样分布
[例]10人年龄资料如下。N=10 n=3。 人: A B C D E F G H I J 年龄: 5 8 12 40 42 46 48 70 72 76 分类: N1=3 N2=4 N3=3 N=10 1=2.87 2=3.16 3=2.49 =8.52 n1=? n2=? n3=? n=3 1、等额分配:n1= n2= n3= 1 2、等比例分配:n1/N1= n2/N2= … = n/N ∵ n/N =0.3 ∴n1/N1=0.3 n1=0.3×N1=0.3 ×3= 0.9 3、最优分配: i/ =ni/Ni ∵ 1/ =2.87/8.52=0.34 ∴ n1/N1=0.34 n1=0.34×3 =1.02 江西财经大学统计学院 8 二、抽样误差的计算


Z x
2

t 概率度 抽样平均误差 x n
s替代 不知 ˆ替代 p P不知
江西财经大学统计学院
3
x x x tx x x x tx
统计学
第三章
抽样和抽样分布
[例]某公司出口一种名茶,规定每包规格重量不低于150g,现用
x x P { x } 1 F ( t ) x x x x P { x x } 1 F ( t ) x x x x
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P{X } 0.05 15.507
4 自由度为n1,n2的
P305
F分布的上 分位数 F (n1 , n2 )
1 F (n1 , n2 ) F1 (n2 , n1 )
例如:
F0.05 (8,12) 2.85
1 F0.9 (12,15) F0.1 (15,12) 1 0.476 2 .1
P135
由阿贝(Abbe) 于1863年首先给出,海尔墨特(Hermert)和
1
c2 分布的定义

X 1 ~ N (0,1) X 2 ~ N (0,1)
X 1 , X 2 ,... X n
...
X n ~ N (0,1)
相互独立
令 Y X 12 X 22 ... X n2 则 Y的概率密度函数为
一 c2 分布(卡方分布)
皮尔逊(K.Person)分别于1875和1900年导出的
(k.Pearson,1857-1933)英国著名统计 学家 1879年毕业于剑桥大学,1901年,他 与高尔顿、韦尔登创办的生物统计学杂志 《biometrika》, 使数理统计有了自己的阵 地。他发展了一系列频率曲线,将复相关 和回归理论扩展到许多领域,并为大样本 理论奠定了基础。皮尔逊的最大贡献是在 1900年发表的一篇文章中引进的拟合优度 的卡方检验。不少人把这视为近代统计学 的开端。
z0.05 u0.05 =1.64
倒查 0.975
倒查 0.95
3 自由度为n的 c 分布的上分 2 位数 c
2
P304
例如:
c (3) 3.665 2 0.95 (6) 1.635
2 0.3
c (10) 15.987
2 0.1
例 已知
X ~ c 2 (8)
,求(1)P{X 2.18} ,P{ X 20.09}
五 单側分位数 1 定义: 设0< <1,对随机变量X,称满足
P ( X x )
的点 x 为X关于
1
的单側分位数.
x

2 标准正态分布的上分位数 z 的求法
问题 ( z ) ? 1
P301
z
的求法是: 倒查1-α
例 z0.025 u0.025 =1.96
n ( ) 0.975 3
n 1.96 3
n 34.5744
所以 n最小为35
定理 2 (样本方差的分布)
P140
设X1,X2,…,Xn是取自正态总体 N ( , 2 ) 的样本, X , S 2分别为样本均值和样本方差, 则有
(1)
(2)
( n 1) S
2

2
~ c ( n 1)
Y / n2
x0 x0
称F服从第一自由度为n1 ,第二自由度为 n2的F分布 简记为 F~F(n1 , n2)
2 不同自由度的F 分布密度曲线
(1,10)
(5,10)
(10,10 )
F
四 抽样分布五大定理
定理 1 (样本均值的分布) P140
2
设X1,X2,…,Xn是取自正态总体 N ( , ) 的样本,则有
P{ X 1.3968 } 1 P{X 1.3968 } 1 0.1 0.9
P{X } 0.01
2.8965
Z 0.1 U 0.1 1.64 Z 0.05 U 0.05 1.96
2 2 2 2
1 F (n1 , n2 ) F1 (n2 , n1 )
2 1 2 2
P140
且X与Y独立, 设X ~ N ( 1, ), Y ~ N ( 2 , ), X1, X2,…, X n1是取自X的样本, Y1,Y2,…, Yn2 是 取自Y的样本, X和Y 分别是这两个样本的样本
2 均值,S12和S2 分别是这两个样本的样本方差,
则有
S12 12 ~ F ( n1 1, n2 1) 2 2 S2 2
2
2 与 X S 相互独立
定理 3 2 设X1,X2,…,Xn是取自正态总体 N ( , )
的样本, X , S 分别为样本均值和样本方差, 则有
X ~ t (n 1) S/ n
2
定理 4 (两总体均值差的分布)
设X ~ N ( 1, ),Y ~ N ( 2 , ), 且X与Y独立, X1,X2,…, X n1 是取自X的样本, Y1,Y2,…, Yn2 是
1 F 分布的定义 设X ~ c2(n1) , Y ~ c2(n2) ,X与Y独立 F X / n1 则 F的概率密度函数为:
n1 n2 n1 n1 n n 2 1 1 2 n n 2 1 x 2 (1 1 x) 2 ( x) n1 n1 n n2 2 2 2 0
第二讲 抽样分布与分位数 P135
一 c2 分布(卡方分布) 二 t 分布(student分布) 三 F 分布 四 抽样分布五大定理 五 单侧分位数
统计量g(X1,X2,…,Xn)既然是依赖于样 本的,而后者又是随机变量,故统计量也 是随机变量,因而就有一定的分布,这个 分布叫做统计量的“抽样分布” .
n x 1 1 x2 e 2 n n ( x) 2 2 2 0
x0 x0
称Y服从自由度为n的c2 分布 记为: Y~c 2 (n)
2 不同自由度的c2-分布密度曲线
( x)
n=1 n=4 n=10
n=20
c2
分布的形状取决于其自由度n的大小,通常 为不对称的正偏分布,但随着自由度的增大逐 渐趋于对称
P{X } 0.95
(2)若 P{X } 0.025 求 (3)若



(1)P{X 2.18}
0.975
P{ X 20.09} 1 P{ X 20.09} 1 0.01 0.99
(2)P{X } 0.025 17.534 (3) P{X } 0.95
6 t 分布的上分位数 例 t (10) 1.812 0.05
P303
t0.025 (13) 2.16 t0.15 (7) 1.119
} 例 已知 X ~ t (8) ,求(1) P{X 2.306} P{X 1.3968 (2)若 P{X } 0.01 求

P{ X 2.306 } 0.025
1
t 分布分布的定义 设随机变量X,Y相互独立,且X ~ N(0,1)
X Y /n
Y ~ c2(n),令 T
则 T 的概率密度函数为:
n 1 n 1 2 x 2 (1 ( x) ) 2 2 n n 2
( x )
称T服从有n个自由度的 t 分布
2 X ~ N ( 12 , 2 ) 中随机抽取容量为5的样本, 在总体
5 5 5 5 1 ( ) ( ) 1 ( ) 1 ( ) 2 2 2 2
=0.2628
X1, X 2 ,...,X n 是X的样本, 6设总体 则容量n应取多大,才能使得 P{1.2 X 5.2} 0.95
二 t 分布(student分布)
P137
t 分布是高塞特 于1908年在一篇以“学生” (student为笔名的论文中首先提到的
高塞特(W、S、Cosset,18761937)美国人,t分布的发现者,年轻时在 美国牛津大学学习数学与化学,1899年在 一家酿酒厂任酿酒技师,从事实验和数据 分析工作。 这项工作中进行的小样本实验 的结果使他怀疑存在一个不属于正态分布 曲线的其它分布,经过研究,终于得到新的 密度曲线,并与1908年以笔名“student”发 表此次结果。故后人称次分布为“学生氏 分布”或“t分布”。 Cosset的t分布打开了人们的思路,开创 了小样本方法的研究。
X ~ N (3.2,62 )

62 X ~ N (3.2, ) n
P{1.2 X 5.2} (
5.2 3.2 1.2 3.2 ) ( ) 6 6 n n
n n ( ) ( ) 3 3
n n n ( ) ( ) 2( ) 1 0.95 3 3 3
2 2
取自Y的样本, X和Y 分别是这两个样本的样本
2 均值, S12和S2 分别是这两个样本的样本方差,
则有
X Y ( 1 2 )
2 ( n1 1) S12 ( n2 1) S2 n1 n2 2
1 1 n1 n2
~ t ( n1 n2 2)
定理 5 (两总体方差比的分布)
三 F 分布
P138
F分布是以统计学家费歇(R.A.Fisher)姓氏的第一 个字母命名的 费歇(R.A.Fisher,1890-1962),英国 统计学家,遗传学家,现代数理统计的主 要奠基人之一。他是使统计成为一门有 坚实理论基础并获得广泛应用的主要统 计学家。对数理统计有众多贡献,内容涉 及估计理论,假设检验,实验设计和方差 分析等重要领域,他还是一位举世闻名 的遗传学家,优生学家,他用统计方法 对这些领域进行研究,作出了许多重要 贡献。由于他的成就,他曾多次获得美 国和许多国家的荣誉。
记为: T~t(n)
2 不同自由度的t 分布密度曲线
标准正态分布
标准正态分布
t (n= 13)
t 分布
t (n = 5)
z
t 分布与标准正态分布的比较
x
不同自由度的t分布
t
t 分布是类似正态分布的一种对称分布, 通常要比正态分布平坦和分散。一个特定的 分布依赖于称之为自由度的参数。随着自由 度的增大,分布也逐渐趋于正态分布
相关文档
最新文档