6.2正态样本统计量抽样分布
6_2正态总体的抽样分布
一 、 正态总体样本均值和方差的分布
定理1 若(X1,X2,…,Xn)是正态总体N(, σ2)的一个样本 , X和 S 2 分别是样本均值和样本方差,则:
1° X 与 S 2 相互独立;
2° X ~ N (, 2 )
n
3°
(n 1)S 2
2
~
2 (n 1)
1 n
4°
(n 1)S 2
2
~
2 (n 1)
1 n
2 i 1
Xi X 2 ~ 2 (n 1)
《概率统计》
返回
下页
结束
证明 (1)
X ~ N(, 2 ) , X ~ N(0,1) n / n
(2)
令 U X , / n
V
(n 1)S2
2 ,
则 U ~ N (0,1), V ~ 2(n 1).
,
(
1 n1
1 ) 2 )
n2
标准化后即得
( X Y ) (1 2 ) ~ N (0,1) 11
n1 n2
《概率统计》
返回
下页
结束
(2) 令 U ( X Y ) (1 2 ) ,
11
n1 n2
则由(1)知 U ~ N (0,1)
令V
(n1
1)S12
2
(n2
1)
S
2 2
2
,
由于
(n1
4/5
4/5
2 2(0.56) 0.5754
《概率统计》
返回
下页
结束
二、 单个正态总体的抽样分布 定理2 设(X1,X2,…,Xn)为正态总体N(μ,σ2)的一个样本, 则
[课件]概率与统计 6.2 常用统计分布
2 Y = ∑ Xi 2 i =n +1 1
电子科技大学
n +n2 1
常用统计分布
则
Y +Y = ∑ 1 2
n +n2 1 i =1
2 Xi
相互独立, 且Xi , i=1,2,…,n1+n2 相互独立,Xi~N(0,1), 从而 Y1+Y2~ χ2 (n1+n2).
电子科技大学
常用统计分布
总体, 总体,个体 简单随机样本 正态总体的 2个抽样定理 个抽样定理
统计量
样本均值 样本方差 样本矩(样本相关系数) 样本矩(样本相关系数)
统计量的分布
χ2分布
t 分布 F分布 分布
分位数 结构定理
电子科技大学
常用统计分布
设随机变量X 服从正态分布N(0,1), 对给 例6.2.1 设随机变量 服从正态分布 定的α(0<α<1),数uα满足 , 定的 , P{X > uα} = α
电子科技大学
T~t(n) ~
又称学生氏分布--第一个研究者以 又称学生氏分布--第一个研究者以Student --第一个研究者
常用统计分布
定理6.2.2 设随机变量 Y 相互独立 X 设随机变量X, 相互独立, 定理 ~N(0,1),Y~ χ2(n),则 , ~ ,
X T= ~ t(n) Yn
即随机变量 T 服从自由度为 n 的 t 分布 服从自由度为 分布.
电子科技大学
常用统计分布
χ2分布的三条性质: 分布的三条性质 三条性质:
性质1. 数字特征 数字特征) 性质 (数字特征 设 χ2 ~ χ2(n) ,则有 E( χ2 ) = n , 证明 D( χ2 ) = 2n
统计量及其分布
思考题
设 X1, X2 , … , Xn 是取自正态总体 N (, 2 ),
的一个样本,求 E( XS 2 ) ?
定理 2 设 X1, X2 , … , Xn 是取自正态总体 N (, 2 )
的样本,X 和S 分别为样本均值和样本均方差,则有
1) X ~ N(0, 1); / n
2) X ~ t(n 1).
nx 2 ];
③ s
1 n 1
n i 1
( xi
x )2
;
④
ak
1 n
n i 1
xik ,
k 1, 2
;
⑤ bk
1 n
n
(xi x )k ,
i 1
k
1, 2
.
例1 设总体X 的期望为 E(X ) , 方差为 D(X ) 2 其样本为 X1, X2, , Xn , 求E(X ), D(X ), E(S 2) .
为t分布的上 分位点。
t1 (n) t (n)
若 0.5,直接查表;若 0.5, t (n) t1 (n).
当 n 45 , t (n) z .
(3) F-分布
设随机变量X与Y相互独立,且 X ~ 2 (n1), Y ~ 2 (n2 ),
则随机变量
F
X Y
/ n1 / n2
所服从的分布是自由度为 (n1, n2 )
~
F (2,
2)
作 业 17
P137: 4 P147: 4
1.6664.
解:因为
(n 1)
2
S
2
~ 2(n 1)
15S 2
2
~ 2(15)
P
S
2 2
1.6664
统计学 第 6 章 抽样与参数估计
第6章抽样与参数估计第6章抽样与参数估计6.1抽样与抽样分布6.2参数估计的基本方法6.3总体均值的区间估计6.4总体比例的区间估计6.5样本容量的确定学习目标理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法参数估计在统计方法中的地位统计推断的过程6.1抽样与抽样分布什么是抽样推断概率捕样方法抽样分布抽样方法抽样方法概率抽样(probabilitysampling)也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样(systematicsainplmg)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范闱内随机地抽取一个单位作为初始单位,然后按爭先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)一个样本中各观察值的分布也称经验分布当样本容屋n逐渐增大时,样本分布逐渐接近总体的分布样本分布(sampledistribution)抽样分布的概念(samplingdistribution)抽样分布是指样本统计屋的分布,即把某种样本统计量看作一个随机变量,这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.统计量:样本均值,样本比例,样本方差等样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据对抽样分布的理解抽样分布:即不是总体分布,也不是样本分布,是根据所有可能样本计算的统计量的全部可能取值形成的分布样本均值的抽样分布容量相同的所有町能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。
第六章 统计量及其抽样分布
样本均值的抽样分布
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概率分 布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。 总体的均值、方差及分布如下
第 一
16个样本的均值(x)
个
第二个观察值
观 察值1 2
3
4
11
1.
20.
52. 0.
5
21
2.
25.
03. 5.
0
23
2.
30.
53. 0.
5
24
3.
35.
04. 5.
0
.3 P (X ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
第六章 统计量及其抽样分布
抽样理论依据: 1、大数定律 (1)独立同分布大数定律:证明当N足够大时,平均数据有稳定性,为用样本平 均数估计总体平均数提供了理论依据。 (2)贝努力大数定律:证明当n足够大时,频率具有稳定性,为用频率代替概率 提供了理论依据 2、中心极限定律 (1)独立同分布中心极限定律:设从均值为u、方差为s2(有限)的任意一个总体 中抽取样本量为n的样本,但n充分大时,样本均值X的抽样分布近似服从均值为u, 方差为s2/n的正态分布。 (2)德莫佛-拉普拉斯中心极限定律:证明属性总体的样本数和样本方差,在n足 够大时,同样趋于正态分布。
(central limit theorem)
第十六讲(数理统计中常用的分布、抽样分布定理)
3 n足够大 时, (n)近似服从• (n,2n) N
2
证
1设
2 (n) X i2
i 1
n
X i ~ N (0,1) i 1,2, , n
X 1 , X 2 , , X n
相互独立,
2 i
则 E ( X i ) 0, D( X i ) 1, E ( X ) 1
•2
P{ X z } 1
-z= z1-
例1 求
z0.05 , z0.025 , z0.005 , z0.95 .
解: P{ X 1.645} 0.05, P{ X 1.96} 0.05, P{ X 2.575} 0.005.
z0.05 1.645 , z0.025 1.96 , z0.005 2.575
0.4 0.3 0.2 0.1
n= 1 n=20
-3
-1
1
2
3
t 分布的图形(红色的是标准正态分布)
t分布的性质: 1. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形, 1 t 2 2 再 由函数的性质有 lim f (t ) 2 e . n
~ ( n2 ), U
2
与V 相互
U n1 F V n2
服从自由度为n1及 n2 的F分布,n1称为 第 一自由度,n2称为第二自由度,记作
F~F(n1,n2) . 由定义可见,
1 V n2 ~F(n2,n1) F U n1
若F~F(n1,n2), F的概率密度为
( n1 n2 ) n n1 n21 1 n n 2 n ( n1 ) 2 ( y ) 1 n1 y 2 ( y ) ( 1 ) ( 2 ) 2 2 2 0
抽样分布样本统计量的分布及其应用
抽样分布样本统计量的分布及其应用在统计学中,抽样是一种数据分析的方法,它通过对总体中的一部分个体进行观察和测量来推断总体的特征。
而抽样分布是指抽取相同样本量的多个样本后得到的统计量的分布。
样本统计量是对样本数据进行计算得到的统计指标,它可以用来估计总体参数,并进行假设检验。
1. 抽样分布的基本概念抽样分布具有一些基本性质,首先是无偏性。
当样本容量趋向于总体容量时,样本统计量的期望值会无限接近总体参数的真实值。
其次是有效性,即样本统计量的方差趋近于零,它可以用来估计总体参数的精确度。
最后是一致性,样本统计量在样本容量逐渐增大时趋近于总体参数。
2. 抽样分布的常见形式常见的抽样分布有正态分布、t分布和卡方分布。
其中正态分布应用最为广泛,它在中心极限定理的作用下,当样本容量足够大时,样本均值的抽样分布近似服从正态分布。
而t分布则适用于当总体标准差未知、样本容量较小的情况下,它的形状比正态分布要略扁平一些。
卡方分布则主要用于样本方差的估计与检验。
3. 抽样分布的应用抽样分布的应用非常广泛,常用于以下几个方面:3.1 参数估计通过抽样分布,我们可以利用样本统计量对总体参数进行估计。
例如,可以利用样本均值估计总体均值,利用样本标准差估计总体标准差。
通过计算置信区间,我们可以得到对总体参数的范围估计。
3.2 假设检验假设检验是统计学中非常重要的一项工具,用于判断样本数据是否支持某个假设。
基于抽样分布,我们可以计算统计量的P值,进而判断样本数据与假设的一致性。
常用的假设检验有均值检验、方差检验、比例检验等。
3.3 质量控制在生产过程中,质量控制是非常关键的。
通过对样本数据进行分析,可以判断生产过程是否正常。
例如,可以通过控制图分析样本均值的变化情况,以判断过程是否处于控制状态。
3.4 统计决策在实际决策中,我们往往需要依据样本数据来进行判断。
抽样分布提供了一种基于统计的决策依据。
例如,在市场调研中,我们可以通过对样本数据进行分析,对市场潜力进行预测,从而指导营销策略的制定。
正态总体的抽样分布
2π −∞
−
3
x2 ∞−
x2
∫ xe 2 d (− ) = −
2π −∞
2
∫ 3
∞
x2 −
xde 2
=−
2π −∞
3 2π
⎛ x2 −
⎜⎜ xe 2 ⎝
+∞
⎞ ⎟⎟ ⎠ −∞
∫ ∫ + 3
x2 ∞−
e 2 dx =
3
x2 ∞−
e 2 d(
x
)=
3
2π −∞
π −∞
2
f
(x)
χ
2 n
分布分位点
对于给定的 α∈(0,1), 称满足条件
{ } ∫ α P
χ
2 n
>
χ
2 n
(α
)
∞
=
f (x)dx =
χn2 (α )
的点 χn2(α)为 χn2分布的上(右)α分位点。
χn2 分布上α 分位点有表可查见附表4。
n = 10 α
χ•210(0.005)
例如 由P215查得
P
(
χ
由度为n的F分布,F ~ Fm,n 又称:df1 = m, df2 = n.
其密度函数为:
f (x)
=
⎛ ⎜ ⎜ ⎜ ⎜ ⎜⎜⎝
Γ
⎛ ⎜⎝
m
+ 2
Γ
⎛ ⎜ ⎝
m 2
⎞ ⎟ ⎠
Γ
0,
n⎞ ⎟⎠
⎛n⎞
⎛ ⎜⎝
m n
π
⎞2 ⎟ ⎠
x
π 2
−1
⎛⎜1
+
⎝
m n
统计学第6章统计量及其抽样分布
均值的标准差
3
0.43(年 )
X n 49
X ~N(10, 0.432)
_
P (X _9)1P (X _9)1P (X 109 10)
0.43 0.43
=1-Φ(-2.33)= Φ(2.33)=0.9901
整理ppt
12
练习题
某类产品的抗拉强度服从正态分布,平均 值为99.8公斤/平方厘米,标准差为5.48公斤/平 方厘米,从这个总体抽出一个容量为12的样本, 问这一样本的平均值介于98.8公斤/平方厘米和 100.9公斤/平方厘米之间的概率有多大。
1.从一个总体中随机抽出容量相同的各种样本, 从这些样本计算出的某统计量所有可能值的概 率分布,称为这个统计量的抽样分布。
2. 设X1,X2,…,Xn是取自总体X的样本,样本
均值
_
X
1 n
n i 1
Xi
,所有可能样本的均值
_
X
构成
的概率分布即为样本均值的抽样分布。
整理ppt
3
【例】设一个总体,含有4个元素(个体),即
第六章 统计量及其抽样分布
整理ppt
1
6.1 统计量
1. 统计量的形成
抽样
样本 构造函数
2. 统计量是样本X1,X2……Xn的一个函数 3. 统计量不依赖任何未知参数
4. 将一组样本的具体观测值代入统计量函 数,可以计算出一个具体的统计量值。
整理ppt
2
6.2 样本均值的抽样分布 和中心极限定理
第二个观察值
1
2
3
4
.3 P ( x )
1
1.0 1.5 2.0 2.5 .2
2
1.5 2.0 2.5 3.0
统计学第六版贾俊平
6 -3
统计学(第6版)
6. 1 统计量
6. 1 统计量
6.1.1 统计量的概念
统计量是样本的函数,它不依赖于任何未知参 数; 根据不同的研究目的,可构造不同的统计量; 利用构造的统计量,用样本性质推断总体的性 质; 统计量是统计推断的基础,在统计学中占据着 非常重要的地位。
6 -5
统计学(第6版)
6 - 17
n=1
n=4 n=10
当自由度增加时, 卡方分布的概率 密度曲线趋于对
n=20
称。当n趋于无
穷大时,卡方分
布的极限分布就
2 是正态分布。
不同容量样本的卡方分布
统计学(第6版)
6.3 由正态分布得到的几个重要分布
2分 布 的 性 质 1 . 数学期望为:2E)( n 2 . 方差为:D2() 2 n 3 .2分布的可加性,即12若~ 2( n 1 ),22 ~ 2( n 2 ) , 且独立,则
(1)抽检的100个元件中有3个不合格; (2)抽检的100个元件中前3个不合格;
100
在产品检验中,二项分布的统计量T X i是不合格
品率p的充分统计量。
i 1
6 - 11
统计学(第6版)
6. 2 关于分布的几个概念
6. 2 关于分布的几个概念
6.2.1 抽样分布
近代统计学的创始人之一,英国统计学家费希尔曾把 抽样分布、参数估计和假设检验看作统计推断的三个 中心内容。
6.2.2 渐近分布
当n无限增大时,统计量T(X1,X2,…Xn)的极限 分布常称为统计量的渐近分布; 第4节中的中心极限定理揭示的就是样本均值的 渐近分布; 不少重要的统计方法就是基于渐近分布提出的。
6 - 14
6.2数理统计中几种常用的分布
1.标准正态分布
2. 2分布
3. t分布 4. F分布
1. 标准正态分布
定义:设X~N(0,1),对任给的 , 0<<1,称满
足条件
P{X z } z ( x)dx
的点z为标准正态分布的上分位点 (x)
o z x
例1 求z0.05
F F1 (m, n)
P{
1 F
1 }
F1 (m, n)
1 F1 (m, n)
F (n, m)
(3) 若 X ~ t (n), 则 X 2 ~ F(1, n);
例5 设 F ~ F(24, 15) , 求 F1, F2, F3, 使其分别满足
P(F > F1 )= 0. 025 , P(F < F2 )= 0. 025 , P(F > F3 )= 0. 95 .
解 (1) 由 m =24, n=15, = 0. 025 , 查 P342 附表7 知
F1 = F0.025 (24 , 15)= 2.70 ;
(2) 无法直接查表获得,
但
P
(F
F2
)
P(
1 F
由 F 分布性质知 1/F ~ F(15, 24), 查附表7 知
1 F2
)
0.
025
,
1 F2
F0.025(15,
2(m
, 2),
n)
则
40
~ E若XYi4 221分布,x4则e当x22 dxn 充= 3分大时,
Y n 近似服从 N(0,1). 2n
应用中心极限定理可得
6
2分布的上分位点:
§6.2抽样分布定理
F0.05(14,30)2.0374. 2
F分布的上 分位点具有
如下性:F 质 1(n1,n2)F(n 12,n1).
F0.95(12,9)
1 F0.05(9,
12)
1 2.796375
0.35760. 6
上页 下页 返回
二、抽样分布定理
当总体为正态分布时,我们简单地叙述几个抽样分布 定理.
S/ n
(3)X与S2独立 .
上页 下页 返回
2. 两个正态总体
定理3 X1, X2, , Xn1与Y1,Y2, ,Yn2 分别是具有相同
方差的两正态总N体 (1,2), N(2,2)的样本, 且这
两个样本互
相
独, 设立X
1 n1
n1
Xi
i1
,Y
1 n2
n2
Yi
i1
分别是
这两个样本的均,S值 12
当 n 充分 2(大 n )1 2 (z时 2 n , 1 )2
上页 下页 返回
2. t 分布 (1). 定义:
设X~N(0,1) , Y~ 2(n), 且相互独立,
则称随机变量 T X Yn
服从自由度为 n的 t 分布,也称为t 变量. 记为 T~t(n). t 分布又称学生氏(Student)分布. 经过计算 :t(得 n)分布的概率密度函数为
§6.2 抽样分布定理
一、常用分布 二、抽样分布定理
一、常见分布
统计量是样本的函数,它是一个随机变量,
统计量的分布称为抽样分布.
1. 2分布
(1). 定义 若 X ~ N ( 0 ,1 ),则 X 2 ~2 ( 1 ).
样本均值的抽样分布(详细资料)
抽样分布根据样本统计量去估计总体参数,必须知道样本统计量分布。
定义6.2 某个样本统计量的抽样分布,从理论上说就是在重复选取容量为n 的样本时,由每一个样本算出的该统计量数值的相对数频数分布或概率分布。
由于现实中我们不可能将所有的样本都抽出来,因此,统计的抽样分布实际上是一种理论分布。
(一)样本均值的抽样分布从单位数为N 的总体中抽取样本容量为n 的随机样本,在重复抽样的条件下共有n N 个可能的样本,在不重复抽样条件下,共有!!()!nNN C n N n =-个可能样本。
对于每一个样本,我们都可以计算出样本的均值2()x s 或或p ,因此,样本均值是一个随机变量。
所有的样本均值形成的分布就是样本均值的抽样分布。
[例6.4]设一个总体含有4个个体(元素),即N=4,取值分别为:12341234x x x x ====总体分布为均匀分布,如图6.1所示。
图6.1总体均值:102.54X μ=== x总体方差:22() 1.25x x nσ-==∑若重复抽样,n=2 则共有2416=个可能样本。
具体列示如表5.1.1。
表6.1 可能的样本及其均值每个样本被抽中的概率相同,均值为116样本均值的抽样分布如表5.1.2和图5.1.2所示。
样本均值x 抽样分布的形状与原有总体的分布有关,如果原有总体是正态分布,样本均值也服从正态分布。
如果总体分布是非正态分布,当x 为大样本(30n ≥)时,样本均值的分布趋于服从正态分布;当x 为小样本时,其分布不是正态分布。
下面再让我们来看看样本均值x 抽样分布的特征:数学期望和方差。
设总体共有N 个元素,其均值为μ,方差为2σ,从中抽取容量为n 的样本。
E()x x X μ=== (6.1)22xnσσ=(重复抽样) (6.2)22()1xN nn N σσ-=-(不重复抽样) (6.3)对于无限总体,样本均值的方差,不重复抽样也可按重复抽样来处理;对于有限总体,当N 很大,而/n N 又很小,修正系数1N nN --会趋于1,不重复抽样也可按重复抽样来处理。
(完整版)样本及抽样分布
第六章样本及抽样分布【基本要求】1、理解总体、个体和样本的概念;2、理解样本均值、样本方差和样本矩的概念并会计算;3、理解统计量的概念,掌握几种常用统计量的分布及其结论;4、理解分位数的概念,会计算几种重要分布的分位数。
【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布,F分布;分位数的理解和计算。
【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。
【学时分配】4学时【授课内容】§6.0 前言前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。
它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。
所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。
其研究方法是归纳法(部分到整体)。
对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。
数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。
§6.1 随机样本一、总体与样本1.总体、个体在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。
例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。
但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。
在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。
在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。
抽样分布
Fn (x)
0
x1
x
2
x
3
x
4
x
5
x
6
图 6.6 经验分布函数
该次抽样中事件{X x} 发生的频率(见
(6-19)式),它完全由样本决定,而样本 是随机的,所以,Fn (x)是随机变量. Fn (x) 的 这种双重性恰好反映了抽样前后不同的统 计观点,请注意领会. 进一步地,根据分布 函数的定义 F(x) P{X x},F(x)是事件{X x}发 生的概率,又nFn (x) 恰是在n次“试验”(抽样) 中事件 {X x} 发生的次数,这样,还有以 下结论:
2
均值与样本方差,S w 是‘合样本’ (X1, X 2, , X ,n1Y1,Y2 ,,Yn2 )
的标准差,定义为
Sw
(n1
1)S12
(n2
1)
S
2 2
n1 n2 2
. (6-28)
生 活 中 的 辛 苦阻挠 不了我 对生活 的热爱 。20.11.1720.11.17Tuesday, November 17, 2020 人 生 得 意 须 尽欢, 莫使金 樽空对 月。01:47:1501:47:1501:4711/17/2020 1:47:15 AM 做 一 枚 螺 丝 钉,那 里需要 那里上 。20.11.1701:47:1501:47Nov-2017-Nov-20 日 复 一 日 的 努力只 为成就 美好的 明天。 01:47:1501:47:1501:47Tuesday, November 17, 2020 安 全 放 在 第 一位, 防微杜 渐。20.11.1720.11.1701:47:1501:47:15November 17, 2020 加 强 自 身 建 设,增 强个人 的休养 。2020年 11月 17日上 午1时47分 20.11.1720.11.17 精 益 求 精 , 追求卓 越,因 为相信 而伟大 。2020年 11月 17日星 期二上 午1时47分 15秒 01:47:1520.11.17 让 自 己 更 加 强大, 更加专 业,这 才能让 自己更 好。2020年 11月 上午 1时47分 20.11.1701:47November 17, 2020 这 些 年 的 努 力就为 了得到 相应的 回报。 2020年 11月17日 星期 二1时47分 15秒 01:47:1517 November 2020 科 学 , 你 是 国力的 灵魂; 同时又 是社会 发展的 标志。 上午1时 47分15秒 上午 1时47分 01:47:1520.11.17 每 天 都 是 美 好的一 天,新 的一天 开启。 20.11.1720.11.1701:4701:47:1501:47:15Nov-20 相 信 命 运 , 让自己 成长, 慢慢的 长大。 2020年 11月17日 星期 二1时47分 15秒 Tuesday, November 17, 2020 爱 情 , 亲 情 ,友情 ,让人 无法割 舍。20.11.172020年 11月 17日 星 期二 1时47分 15秒 20.11.17
正态样本统计量的抽样分布概述
1
2
20
Xi
i1
X
2
35.2
P
1
2
20
Xi
i1
X
2
7.4
P
1
2
20
X
i1
i
X
2
35.2
查表
0.99 0.01 0.98
(P.386)
(2) 20 Xi 2 ~ 2 (20)
i1
故
P 0.37
2
1 20
20
Xi
i1
2
1.76
2
P 7.4
20
i1
Xi
2
35.2
(1)
求
P 0.37
2
1 20
20 i1
Xi
X
2
1.76
2
(2)
求
P 0.37
2
1 20
20 i1
Xi
2
1.76
2
解 (1)
(n
1)S 2
2
~
2(n
1)
即
19S 2
2
1
2
20 i 1
Xi X
2 ~ 2 (19)
故
P
0.37
2
1 20
20
Xi
i1
X
2
1.76
2
P 7.4
但
F0.95 (5, 4) ?
事实上,
F1
(n,
m)
F
1 (m,
n)
故
F0.95 (5,4)
1 F0.05 (4,5)
1 5.19
6.2.常用统计量及抽样分布
1.
(n 1) S 2
2
~ 2 (n 1)
2. X 与 S 2 独立。 定理三 设 X 1 , X 2 , , X n 是来自正态总体N ( , 2 ) 的样本,X 是样
X , S 2 分别是样本均值和样本方差, 则有
X S/ n ~ t (n 1)
定理四 设 X 11,,X 22,,,X nn 与Y11,,Y22,,,,Ynn 是来自正态总体 N ((11,, 1212))和 N Y 是来自正态总体 N 和 设 X X , X 与Y Y 2 ) 和 N ( 2 , 2 ) 的样本,且这两个样本相互独立。设 n 1 1 n1 X i 1 X i , Y i 1 Yi 分别是这两个样本的均值; n2 n1 n 1 1 n1 2 2 2 S2 (Yi Y ) 2 S1 i1 ( X i X ) , n21 1 i 1 n1 1 分别是这两个样本的样本方差, 则有
则称随机变量
[(n1 n 2 ) / 2](n1 / n 2 ) n1 / 2 y ( n1 / 2 ) 1 , y0 ( y ) (n1 / 2)(n 2 / 2)[1 (n1 y / n 2 )]( n1 n2 ) / 2 0, 其它
其图形如右图所示
U / n1 F V / n2 服从自由度为 ((n1 ,,n 22)的2)) 服从自由度为 n1 n )的F 分布,记为 F ~ F n1 n
F (n1 , n 2 ) 分布的概率密度为
2 2 设 U ~ ( n1 ), V ~ (n 2 ), 且U , V 独立,
1 0.357 2.80
二、抽样分布定理
定理一 设 X 1 , X 2 , , X n 是来自正态总体N ( , 2 ) 的样本,X 是样 本,X 是样本均值,则有 X ~ N ( , 2 / n) 定理二 设 X 1 , X 2 , , X n 是来自正态总体N ( , 2 ) 的样本,X 是样 X , S 2 分别是样本均值和样本方差, 则有
概率论与数理统计6.第六章:样本及抽样分布
),
,
,
,
是来
Z=
(
-
证明统计量 Z 服从自由度为 2 的 t 分布。
14
),
,
,
,
是来 , .ຫໍສະໝຸດ 自 总 体 X 的 样 本 , E( ) 则 ,D( )=
是来自总体 X ,D(X)= . ,
,D( )=
11
3. 设 , 本 ,E(X)=
, , 为来自总体 X 的样 ,D(X)=9, 为样本均值 , 试用 < ≥ ,
切比雪夫不等式估计 P{ P{ 4.设 , 则当 K= > ≤ , , . 是总体 X
lim f (t ) (t )
n
1 e 2
t2 2
, x
3.分位点 设 T~t(n), 若对 :0<<1,存在 t(n)>0,
4
满足 P{Tt(n)}=, 则称 t(n)为 t(n)的上侧分位点 注: t1 (n) t (n) 三、F—分布 1.构造 若 1 ~2(n1), 2~2(n2),1, 2 独立,则
y0
2. F—分布的分位点 对于 :0<<1,若存在 F(n1, n2)>0, 满足 P{FF(n1, n2)}=, 则称 F(n1, n2)
5
为 F(n1, n2)的上侧 分位点; 注: F1 (n1 , n2 )
1 F (n2 , n1 )
§ 6.3 正态总体的抽样分布定理
X Y /n ~ t ( n)
t(n)称为自由度为 n 的 t—分布。 t(n) 的概率密度为
n 1 ) 1 t 2 n2 2 f (t ) (1 ) , t n n n ( ) 2 (
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例1 证明 F1(n,m)F(1m,n)
证
P(FF1(n,m))PF1 F1(1n,m)
1PF1F1(1n,m) 1
故
PF1F1(1n,m)
由于1 ~F(m,n) F
因而 F1(1n,m)F(m,n)
例2 证明: [t1 2(n)2]F(1,n)
证 设 X~T(n),X G ,G~N(0,1)
的简单随机样本, 求统 计量
X1X2 X9 Y12 Y22 Y126
所服从的分布.
解 X 1X 2 X 9~N (0 ,9 1)6
3 14(X 1X 2 X 9)~N (0,1)
1 3Y i ~N (0,1),i1,2, ,16
i11613Yi 2 ~2(16)
从而
X1 X2 X9
Y12 Y22 Y126
P7.4 i210Xi23.5 2
P i2 1 0X i 27 .4 P i2 1 0X i 2 3.2 5
0 . 9 0 9 . 0 0 5 2 . 95 7
例5 设X 与Y 相互独立, X ~ N(0,16), Y ~ N(0,9) ,
X1, X2 ,…, X9 与 Y1, Y2 ,…, Y16 分别是取自 X 与 Y
1 3 4
X1
X
2
16 i 1
1 3
Yi
2
X9
~t(16)
16
例7 设 X1,X2, ,Xn是来自正态总体N ( , 2 )
的简单随机样本, X 是样本均值,
S12n11in1(Xi X)2,
S32n11i n1(Xi )2,
S22
1 n
n i1
(Xi
X)2,
S42 n1in1(Xi )2,
概率论与数理统计
课件制作:应用数学系 概率统计课程组
6.2 正态样本统计量的抽样分布
6.2.1 正态分布
6.2.2 2 (n) (卡方)分布
6.2.3 t分布(学生分布)
6.2.4 F分布 6.2.5 正态总体抽样分布的某些结论 6.2.6 Excel实现
确定统计量的分布—— 抽样分布, 是数理统计 的基本问题之一. 采用求随机向量的函数的分布的方 法可得到抽样分布.由于样本容量一般不止 2 或 3 (甚至还可能是随机的), 故计算往往很复杂, 有时还 需要特殊技巧或特殊工具.
为参数为1/2的指数分布.
0.4 0.3 0.2 0.1
2
4
6
8
10
一般地, 自由度为 n 的 2(n) 的密度函数为
f (x)
1 2x n21
e x , n 22 (n2)
其中,
0,
(x) tx1etdt 0
x0 x0
在x > 0 时收敛,称为 函数,具有性质
(x 1) x(x),
(1) 1, (1/ 2)
0,
t0
0.8
0.6
m = 10, n = 4
0.4
m = 10, n = 10
0.2
m = 10, n = 15
1
2
3
4
5
6
0.8
0.6
m = 4, n =10
m = 10, n =10
0.4
m = 15, n =10
0.2
1
2
3
4
5
6
F 分布的性质
1 若 F~F (n,m ),则 1~F (m ,n) F
2 F(n,m)的上 分位 F(数 n,m)有表:可查 P(FF(n,m))
例如 F0.05 ( 4,5) 5. 19 0.6
但
F0.95 (5, 4) ?
0.5 0.4
事实上,
0.3
F1(n,m)F(1m,n)
0.2 0.1
故 F0.95(5,4)F0.015(4,5)5.119
•
123456
则 E (X i) 0 ,D (X i) 1 ,E (X i2) 1
E2(n) E n Xi2n
i1
E(Xi4)
1 2
x4ex22dx3
D (X i2) E (X i4) E 2(X i2) 2
D2(n) D n Xi22n i1
6.2.3 t 分布 (Student 分布)
定义 设X~N(0,1),Y~2(n),X , Y 相互独立,
XY~N(12,n2m 2)
(XY)(1 2) ~N(0,1) 2 2
nm
(n 1 2 )S 1 2~2(n 1 ), (m 1 2 )S 2 2~2(m 1 )
(n 12)S12(m 12)S22 ~2(nm 2)
XY 与 (n 12)S12(m 12)S22 相互独立
(X Y ) (1 2)
(n 1) n! (nN)
0.4
n=2
2 (分n)布
密度函数图
0.3
n=3
0.2
n=5
n = 10
0.1
n = 15
5 10 15 20 25
2 (n) 分布的性质
1 E 2 ( n ) n ,D 2 ( n ) 2 n
2 若X12(n1),X22(n2),X1,X2相互独立
5
6.2.4 F 分布 (F distribution with n and m degrees)
定义 设 X~2(n),Y~2(m),X , Y 相互独立,
令
F X /n
Y /m
则F 所服从的分布称为第一自由度为n ,第二自由度为
m 的F 分布,其密度函数为
f(t,n,m)ΓΓn2nΓ2mm 2m nn2tn211m ntn2m, t0
由于正态总体是最常见的总体, 故本节介绍的 几个抽样分布均对正态总体而言.
6.2.1 正态分布(Normal distribution)
若 X1,X2,,Xn i.~i.d. N(i,i2)
则
n aiXi ~Nn aii, n ai2i2
i1
i1
i1
特别地,
若 X1,X2,,Xn i.~i.d. Xi ~N(,2)
故 P (X 7) 0 1 P (X 7) 0 0 .2n
令
0 .2n 0 .9 查表得 0.2n1.29
即 n4.1 602所以5取 n42
例4 从正态总体 X~N(,2) 中,抽取了
n = 20 的样本 X1,X2,,X20
(1) 求 P 0 .37 2 2 1 i2 0 10 X i X 2 1 .76 2
定义 设 X1,X2,,Xn 相互独立,
且都服从标准正态分布N (0,1),则
n
Xi2 ~ 2(n)
i1
n = 1 时,其密度函数为
f (x)
1 x e , 12 2x
2
0,
1.2
1
0.8
x0 0.6
0.4
0.2
x0
2
4
6
8 10
n = 2 时,其密度函数为
f(x)
1e2 x, 2
0,
x0 x0
PT1.812 05 .95
t0.9(5 1)0 1.8125
P (T
t / 2 )
2
P T t / 2
/2
• -3 -t-2/2
0.35 0.3
0.25 0.2
0.15 0.1
0.05
-1
/2
• 1 t2/2 3
PT2.22810.025
PT2.22810.05 t0.02(510)2.2281
则服从自由度为n - 1的t 分布的随机变量为:
(A) X n1
S1
(C) X n
S3
(B) X n1
S2
(D) X n
S4
解
X
~
N (0,1)
1
2
n
(Xi X)2~
2(n1)
i1
n
X
n
n(n1)(X ) ~t(n1)
1
2
n
(X i
i1
X )2
n
(Xi X)2
i1
n 1
故应选(B)
T
X Y
n
则T 所服从的分布称为自由度为 n 的t 分 布其密度函数为
f(t)Γ nΓ n21n1tn2n21
2
t
0.4
0.3
0.2
n=1
0.1
-3 -2 -1
n=20
1 23
t 分布的图形(红色的是标准正态分布)
t 分布的性质
1°f n(t)是偶函数,
n ,fn(t) (t)1 2et2 2
例8 在总体X~N(12,4)中抽取容量为5的样本X1,X2,…,X5,
求下列概率:
(1 )P (X | 1| 2 1 ); (2 )P (m X 1 , a,X x 5 ) ( 1)5 (;3 )P (m X 1 , i,X n 5 ) (1)0 .
解
(1)因为
X
~ N(12, 4), 所以X 12~ N(0, 1)
1
2
S12
12
S22
~
F (n
1,m 1)
(3)
2 2
若 1 2 则
S12 S22
~F(n1,m1)
设 X1,X2,,Xn是来自正态总体 X~N(1,2)
的一个简单随机样本
Y1,Y2,,Ym 是来自正态总体 Y~N(2,2)
的一个简单随机样本 , 它们相互独立.
则 X1 ni n 1X i~N (1 ,n 2) Ym 1jm 1Y j~N (2,m 2)
的一个简单随机样本