第四章 正态总体的抽样分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

相互独立
2 n 2 2
(n 1) S ( X i ) n( X )
2
i 1
/ n i 1 2 (n 1) S X 2 n Xi 2 2 / n i 1 2 X ~ N ( , n ) Xi ~ N (0,1) X ~ N 2 (n 1) (0,1) 2 ( n) 2 (1) / n n Xi 2 2 ~ ( n) X 2 2 i 1 (1) ~ / n
统计推断中最重要的结论:
设 X1 , X 2 , , Xn 是来自总体 本,则
2 ) X ~ N ( , n
X ~ N ( , ) 的样
2
X1 , X 2 , , Xn 独立同分布 N ( , )
2

由正态分布的性质知,线性组合
X n ( X1 X 2 X n )
1
仍服从正态分布 ,且
2 E ( X ) , D( X ) n
2 ) X ~ N ( , n
设 X1 , X 2 , , Xn 是总体 X ~ N ( , 2 ) 的样本, 2 X , S 分别为样本均值和样本方差,则有
(n 1)S
2
2
X,S
2
2 ~ (n 1)
n1 1 2
F 分布是为了纪念著890-1962)而命名 x O 2. 0 1 .0
X ~ N ( , 2 )
如何由样本 X1 , X 2 , , X n推断 , 2
对 , 2的推断是通过构造统计量实现的
g( 如何构造“好”的统计量X1 , X 2 , , X n ) ? g ( X1 , X 2 , , X n )服从什么分布?
2 2
2 2
( n )
F
2 2 ~ (n1 ), V ~ (n2 ) ,且 U , V 相互独立,令 U / n1 F V / n2 称 F 服从自由度为 (n1, n 2) 的 F 分布,记为 F ~ F (n1, n 2 ) .
设U
F
x Γ [(n1 n2 ) / 2] n n1 / 2 n n2 / 2 ,x 0 1 2 n1 n2 f ( x) Γ (n1 / 2) Γ (n2 / 2) (n1 x n2 ) 2 0 , x0 f ( x) F F (10,50) 1 若 F ~ F (n1, n 2 ) , 则 ~ F (n 2, n1) F F (10, 4)
e
x 2 2
,
x
正态分布函数的性质
1. 2.
图形是关于x=对称钟形曲线,且峰值在x= 处 均值和标准差一旦确定,分布的具体形式也惟一确 定,不同参数正态分布构成一个完整的“正态分布族” 均值 可取实数轴上的任意数值,决定正态曲线的具 体位置;标准差决定曲线的“陡峭”或“扁平”程度。 越大,正态曲线扁平;越小,正态曲线越高陡峭 当 X 的取值向横轴左右两个方向无限延伸时,曲线的 两个尾端也无限渐近横轴,理论上永远不会与之相交 正态随机变量在特定区间上的取值概率由正态曲线下 的面积给出,而且其曲线下的总面积等于1
(例题分析)
现从总体中抽取n=2的简单随机样本,在重复抽 样条件下,共有42=16个样本。所有样本的结果为
所有可能的n
第一个 观察值 1 2 3 4 1 1,1 2,1 3,1 4,1
= 2 的样本(共16个)
第二个观察值 2 1,2 2,2 3,2 4,2 3 1,3 2,3 3,3 4,3 4 1,4 2,4 3,4 4,4
P(x)
0.3
0.2 0.1 0 1.0 1.5 2.0 2.5 3.0 3.5 4.0
值 1
2 3 4
样本均值的抽样分布
x
样本均值的分布与总体分布的比 较 (例题分析)
总体分布
.3 P(x)
抽样分布
.3 .2 .1 0
.2 .1 0
1
2
3
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0


t
x 2 ( n 1) / 2 f ( x) , x 1+ n n Γ (n / 2) 英国统计学家兼化学家戈塞特 (Gosset W S 1876-1937 ) Γ [(n 1) / 2]
利用伽马函数 于1908年用笔名Student ) 易知: f ( x) f ( x) (n 发表了关于 t 分布的论文,这是 f ( x ) N ( 0,1) 随着自由度的 x t (9) 的斯特林公式 (x 0) 一篇在统计学发展史上划时代的文章,它创立了小样本代 1 f ( x) 0 增加曲线越来 e 2 替大样本的方法,开创了现代统计学的新纪元. t ( 2) f ( x) 0 越趋近 N ( 0,1 ) (x 0) 即 Gosset,f (Student( x) 1 e x ( x ),故取名为“t 的最后一个字母都是t lim x) 0 f lim x n 2 分布”,又称为“学生氏分布”.3 2 1 O 1 2 3 4 5 x 5 4 lim f ( x) 0 n x较大时,可认为 t (n) N (0,1) (n 45) 故当
x
x
中心极限定理
(central limit theorem)
x 的分布趋 于正态分布 的过程
二、样本比例的抽样分布
1.
在重复选取容量为n的样本时,由样本比 例的所有可能取值形成的相对频数分布
一种理论概率分布 当样本容量很大时,样本比例的抽样分布 可用正态分布近似,即
(1 ) p ~ N , n
2
Y1 Y 2 Yn 2
2 (n1 ), 2 E ( 22(n), 且 2 ) 2n 2 ), 则 ~ ) 2 n, n / 2( 12 ,/22 D 1 y 2 设 12 ~ 理解为可独立变化的r.v个数相互独立, 则 1 y e ,y0 n/2 2 2 n / 2) 2 Γ ( y ) 2 ( ~ ( 1) n ) 1 取 nf 个独立同分布 N (0,n1 的 r.v X1 , X 2 , , Xn 2 2 2 2 2 0 y0 X 2与 2X 2 Xn X 2 同分布 ,,于是 X2 1 X 则 n 1 2 n n n n f ( y2 ) 随着自由度的 2 2 2 2 2 2 , n 2, X 且 1 D( , 2 1 n X ) , , ) Y E 设(i )~E1.(2)X ii2 )21, E (,2ki, Y12 Y22 2X i k2 相互独立, 0 4ni 0x zX1 X 2 n Γ ( z ) x ei 1dx (n 0) n z 1i 1 i 1 i 1 增加曲线重心 0 则 0 n .30 n 4 2 2 2 ) 2D( 2i2 ) nD(2X 12) 62 n{E ( X14 )向右下方移动 20 E) D( X ~ n n [n ( X1 )] } 0 n . (
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 体的均值、方差及分布如下 总体分布
.3
均值和方差
x

i 1
N
i
.2 .1 0
1 2 3 4
2.5
2
N
( xi )

2 i 1
N
1.25 N
样本均值的抽样分布
x
= 2.5
σ2 =1.25
x 2.5
x 0.625
2
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的期 望值为μ,方差为σ2/n。即x~N(μ,σ2/n)
=10
n=4
x 5
n =16
来自一般正态总体的抽样分布 五个抽样分布定理
2

X1 , X 2 , , Xn 是来自总体 X ~ N ( 0 , 1 ) 的样本,令
2 2 2 X12 X 2 X n 2 称 服从自由度为 n 的 2 分布,记为 2 ~ 2 (n) . 2 2 2
x 2.5
= 50
X
x 50
x
总体分布
抽样分布
中心极限定理
(central limit theorem)
从均值为,方差为 2的一个任意总体中抽取容量为n的 样本,当n充分大时,样本均值的抽样分布近似服从均 值为μ、方差为σ2/n的正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
样本均值的抽样分布
(例题分析)
计算出各样本的均值,如下表。并给出样本均 值的抽样分布
16个样本的均值(x) 第一 第二个观察值 个 观察 1 1.0 1.5 2.0 2.5 2 1.5 2.0 2.5 3.0 3 2.0 2.5 3.0 3.5 4 2.5 3.0 3.5 4.0
3.
4.
5.
和 对正态曲线的影响
f(x)
=1/2
=1
B
A
C
1

x
第一节 抽样分布的概念
一 样本均值的抽样分布
样本均值的抽样分布
1.
在重复选取容量为n的样本时,由样本均 值的所有可能取值形成的相对频数分布
一种理论概率分布 推断总体均值的理论基础
2. 3.
样本均值的抽样分布
(例题分析)
第四章 正态总体的抽样分布
正态分布
(normal distribution)
1.
由C.F.高斯(Carl Friedrich Gauss,1777—1855)作为 描述误差相对频数分布的模型而提出
描述连续型随机变量的最重要的分布
2. 3. 4. 5.
许多现象都可以由正态分布来描述
可用于近似离散型随机变量的分布
1 1 2
1 i 1
2
k
1 n 2 11
k
n(
0.10 O

x4
1 2
1 e 3 4 2 5
x 2
2
dx 1) n(3 1) y2n
6 7 8 9 10 11 1213 14 15
t
2 X ~ N (0,1), Y ~ (n) ,且 X , Y 相互独立,令 X t Y /n t 服从自由度为 n 的 t 分布,记为 t ~ t (n) .
2. 3.
4.
第二节
正态分布及其三大统计量抽样分布
X1 , X 2 , , Xn
包含了各种有用信息 集中、提炼数据中 包含的有用信息
g ( X1 , X 2 , , Xn )
它们是随机变量, 必须确定其分布,称 为抽样分布 来自标准正态总体的抽样分布 2 分布 , t 分布 , F 分布

例如: 二项分布
经典统计推断的基础
f (x)
x
概率密度函数
f ( x) 1
2 1 2
2π f(x) = 随机变量 X 的频数 = 正态随机变量X的均值 = 正态随机变量X的方差 = 3.1415926; e = 2.71828 x = 随机变量的取值 (- < x < +)

n
Xi
2


2

X
2

2
设 X1 , X 2 , , Xn 是总体 X ~ N ( , 2 ) 的样本, 2 X , S 分别为样本均值和样本方差,则有
X S/ n
2
~ t (n 1)

2 (n 1) S 2 2 (n 1)S 2 (n 1) Y ~ (n( 0 , 1) , 2 N 1)S ~ 2 n E 2 n 1, D 2 2(n 1) / 2 独立,由 t 分布的定义有 2 4 2 2 2 Y与 E ( S ) , D( S )
相关文档
最新文档