第6章抽样与抽样分布
合集下载
统计学第6章统计量及其抽样分布
整理ppt
16
2. T统计量
设X1,X2,…,Xn是来自正态总体N~ (μ,σ2 )
n
的一个样本,
X
1 n
n i 1
Xi
(Xi X )2 s 2 i1
n 1
则 T(X) ~t(n1)
S/ n
称为T统计量,它服从自由度为(n-1)的t分布。
整理ppt
17
F分布
定义:设随机变量Y与Z相互独立,且Y和Z分别服 从自由度为m和n的c2分布,随机变量X有如下表达式:
整理ppt
8
中心极限定理
设从均值为,方差为2的一个任意总 体中抽取容量为n的样本,当n充分大时, 样本均值的抽样分布近似服从均值为μ、 方差为σ2/n的正态分布。
当样本容量足够大时
(n≥30),样本均值的抽样
分布逐渐趋于正态分布
整理ppt
9
标准误差
标准误差:样本统计量与总体参数之间的平均差异
1. 所有可能的样本均值的标准差,测度所有样本 均值的离散程度
因此,估计这100名患者治愈成功的比 例在85%至95%的概率为90.5%
整理ppt
22
6.5 两个样本平均值之差的分布
设
X
1
是独立地抽自总体
X1 ~N(1,12)
的一个容量
为n1的样本的均值。 X 2 是独立地抽自总体
X2 ~N(2,22)的一个容量为n2的样本的均值,则有
E (X 1X 2)E (X 1) E (X 2)12
2. 样本均值的标准误差小于总体标准差
3. 计算公式为
x
n
整理ppt
10
【例】设从一个均值μ=8、标准差σ=0.7的总 体中随机抽取容量为n=49的样本。要求:
第6章-统计量及其抽样分布
2、计算出每个样本的统计量值; 3、将来自不同样本的不同统计量值分组排列,把
对应于每个数值的相对出现频数排成另一列, 由此,全部可能的样本统计量值形成了一个概 率分布,这个分布就是我们想要得到的抽样分 布。
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
所有样本均值的均值和1.0 1.5 4.0 16
2.5 m
n
(xi mx )2
s
2 x
i 1
M
M为样本数目
(1.0 2.5)2
(4.0 2.5)2
s2
0.625
16
n
1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n
从检查一部分得知全体。
复习 抽样方法
抽样方式
概率抽样
非概率抽样
简单随机抽样 整群抽样
多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
6.2.1 抽样分布 (sampling distribution)
1. 样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有可 能取值形成的相对频数分布
2. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远而稳定的信息,是进行推 断的理论基础,也是抽样推断科学性的重要依据
抽样分布的形成过程 (sampling
distribution)
对应于每个数值的相对出现频数排成另一列, 由此,全部可能的样本统计量值形成了一个概 率分布,这个分布就是我们想要得到的抽样分 布。
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
所有样本均值的均值和1.0 1.5 4.0 16
2.5 m
n
(xi mx )2
s
2 x
i 1
M
M为样本数目
(1.0 2.5)2
(4.0 2.5)2
s2
0.625
16
n
1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n
从检查一部分得知全体。
复习 抽样方法
抽样方式
概率抽样
非概率抽样
简单随机抽样 整群抽样
多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
6.2.1 抽样分布 (sampling distribution)
1. 样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有可 能取值形成的相对频数分布
2. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远而稳定的信息,是进行推 断的理论基础,也是抽样推断科学性的重要依据
抽样分布的形成过程 (sampling
distribution)
社会研究方法 第6章
整群抽样
不同子群
子群抽取
整群抽样
优点:简便易行,节省费用 扩大抽样应用范围
缺点: 样本分布不广, 代表性相对较差
适用对象: 总体的不同子群之间差别不大, 而每个子群内部差异较大
五、多段抽样
按抽样元素的隶属、层级关系把抽样过程分为 几个阶段进行:先从总体中随机抽取几个大群, 然后再从这几个大群内随机抽取几个小群,这 样一级级抽下去直到抽到最基本的元素为止。
第六章 抽样
第一节 抽样的意义与作用 第二节 概率抽样的原理与程序 第三节 概率抽样方法 第四节 户内抽样与PPS抽样 第五节 非概率抽样方法 第六节 样本规模与抽样误差
第一节 抽样意义与作用
一、抽样的概念
(1)总体(population):构成它的所有元素的 集合,用“ N ”表示。
(2)元素(element):构成总体的最基本单位。
出总体内在结构的变量作为分层变量。 c:以那些已有明显层次区分的变量作为分层变量 (2)分层的比例 a:按比例分层抽样 b:不按比例分层抽样
按比例分层抽样
分层
学生
1200
女生1000 (5/6)
男生200 (1/6)
抽 样(120人)
100人 5/6
样 本 20人 1/6 120
按各种类型或层次中单位数目同总体单位数目间 的比例来抽取子样本的方法。可以确保得到一个 与总体结构完全一样的样本。
样本规模的计算
简单随机抽样中样本规模的计算 置信水平对应的临界值
➢
推论总体均值
:
n
t2
e2
பைடு நூலகம்
2
总体的标准差 允许的抽样误差
推论总体成数:
t 2 p(1 p)
概率论 第六章 样本及抽样分布
函数Fn(x)为 Fn(x)=S(x)/n , -∞<x< +∞。
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.
统计学第六章抽样和抽样分布
2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布
江西财经大学统计学课件第六章抽样分布
第六章 抽样和抽样分布
STAT
[例]某养猪场共有存栏生猪10万头,现欲了解这批生猪的平均 毛重及健康比例。调查者按随机原则从中抽取了100头生猪进行 调查,以计算其平均毛重和健康比例。
(一)总体参数:反映总体特征的变量。
X P N 1 2 (X )2
N
N
N
(二)样本统计量:反映样本特征的变量。任何样本的函数, 只要不包含总体的未知参数,都称为统计量。样本的随机性决 定统计量的随机性(统计量是随机变量)。
x1
x1 E(x)
N n x2 E(x) x2 E(x)xi E(x) ?
x 总 总个 离 = 数 差 [xi M E(x)]
理论公 x 式 [xi: M E(x)2 ]
第六章 抽样和抽样分布
STAT
[计算] N=3人,(A,B,C)=(1,2,3) n=2
x
[xi
E(x)]0 M
STAT
5. 抽样分布:样本统计量的所有可能取值及其出现概率的分
布。 →理论分布
抽样分布的形成:
样本及样本平均数
抽样分布的影响因素:总体分布、 样 本
样本容量、抽样方法、抽样组织形
A ,A
式、统计量构造
A,B A,C
B ,A
[例] n=2,计算样本平均年龄。
B ,B
样本平均年龄的抽样分布
B ,C C ,A
x 1 1.5 2 2.5 3
C ,B
P 1/9 2/9 3/9 2/9 1/9 C , C
x
x
1, 1 1
1 , 2 1 .5
1, 3 2
2 , 1 1 .5
2, 2 2
2 , 3 2 .5
3, 1 2
STAT
[例]某养猪场共有存栏生猪10万头,现欲了解这批生猪的平均 毛重及健康比例。调查者按随机原则从中抽取了100头生猪进行 调查,以计算其平均毛重和健康比例。
(一)总体参数:反映总体特征的变量。
X P N 1 2 (X )2
N
N
N
(二)样本统计量:反映样本特征的变量。任何样本的函数, 只要不包含总体的未知参数,都称为统计量。样本的随机性决 定统计量的随机性(统计量是随机变量)。
x1
x1 E(x)
N n x2 E(x) x2 E(x)xi E(x) ?
x 总 总个 离 = 数 差 [xi M E(x)]
理论公 x 式 [xi: M E(x)2 ]
第六章 抽样和抽样分布
STAT
[计算] N=3人,(A,B,C)=(1,2,3) n=2
x
[xi
E(x)]0 M
STAT
5. 抽样分布:样本统计量的所有可能取值及其出现概率的分
布。 →理论分布
抽样分布的形成:
样本及样本平均数
抽样分布的影响因素:总体分布、 样 本
样本容量、抽样方法、抽样组织形
A ,A
式、统计量构造
A,B A,C
B ,A
[例] n=2,计算样本平均年龄。
B ,B
样本平均年龄的抽样分布
B ,C C ,A
x 1 1.5 2 2.5 3
C ,B
P 1/9 2/9 3/9 2/9 1/9 C , C
x
x
1, 1 1
1 , 2 1 .5
1, 3 2
2 , 1 1 .5
2, 2 2
2 , 3 2 .5
3, 1 2
第6章 抽样调查(1)
33
1、由于总体单位总数未 知,因此采用重复抽样 公式。又总体标 准差未知,采用过去资 料最大标准差作为估计 值。
x
n
0.12 0.0219 (升) 30
n1 30 2 2、合格率p 93.3% n 30 S P p(1 p) 93.3% (1 93.3%) 6.25%
根据质量标 准,使用寿 命800小时及 以上者为合 格品,计算 产品平均合 格率和标准 差。
14
全及指标
X XF X N F
P N1 N
X
2
( X X )2
N
( X X )2 F F
X
(X X )
N
2
(X X ) F F
2
P 2 P(1 P)
31
例 上题中,如果寿命低于9000小时的产品是不合格品,计 算不合格率(合格率)的抽样平均误差。
不合格率:
n1 90 x p 18% n 500
Sp
p(1 p)
Sp
0.18 (1 0.18) 38.4%
重复抽样下:
p
p
Sp n
0.384 1.7% n 500
3
特 点
遵循随机原则抽取部分单位 ;
用样本推断总体;
会产生抽样误差,但误差可以计算和控制。
4
随机原则的实现
统 计 学 概 论
是将总体中每个单位的编号写在外形完全 一致的签上,将其搅拌均匀,从中任意抽 抽签法 选,签上的号码所对应的单位就是样本单 位。 将总体中每个单位编上号码,然后使 用随机数表,查出所要抽取的调查单 随机数表法 位。
概率论与数理统计-第六章
大街上随机抽取200人,进行调查。记录了
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi
i 1, 2,
,n
,n
于是 (
) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi
i 1, 2,
,n
,n
于是 (
) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2
概率论与数理统计第6章
以分组区间为底,以
Yj
Wj X j1 X j
Wj 5
为高
作频率直方图
23
从频率直方图可看到:靠近两个极端的数据出现比 较少,而中间附近的数据比较多,即中间大两头小的分 布趋势,——随机变量分布状况的最粗略的信息。
在频率直方图中, 每个矩形面积恰好等于样本值 落在该矩形对应的分组区间内的频率,即
S j
Wj X j1
Xj
X j1 X j
Wj
频率直方图中的小矩形的面积近似地反映了样本数
据落在某个区间内的可能性大小,故它可近似描述X的
分布状况。
24
12
第二.计算样本特征数
1.反映集中趋势的特征数:样本均值、中位数、众数等 样本均值MEAN 中位数MEDIAN 众数
X 90.3
91
91, 94
代表性——即子样( X1, X2 ,
,
X
)的每个分量
n
X
与
i
总体 X 具有相同的概率分布。
独立性——即 X1, X2, , Xn 是相互独立的随机变量。
满足上述两点要求的子样称为简单随机子样.获得简 单随机子样的抽样方法叫简单随机抽样.
从简单随机子样的含义可知,样本 X1, X2 , , Xn 是来自总体 X、与总体 X具有相同分布的随机变量.
2分布 t 分布 数理统计的三大分布(都是连续型). F分布 它们都与正态分布有密切的联系.
在本章中特别要求掌握对正态分布、 2分布、 t分布、F分布的一些结论的熟练运用. 它们
是后面各章的基础.
31
一、 2分布
定义 设总体 X ~ N 0,1 , X1, X2,..., Xn 是 X
第六章样本及抽样分布
n
(
Xi
)2
,
i 1
max{ X i }
1i n
为什么要求统计量不含任何未知参数
试验前 g(X1, X2 ,是, 随Xn机) 变量 试验后 g(X1, X2 ,是, 具Xn体) 的数值
与均值和方差 有什么不同?
X
1
n
n
i 1
Xi
为什么不是
1 n
(下章说明)
S2
1
n1
n
(Xi
i 1
X
)2
S
S2
6, 故Q0.75
Q3
1 2
(123
132)
127.5
Min 102, Max 150,作出箱线图如图所示
102 113.5 120
120 150
分布的形状与箱线图
QL 中位数 QU
QL 中位数 QU
QL 中位数 QU
左偏分布
对称分布
不同分布的箱线图
右偏分布
箱线图适合比较两个或两个以上数据集的性质
一 直方图
为了研究总体分布的性质,人们通过实验得到许 多观测值,一般来说这些数据实杂乱无章的,为了利 用它们进行统计分析,将这些数据加以整理,还借助 于表格或图形对它们加以描述。
例1:下面列出了84个伊特拉斯坎(Etruscan)人男子的 头颅的最大宽度(mm),现在来画这些数据的“频率直 方图”
1 2 3 4 5 6 7 8 9 10 11
76 90 97 71 70 93 86 83 78 85 81 65 95 51 74 78 63 91 82 75 71 55 93 81 76 88 66 79 83 92 78 86 78 74 87 85 69 90 80 77 84 91 74 70 68 75 70 84 73 60 76 81 88 68 75 70 73 92 65 78 87 90 70 66 79 68 55 91 68 73 84 81 70 69 94 62 71 85 78 81 95 70 67 82 72 80 81 77
概率论第六章样本及抽样分布
2 1 2 2
本相互独立,记
1 n1 X Xi n1 i 1 1 n2 Y Yi n2 i 1
则有 ⑴
2 1 2 2 2 1 2 2
1 n1 S12 ( X k X )2 n1 1 k 1 1 n2 2 S2 (Yk Y ) 2 n2 1 k 1
S / ~ F (n1 1, n2 1) S /
⑵ 当 时
2 1 2 2 2
X Y ( 1 2 ) ~ N (0,1) 1 1 n1 n2
(n1 1) S12
2 1
2 (n2 1) S2
2 2
~ 2 (n1 n2 2)
X Y ( 1 2 ) ~ t (n1 n2 2) 1 1 S n1 n2
2
又因为
(n 1)S 2
2
~ (n 1)
2
X n1 X n
故 Y
(n 1) S 2
n n 1 ~ t (n 1) /(n 1)
2
X n1 X n Y S
n ~ t (n 1) n 1
例4
设总体X , Y 相互独立 X ~ N (0,32 ) , Y ~ N (0,32 ) ,
2
X n1 X n n X 1 , X 2 ,, X n , X n1 , 求 Y 的分布 . S n 1 1 n 1 n 2 2 其中 X n X i , S ( Xi X n ) n i 1 n 1 i 1
1 2 解 由已知得 X n1 ~ N ( , ) , X n ~ N ( , ) , n n 1 2 所以 X n1 X n ~ N (0, ) n n 标准化得 X n1 X n ~ N (0,1) n 1
本相互独立,记
1 n1 X Xi n1 i 1 1 n2 Y Yi n2 i 1
则有 ⑴
2 1 2 2 2 1 2 2
1 n1 S12 ( X k X )2 n1 1 k 1 1 n2 2 S2 (Yk Y ) 2 n2 1 k 1
S / ~ F (n1 1, n2 1) S /
⑵ 当 时
2 1 2 2 2
X Y ( 1 2 ) ~ N (0,1) 1 1 n1 n2
(n1 1) S12
2 1
2 (n2 1) S2
2 2
~ 2 (n1 n2 2)
X Y ( 1 2 ) ~ t (n1 n2 2) 1 1 S n1 n2
2
又因为
(n 1)S 2
2
~ (n 1)
2
X n1 X n
故 Y
(n 1) S 2
n n 1 ~ t (n 1) /(n 1)
2
X n1 X n Y S
n ~ t (n 1) n 1
例4
设总体X , Y 相互独立 X ~ N (0,32 ) , Y ~ N (0,32 ) ,
2
X n1 X n n X 1 , X 2 ,, X n , X n1 , 求 Y 的分布 . S n 1 1 n 1 n 2 2 其中 X n X i , S ( Xi X n ) n i 1 n 1 i 1
1 2 解 由已知得 X n1 ~ N ( , ) , X n ~ N ( , ) , n n 1 2 所以 X n1 X n ~ N (0, ) n n 标准化得 X n1 X n ~ N (0,1) n 1
西南财经大学向蓉美、王青华《统计学》第三版——第6章:抽样及抽样分布
ch6统计量与抽样分布
§6.1 总体与样本的统计分布
§6.1.1 统计推断中 的总体及总体分布
研究的标志
组成元素 具体对象
组成元素
变量的具体 取值
§3.1 总体与样本
实物总体
数字总体
例:班级同学的成绩
班级同学的集合 (全体同学)
同学成绩的集合
组成元素:每位同学
组成元素:成绩分数
在统计推断中,我们感兴趣的是总体单位的某个或某些数 量特征。例如研究某种型号灯泡的寿命这一数量特征。总体的 含义是所感兴趣变量的所有取值。
T (x1, x2 ,..., xn ) 统计值
统计量既然是随机变量的函数,那么它也应该
是随机变量,并有其概率分布,统计量的分布也 称为抽样分布。抽样分布和统计推断有着密切的
联系。统计量提出以后,必须要知道其分布才能在 统计推断中使用,因为只有知道了统计量的分布, 才能利用概率论对总体的特征进行推断,并得到相 应的推断的置信度。所以在统计推断中,一项重要 的工作就是寻找统计量和导出统计量的分布。
不是 T6
1
2
( X12
X 22
.
X
2 3
)
【例6-1】总体X服从两点分布,概率分布律如下:
P(X 1) p P(X 0) 1 p
从总体中抽取容量为n的样本,求统计量T
n
Xi
的分布。
i 1
解:其取值是0到n之间的所有整数,其分布是二项分布:
P(T k) Cnk pk (1 p)nk k 0,1, 2,..., n
这样得到的X1, X2,…, Xn 称为来自总体X的一个 简单随机样本,n为这个样本的容量。
n次观察一经完成,我们就得到一组实数x1,
§6.1 总体与样本的统计分布
§6.1.1 统计推断中 的总体及总体分布
研究的标志
组成元素 具体对象
组成元素
变量的具体 取值
§3.1 总体与样本
实物总体
数字总体
例:班级同学的成绩
班级同学的集合 (全体同学)
同学成绩的集合
组成元素:每位同学
组成元素:成绩分数
在统计推断中,我们感兴趣的是总体单位的某个或某些数 量特征。例如研究某种型号灯泡的寿命这一数量特征。总体的 含义是所感兴趣变量的所有取值。
T (x1, x2 ,..., xn ) 统计值
统计量既然是随机变量的函数,那么它也应该
是随机变量,并有其概率分布,统计量的分布也 称为抽样分布。抽样分布和统计推断有着密切的
联系。统计量提出以后,必须要知道其分布才能在 统计推断中使用,因为只有知道了统计量的分布, 才能利用概率论对总体的特征进行推断,并得到相 应的推断的置信度。所以在统计推断中,一项重要 的工作就是寻找统计量和导出统计量的分布。
不是 T6
1
2
( X12
X 22
.
X
2 3
)
【例6-1】总体X服从两点分布,概率分布律如下:
P(X 1) p P(X 0) 1 p
从总体中抽取容量为n的样本,求统计量T
n
Xi
的分布。
i 1
解:其取值是0到n之间的所有整数,其分布是二项分布:
P(T k) Cnk pk (1 p)nk k 0,1, 2,..., n
这样得到的X1, X2,…, Xn 称为来自总体X的一个 简单随机样本,n为这个样本的容量。
n次观察一经完成,我们就得到一组实数x1,
第6章-样本及抽样分布
X
k i
样本 k 阶中心矩
Bk
1 n
n i 1
(Xi
X )k,
§2 抽样分布
统计量旳分布称为抽样分布。数理统计中 常用到如下三个分布:
2分布、 t 分布和F分布。
一、 2分布
iid
n
1. 构造 设 X1,, X n ~ N (0,1), 则 2
X
2 i
~
2 (n).
i 1
称为自由度为n的 2 分布.
h(
y)
(
n1
2
n
2
)(n1
/
(
n1 2
)(
n2 2
)(1
0,
n2
n1 n2
) y n1 / 2
n1 1 2
,
y)(n1 n2 ) / 2
y0
y0
2. F分布旳分位点
对于:0<<1,
若存在F(n1, n2)>0 ,满足
P{FF(n1, n2)}=,
则称F(n1, n2)为
F(n1, n2)旳上侧分
位点;
P447附表5
F (n1, n2 )
注:
F1
(n1, n2 )
F
1 (n2 , n1)
证明:
设F~F(n1,n2), 则
1 F
~
F (n2 , n1)
P{F F1 (n1, n2 )} 1
P{ 1 1 } 1
F F1 (n1, n2 )
P{ 1 1 }
F F1 (n1, n2 )
4.性质:
(1)分布可加性 若X ~ 2(n1),Y~ 2(n2 ),X,Y 独立,则X + Y ~ 2(n1+n2 ) (2)期望与方差 若X~ 2(n),则
第六章 抽样分布及总体平均数的估计
假设与假设检验 1、什么是假设?
• 对总体参数的一种看法 总体参数包括总体均值、比例、方差等 分析之前必需陈述
三 假设检验的基本原理
2、什么是假设检验?
1)概念 事先对总体参数或分布形式作出某种假设, 然后利用样本 信息来判断原假设是否成立。 2) 类型 参数假设检验 非参数假设检验 3)特点 采用逻辑上的反证法 依据统计上的小概率原理
二 总体平均数的估计
(3)区间估计(interval estimation)
根据估计量以一定可靠程度推断总体参数所在的区间 范围,用数轴上一段距离表示未知参数可能落入的范围, 虽不具体指出总体参数等于什么,但能指出未知总体参数 落入某一区间的概率有多大。
(4)置信区间(confidence interval)
一 抽样分布与平均数抽样分布
3、样本平均数与总体平均数离差的形态
(2)总体方差未知 总体正态,样本平均数与总体平均数的离差统 计量呈 t 分布; 总体非正态,但满足n>30这一条件,样本平均 数与总体平均数的离差统计量 近似t 分布。
t分布
t 分布(t-distribution)是统计分析中应用较多 的一种随机变量函数的分布,是统计学者高赛特 1908年以笔名“Student”发表的论文中推导出来 的一种分布,又叫学生氏分布。这种分布是一种 左右对称,峰态比较高狭,分布形状随样本容量 n-1的变化而变化的一组分布。
二 总体平均数的估计
4 总体方差σ2未知时,总体平均数μ的估计 用样本的无偏方差作为总体方差的估计值,样本 平均数的分布为t分布,应查t值表,包括以下两 种情况:
(1)总体的分布为正态时,可不管n值大小。 (2)总体分布为非正态,只有n>30,才能用概率对其样本 分布进行解释。
• 对总体参数的一种看法 总体参数包括总体均值、比例、方差等 分析之前必需陈述
三 假设检验的基本原理
2、什么是假设检验?
1)概念 事先对总体参数或分布形式作出某种假设, 然后利用样本 信息来判断原假设是否成立。 2) 类型 参数假设检验 非参数假设检验 3)特点 采用逻辑上的反证法 依据统计上的小概率原理
二 总体平均数的估计
(3)区间估计(interval estimation)
根据估计量以一定可靠程度推断总体参数所在的区间 范围,用数轴上一段距离表示未知参数可能落入的范围, 虽不具体指出总体参数等于什么,但能指出未知总体参数 落入某一区间的概率有多大。
(4)置信区间(confidence interval)
一 抽样分布与平均数抽样分布
3、样本平均数与总体平均数离差的形态
(2)总体方差未知 总体正态,样本平均数与总体平均数的离差统 计量呈 t 分布; 总体非正态,但满足n>30这一条件,样本平均 数与总体平均数的离差统计量 近似t 分布。
t分布
t 分布(t-distribution)是统计分析中应用较多 的一种随机变量函数的分布,是统计学者高赛特 1908年以笔名“Student”发表的论文中推导出来 的一种分布,又叫学生氏分布。这种分布是一种 左右对称,峰态比较高狭,分布形状随样本容量 n-1的变化而变化的一组分布。
二 总体平均数的估计
4 总体方差σ2未知时,总体平均数μ的估计 用样本的无偏方差作为总体方差的估计值,样本 平均数的分布为t分布,应查t值表,包括以下两 种情况:
(1)总体的分布为正态时,可不管n值大小。 (2)总体分布为非正态,只有n>30,才能用概率对其样本 分布进行解释。
第6章 抽样与抽样分布
6 -71- 4 71-
统计学
STATISTICS
统计应用
“抓阄”征兵计划 抓阄”
然而结果是, 73 个较小的号码被分配给了前半 然而结果是 , 有 73个较小的号码被分配给了前半 年的日子,同时有110个较小的号码被分配给了后 年的日子,同时有110个较小的号码被分配给了后 半年的日子。 换句话说, 半年的日子 。 换句话说 , 如果你生于后半年的某 一天, 那么, 一天 , 那么 , 你因为被分配给一个较小号码而去 服兵役的机会要大于生于前半年的人 在这种情况下, 在这种情况下 , 两个数字之间只应该有随机误差 ,而73和110之间的差别超出了随机性所能解释的 73和110之间的差别超出了随机性所能解释的 范围。 范围 。 这种非随机性是由于乒乓球在被抽取之前 没有被充分搅拌造成的。 在第二年, 没有被充分搅拌造成的 。 在第二年 , 主管这件事 的部门在抓阄之前去咨询了统计学家( 的部门在抓阄之前去咨询了统计学家 ( 这可能使生 于后半年的人感觉稍微舒服些) 于后半年的人感觉稍微舒服些)
6 -71- 5 71-
统计学
STATISTICS
第 6 章 抽样与抽样分布
6.1 概率抽样方法 6.2 三种不同性质的分布 6.3 一个总体参数推断时样本统计量的抽样 分布 6.4 两个总体参数推断时样本统计量的抽样 分布
6 -71- 6 71-
统计学
STATISTICS
学习目标
1. 2. 3. 4. 5.
6 -71- 14 71-
用Excel对分类数据抽样 Excel对分类数据抽样
统计学
STATISTICS
简单随机抽样
(用Excel对数值型数据随机抽样) Excel对数值型数据随机抽样 对数值型数据随机抽样)
统计学
STATISTICS
统计应用
“抓阄”征兵计划 抓阄”
然而结果是, 73 个较小的号码被分配给了前半 然而结果是 , 有 73个较小的号码被分配给了前半 年的日子,同时有110个较小的号码被分配给了后 年的日子,同时有110个较小的号码被分配给了后 半年的日子。 换句话说, 半年的日子 。 换句话说 , 如果你生于后半年的某 一天, 那么, 一天 , 那么 , 你因为被分配给一个较小号码而去 服兵役的机会要大于生于前半年的人 在这种情况下, 在这种情况下 , 两个数字之间只应该有随机误差 ,而73和110之间的差别超出了随机性所能解释的 73和110之间的差别超出了随机性所能解释的 范围。 范围 。 这种非随机性是由于乒乓球在被抽取之前 没有被充分搅拌造成的。 在第二年, 没有被充分搅拌造成的 。 在第二年 , 主管这件事 的部门在抓阄之前去咨询了统计学家( 的部门在抓阄之前去咨询了统计学家 ( 这可能使生 于后半年的人感觉稍微舒服些) 于后半年的人感觉稍微舒服些)
6 -71- 5 71-
统计学
STATISTICS
第 6 章 抽样与抽样分布
6.1 概率抽样方法 6.2 三种不同性质的分布 6.3 一个总体参数推断时样本统计量的抽样 分布 6.4 两个总体参数推断时样本统计量的抽样 分布
6 -71- 6 71-
统计学
STATISTICS
学习目标
1. 2. 3. 4. 5.
6 -71- 14 71-
用Excel对分类数据抽样 Excel对分类数据抽样
统计学
STATISTICS
简单随机抽样
(用Excel对数值型数据随机抽样) Excel对数值型数据随机抽样 对数值型数据随机抽样)
应用统计学第6章 抽样分布与参数估计
μx
6. 3抽样分布
多大是足够的大?
6. 3抽样分布
例子
假设总体的平均数μ = 8 且标准差σ = 3. 假 设选中容量n = 36随机样本。
样本平均数介于7.8和8.2之间的概率是多少?
第6章 6. 3抽样分布
例子
(续)
结论:
即使总体非正态分布, 中心极限定理可以应用 (n > 30)
6.2 抽样误差
样本统计量和对应的总体参数之间的差异,称之为抽 样误差。
抽样误差的产生是由于抽样的非全面性和随机性所引 起的,是偶然性误差。
非抽样误差
抽样框误差 系统性误差 测量误差 登记误差
6. 3抽样分布
6. 3抽样分布
6.3.1 样本均值的抽样分布
6. 3抽样分布
1.样本均值的均值
样)
6. 3抽样分布
p的抽样分布
近乎正态分布分布,如果:
n 5
P( ps)
抽样分布
.3
且
.2
.1
n(1 ) 5
0 0 . 2 .4 .6
p
81
μ 其中 p
π
且
π(1 π)
σp
n
(其中 π = 总体比例)
6. 3抽样分布
比例的Z值
使用公式将p标准化为Z值:
p
Z
σp
p (1 )
n
在判断样本中,我们得到预先选好的专家就主题 发表的意见。
6.1 抽样理由和抽样方法
样本类型:概率样本
在概率样本中, 样本中条目的选择基于已知的概率。
概率样本
简单 随机样本
系统样本
分层样本 群样本
6.1 抽样理由和抽样方法
第6章抽样分布
* * Xm 的分布已知,故可求出 X 函数的分布,设 m
所以 n! 1 m 1 nm hm ( y ) f ( x)[1 F ( x)] [ F ( x)] (n m)!(m 1)! f ( x) n! y m 1 (1 y ) n m , (n m)!(m 1)! 0 y 1, m 1 ~ n
所以
X 的特征函数为
2 2 t / n iat / n x t exp 2
n
t 2 2 exp iat 2 n
可见 X ~ N ( a,
2
n
) 分布。
(二)样本均值的极限分布 定理:设 X1, X2,…,Xn来自一般总体X,且E(X)=a,
若总体X为连续型随机变量,其密度函数为f (x),则(X1,X2,…,Xn) 的联合密度函数为
§6-2 样本分布
一、频率直方图
二、样本分布函数
如果我们从随机变量X的总体中抽取了一个样本,把样本的n个值
* * * x1,x2,…, xn加以排队 x1 ,并把它看成是某个离散 x2 xn 随
1 n 2 S (Xi X ) n i 1 2 2
_
1 n S* (Xi X ) n 1 i 1
2
2 2 2、设X ~ N ( a1 , 1 ), Y ~ N ( a2 , 2 ), X 1 , X 2 ,..., X n1 及Y1 , Y2 ,..., Yn 2 分别为
—
t 1 式中 ( ) 是 X 的特征函数。 n nn n 1 证: X X i 1 X i ,且 1 X , 1 X ,, 1 X 相互独立 1 2 n n i 1 i 1 n
概率论与数理统计6.第六章:样本及抽样分布
),
,
,
,
是来
Z=
(
-
证明统计量 Z 服从自由度为 2 的 t 分布。
14
),
,
,
,
是来 , .ຫໍສະໝຸດ 自 总 体 X 的 样 本 , E( ) 则 ,D( )=
是来自总体 X ,D(X)= . ,
,D( )=
11
3. 设 , 本 ,E(X)=
, , 为来自总体 X 的样 ,D(X)=9, 为样本均值 , 试用 < ≥ ,
切比雪夫不等式估计 P{ P{ 4.设 , 则当 K= > ≤ , , . 是总体 X
lim f (t ) (t )
n
1 e 2
t2 2
, x
3.分位点 设 T~t(n), 若对 :0<<1,存在 t(n)>0,
4
满足 P{Tt(n)}=, 则称 t(n)为 t(n)的上侧分位点 注: t1 (n) t (n) 三、F—分布 1.构造 若 1 ~2(n1), 2~2(n2),1, 2 独立,则
y0
2. F—分布的分位点 对于 :0<<1,若存在 F(n1, n2)>0, 满足 P{FF(n1, n2)}=, 则称 F(n1, n2)
5
为 F(n1, n2)的上侧 分位点; 注: F1 (n1 , n2 )
1 F (n2 , n1 )
§ 6.3 正态总体的抽样分布定理
X Y /n ~ t ( n)
t(n)称为自由度为 n 的 t—分布。 t(n) 的概率密度为
n 1 ) 1 t 2 n2 2 f (t ) (1 ) , t n n n ( ) 2 (
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随机变量的分布的可加性 设相互独立的随机变量X ,Y均
服从某种分布,若它们的和X Y也 服从同一种分布(参数有所不同),我们 就称该分布具有可加性.
1.设X ,Y独立,且X ~ B(m, p),Y ~ B(n, p),
则X Y ~ B(m n, p)
2.设X ,Y独立,且X ~ P(1),Y ~ P(2 ),
定义2 从总体中抽出的一部分个体叫样本(子 样).样本中所含个体的数目叫做样本容量.样本所 取的值叫做样本值.
由于抽样具有随机性,所以样本是一组随机变量 (或随机向量).
一个容量为n的样本记为
X1, X2,, Xn
样本值记为
(x1,x2, xn)
抽样方法满足的条件:
(1) 随机性
(2) 独立性
(2)显然P( X x2 ) 0.01
由对称性得 : P( X x2 ) 0.005
查表得: x2 t0.005 (10) 3.1693
t分布的性质
(1)其密度函数f(x)为偶函数; (2)当n较大时,其分布很接近正态分布.
(3)t1 (n) t (n) 在n 45时,t (n) u
常用统计量 样本均值
样本方差
X
1 n
n i 1
Xi
S 2
1 n 1
n i 1
(Xi
X
)2
样本标准差
S
1 n 1
n i 1
(Xi
X
)2
样本k阶原点矩 样本k阶中心矩 样本离差平方和
Ak
1 n
n i 1
X
k i
Bk
1 n
n
(Xi
i 1
X )k
n
(Xi X )2
i 1
第二节 抽样分布定理
o
x
t (n)
查表可得 t0.05 (20) 1.7247
(表示P(t(20) 1.7247) 0.05)
例1 设X ~ t(10),确定x1, x2,使 (1)P( X x1) 0.95; (2)P( X x2 ) 0.99
解 : (1)P( X x1) 0.05
查表得 : x1 t0.05 (10) 1.8125
3. F分布
设X1 ~ 2 (n1),Y ~ 2 (n2 ),且X 与Y相互独立,则称
F X / n1 Y / n2
为服从第一自由度是n1,第二自由度是n2的F分布,记为F ~ F (n1, n2 )
F分布的性质 :
(1)若t ~ t(n),则t2 ~ F (1, n);
(2)若X
~
F
(n1,
则X Y ~ P(1 2() 前已证明)
3.设X ,Y独立,且X
~
N
(
1,
2 1
),
Y
~
N
(
2
,
2 2
),
则X
Y
~
N (1
2
,
2 1
2 2
)
4.设X ,Y独立,且X ~ x2 (m),Y ~ x2 (n),
则X Y ~ x2 (m n)
一、几个常用分布
1. 2分布
设Xi ~ N (0,1) (i 1, 2 n),且相互独立, 称
n
n
E( 2 ) E(
X
2 i
)
E
(
X
2 i
)
n
i 1
i 1
E(Xi4) x4
1
x2
e 2 dx
2 x4
2
0
1
x2
e 2 dx
2
令 x2 t 2
4
3
t 2etdt
4 (5)
4
3.1
3
0
2 22
D(
X
2 i
)
E
(
X
4 i
)
(
EX
2 i
)
2
2
n
n
D( 2 ) D(
定义3 设样本(X1,X2,Xn)相互独立, 且每个分量x与i 总体X分布相同,则称 (X1, X2 , Xn )为独立同分布样本(简单 随机样本).
二、样本分布函数
定义4 设(X1, X 2 ,
X
n
)是来自总体X的样本,
将各X
的值
i
按从小到大的次序重新排列, 记为x1*, x2*, xn*,则函数
推广:若Xi ~ 2 (ni ), (i 1, 2
k
k
Xi ~ 2 ( ni )
i 1
i 1
k )且相互独立, 则
(2).若 2 ~ 2 (m),则有
E( 2 ) n D( 2) 2n
证明(2): Xi ~ N (0,1)
E( Xi2 ) D( X i ) (EXi )2 1
X
2 i
)
D(
X
2 i
)
2n
i 1
i 1
2分布的分位点:
P{ 2 (n) 2 (n)}
则称2 (n)为 2 (n)分布的上分位点.
y
f2 (x)
查表可得
o
2 (n)
x
2 0.05
(30)
43.773
(表示P( 2 (30) 43.773) 0.05)
2. t分布
设X ~ N (0,1),Y ~ 2 (n),且X与Y相互独立,则称
T X Y /n
为服从自由度是n的t分布,记为t ~ t(n).
t分布的密度函数为 h(t)= [(n+1)/2] (1 t 2 )(n1)/2
n (n / 2) n
tR
t分布的分位点: 对给定的0<<1,称满足条件
P(t(n) t (n))
则称t
(n)为t(n)分布的上
y
分位点.
ft (x)
2
X
2 1
X
2 2
X
2 n
n
X
2 i
i 1
为自由度是n的 2分布,记为 2 ~ 2 (n)
2分布的密度函数为
f
(x)
2n / 2
1 (n
/
2)
x e n / 21 x / 2
0
x0 其他
2分布的性质
(1).可加性:若X ~ 2 (m),Y ~ 2 (n),且X 与Y独立,则 X Y ~ 2(m n)
第一节 数理统计的基本概念 第二节 抽样分布定理
返回
本章要求
1.掌握随机样本的概念; 2.熟悉一些常用的统计量及其分布;
重点
抽样分布定理
学时数 3-4
第一节 数理统计的基本概念 一、总体、个体与样本
定义1 在统计学中,我们把所要研究的对象的 全体称为总体(母体),记为X; 组成总体的每个元素 称为个体.
0
Fn
(
x)
k n
1
x x1*
xk*
x
x* k 1
xn* x
称为样本分布函数或经验分布函数.
可以证明,当n 时,总体X的样本分布函数Fn (x) 依概率收敛于X的分布函数F (x() P133证明略)
三、统计量
定义5 设(X1,X2, …,Xn)为总体X的一个样本, f(X1,X2,…Xn)为样本的连续函数. 如果f中不包含任何未知参数, 则称f(X1,X2,…Xn)为一个统计量.
n2
), 则
1 X
~
F (n2, n1, n2 )
F
1 (n2 , n1)
F分布的分位点:
P{F F (n1, n2 )}
则称F
(n1
,
n2
)为F分布的上 y
分位点.
服从某种分布,若它们的和X Y也 服从同一种分布(参数有所不同),我们 就称该分布具有可加性.
1.设X ,Y独立,且X ~ B(m, p),Y ~ B(n, p),
则X Y ~ B(m n, p)
2.设X ,Y独立,且X ~ P(1),Y ~ P(2 ),
定义2 从总体中抽出的一部分个体叫样本(子 样).样本中所含个体的数目叫做样本容量.样本所 取的值叫做样本值.
由于抽样具有随机性,所以样本是一组随机变量 (或随机向量).
一个容量为n的样本记为
X1, X2,, Xn
样本值记为
(x1,x2, xn)
抽样方法满足的条件:
(1) 随机性
(2) 独立性
(2)显然P( X x2 ) 0.01
由对称性得 : P( X x2 ) 0.005
查表得: x2 t0.005 (10) 3.1693
t分布的性质
(1)其密度函数f(x)为偶函数; (2)当n较大时,其分布很接近正态分布.
(3)t1 (n) t (n) 在n 45时,t (n) u
常用统计量 样本均值
样本方差
X
1 n
n i 1
Xi
S 2
1 n 1
n i 1
(Xi
X
)2
样本标准差
S
1 n 1
n i 1
(Xi
X
)2
样本k阶原点矩 样本k阶中心矩 样本离差平方和
Ak
1 n
n i 1
X
k i
Bk
1 n
n
(Xi
i 1
X )k
n
(Xi X )2
i 1
第二节 抽样分布定理
o
x
t (n)
查表可得 t0.05 (20) 1.7247
(表示P(t(20) 1.7247) 0.05)
例1 设X ~ t(10),确定x1, x2,使 (1)P( X x1) 0.95; (2)P( X x2 ) 0.99
解 : (1)P( X x1) 0.05
查表得 : x1 t0.05 (10) 1.8125
3. F分布
设X1 ~ 2 (n1),Y ~ 2 (n2 ),且X 与Y相互独立,则称
F X / n1 Y / n2
为服从第一自由度是n1,第二自由度是n2的F分布,记为F ~ F (n1, n2 )
F分布的性质 :
(1)若t ~ t(n),则t2 ~ F (1, n);
(2)若X
~
F
(n1,
则X Y ~ P(1 2() 前已证明)
3.设X ,Y独立,且X
~
N
(
1,
2 1
),
Y
~
N
(
2
,
2 2
),
则X
Y
~
N (1
2
,
2 1
2 2
)
4.设X ,Y独立,且X ~ x2 (m),Y ~ x2 (n),
则X Y ~ x2 (m n)
一、几个常用分布
1. 2分布
设Xi ~ N (0,1) (i 1, 2 n),且相互独立, 称
n
n
E( 2 ) E(
X
2 i
)
E
(
X
2 i
)
n
i 1
i 1
E(Xi4) x4
1
x2
e 2 dx
2 x4
2
0
1
x2
e 2 dx
2
令 x2 t 2
4
3
t 2etdt
4 (5)
4
3.1
3
0
2 22
D(
X
2 i
)
E
(
X
4 i
)
(
EX
2 i
)
2
2
n
n
D( 2 ) D(
定义3 设样本(X1,X2,Xn)相互独立, 且每个分量x与i 总体X分布相同,则称 (X1, X2 , Xn )为独立同分布样本(简单 随机样本).
二、样本分布函数
定义4 设(X1, X 2 ,
X
n
)是来自总体X的样本,
将各X
的值
i
按从小到大的次序重新排列, 记为x1*, x2*, xn*,则函数
推广:若Xi ~ 2 (ni ), (i 1, 2
k
k
Xi ~ 2 ( ni )
i 1
i 1
k )且相互独立, 则
(2).若 2 ~ 2 (m),则有
E( 2 ) n D( 2) 2n
证明(2): Xi ~ N (0,1)
E( Xi2 ) D( X i ) (EXi )2 1
X
2 i
)
D(
X
2 i
)
2n
i 1
i 1
2分布的分位点:
P{ 2 (n) 2 (n)}
则称2 (n)为 2 (n)分布的上分位点.
y
f2 (x)
查表可得
o
2 (n)
x
2 0.05
(30)
43.773
(表示P( 2 (30) 43.773) 0.05)
2. t分布
设X ~ N (0,1),Y ~ 2 (n),且X与Y相互独立,则称
T X Y /n
为服从自由度是n的t分布,记为t ~ t(n).
t分布的密度函数为 h(t)= [(n+1)/2] (1 t 2 )(n1)/2
n (n / 2) n
tR
t分布的分位点: 对给定的0<<1,称满足条件
P(t(n) t (n))
则称t
(n)为t(n)分布的上
y
分位点.
ft (x)
2
X
2 1
X
2 2
X
2 n
n
X
2 i
i 1
为自由度是n的 2分布,记为 2 ~ 2 (n)
2分布的密度函数为
f
(x)
2n / 2
1 (n
/
2)
x e n / 21 x / 2
0
x0 其他
2分布的性质
(1).可加性:若X ~ 2 (m),Y ~ 2 (n),且X 与Y独立,则 X Y ~ 2(m n)
第一节 数理统计的基本概念 第二节 抽样分布定理
返回
本章要求
1.掌握随机样本的概念; 2.熟悉一些常用的统计量及其分布;
重点
抽样分布定理
学时数 3-4
第一节 数理统计的基本概念 一、总体、个体与样本
定义1 在统计学中,我们把所要研究的对象的 全体称为总体(母体),记为X; 组成总体的每个元素 称为个体.
0
Fn
(
x)
k n
1
x x1*
xk*
x
x* k 1
xn* x
称为样本分布函数或经验分布函数.
可以证明,当n 时,总体X的样本分布函数Fn (x) 依概率收敛于X的分布函数F (x() P133证明略)
三、统计量
定义5 设(X1,X2, …,Xn)为总体X的一个样本, f(X1,X2,…Xn)为样本的连续函数. 如果f中不包含任何未知参数, 则称f(X1,X2,…Xn)为一个统计量.
n2
), 则
1 X
~
F (n2, n1, n2 )
F
1 (n2 , n1)
F分布的分位点:
P{F F (n1, n2 )}
则称F
(n1
,
n2
)为F分布的上 y
分位点.