08第4章抽样分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x
23
总体 计算 量
n
x1
n
x2
n
x3
625个
重复此过程
销售价格
无数次
抽样统计
x1 x3 x2
样本容量相同 的统计量的 理论总体
24
总结:抽样分布 (概念要点)
1. 所有样本指标所形成的分布称为抽样分布 (如所有样本均值、比例、方差等)
2. 是一种理论上的概率分布
3. 随机变量是 样本统计量
– 样本均值, 样本比例等
总体平均数既是抽样分布的平均数,也 是次数最多的值(众数),而且其两边 的样本数相同(中位数)。
22
如果总体为:6、7、8、9、10、11、12、13、14、15 平均数:10.5 考虑n=1、n=2、n=3…… 1:统计量的取值6——15;平均数; 2:45个样本,统计量的取值6.5——14.5;相同的平均 数很多; 3:120个样本,统计量的取值7——14……样本平均数 的取值范围逐渐缩小,并且向总体平均数集中的趋势越 来越明显。。
8
二、参数和统计量
参数:概括总体所有数据的指标数值。 (总体的某种特征值)
– 例:总体平均数、总体比例,总体方差等
统计量:概括样本所有数据的指标数值。 (样本的某种特征值)
-例:样本平均值、样本比例,样本方差等
每个参数是固定的、唯一的;统计量是随机的
每一个参数,有一个相应的样本统计量
9
符号表示法
1、设从均值为,方差为 2的一个任意总体中抽 取容量为n的样本,当n充分大时,样本均值的抽样分 布近似服从均值为μ、方差为σ2/n的正态分布
x ~ N ( , ) 即:
2 xx
其中:
, x
xn
x
~
N
,
2
n
27
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
12
案例:样本均值的抽样分布
设一个总体,含有4个元素(个体),即总体容量 N=4。4 个个体分别为X1=4、X2=5、X3=6 、X4=7 。总 体的均值、方差及分布如下
均值 方差
N
Xi
i1 5.5
N
N
(Xi )2
2 i1
1.25
N
13
变量
4 5 6 7
次数
样本容量(Sample size):样本中所含 个体的数量
6
可能的样本数目的计算方法
(样1)本考的虑可顺能序数的目重复纯随机抽 样1的、样概本念的可能数目 N n (22、)计不算考方虑法顺序的不重复纯随 机(抽1样)的考样虑本顺的序可的能重数复目 纯随机抽样 的(2样)本C不Nn的考可n(!虑能NN顺数! 序n目)!的不重复纯随机 抽样的样本的可能数目
1 1 1 1
总体分布
.3
.2
.1 0
4
567
14
现从总体中抽取n=2的简单随机样本,在重复
抽样条件下,共有42=16个样本。所有样本的结果 如下表
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
4
5
6
7
4
4,4
4,5
4,6
4,7
5
5,4
5,5
5,6
5,7
6
6,4Biblioteka Baidu
6,5
6,6
6,7
我们可以给出样本均值的概率分布
17
x
f
p
4
1
0.0625
4.5
2
0.1250
5
3
0.1875
5.5
4
0.2500
6
3
0.1875
6.5
2
0.1250
7
1
0.0625
合计
16
1.0000
18
P(x) .3 .2 .1 0
4.0 4.5 5.0 5.5 6.0 6.5 7.0 x
样本均值的抽样分布
19
一位女士在路上等计程车等了很久都没 有,于是打电话到出租车行。
女士:“我要一辆出租车。” 服务员:“小姐贵姓?” 女士:“姓张。” 服务员:“小姐穿什么衣服?” 女士:“白色连衣裙。” 服务员:“到哪里?” 女士:“到膝盖。”
1
第3章 抽样分布(p98)
第一 抽样的基本概念 第二 抽样分布与中心极限定理 第三 抽样分布的其他问题
数字特征 均值 标准差 方差 容量 比例
样本 X S S2 n P
总体
2
N
P
10
抽样分布与中心极限定理
一、总体分布、样本分布与抽样分布的关系 二、中心极限定理
11
一、抽样分布 1、样本统计量(如均值、比例、方差等)的
概率分布称为抽样分布 (p99)
2、是一种理论概率分布
思考:抽样分布是怎样的一种分布? 和总体分布之间又是怎样一种关系?
所有样本均值的均值和方差
n
x
xi
i 1
M
4.0 4.5 16
7.0
5.5
n
(xi x )2
2 x
i 1
M
(4.0 5.5)2 (7.0 5.5)2 0.625 2
16
n
式中:M为样本数目 n为样本容量 20
样本均值的分布与总体分布的比较
总体分布
.3
.2
.1
0 4
567
= 5.5
σ2 =1.25
P(x) .3
抽样分布
.2
.1
0
4.0 4.5 5.0 5.5 6.0 6.5 7.0 x
x 5.5
2 x
0.625 1.25/
2
21
统计量的分布具有单峰和对称的特点, 因而其平均数、众数、中位数都相同。
7
7,4
7,5
7,6
7,7
15
计算每个可能的样本的均值,如下表。
第一个观察值
4 5 6 7
16个样本的均值(x)
第二个观察值
4
5
6
4.0
4.5
5.0
4.5
5.0
5.5
5.0
5.5
6.0
5.5
6.0
6.5
7
5.5 6.0 6.5 7.0
16
随机变量并不像其名称那样 不可捉摸,至少在理论上,变量 的任一值或一组值的观测概率是 可以得到的。
4. 结果来自容量相同的所有可能样本
25
如上例中,将所有可能样本的 平均数作为一个新的数据总体的概 率分布即为样本平均数的抽样分布。 将所有可能样本的中位数作为一个 新的数据总体的分布即为样本中位 数的抽样分布。将所有可能样本的 方差作为一个新的总体的分布即为 样本方差的抽样分布。
26
二、中心极限定理(p101)
2
了解抽样和抽样分布的基本概念 理解抽样分布与总体分布的关系
3
统计推断的过程
总体
样
样本统计量
本
例如:样本均
值、比例、方
差
4
抽样的基本概念
一、 总体和样本 二、参数和统计量
5
一、总体和样本
总体Population :研究对象的全体
样本Sample :从总体中抽取的一部分 个体的集合。(总体的子集)