第5章《统计学原理》

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学原理 华东交通大学经济管理学院
P144
样本日工资平均数 单位:元 样本 变量 34 38 42 46 50 34 38 42 46 50 — 36 38 40 42 36 — 40 42 44 38 40 — 44 46 40 42 44 — 48 42 44 46 48 —
样本日工资的抽样分布 样本日平均 工资(元) 36 38 40 42 44 46 48 合计 频数 频率
一、重复抽样
样本平均数的分布——是由总体中全部样本平均数的可
能值和与之相应的概率组成。
【例】某施工班组5个人的 样本日平均工资 频数 频率 34 1 1/25 日工资为34,38,42,46,50元, 36 2 2/25 则总体工人日平均工资为多 38 3 3/25 少?总体日工资方差多少? 40 4 4/25 现用重置方法从5人中随机 42 5 5/25 44 4 4/25 抽2个构成样本,用样本平 46 3 3/25 均工资来推断总体的平均工 48 2 2/25 资水平,请列出样本平均数 50 1 1/25 的概率分布。 合计 25 1
正态分布函数及其标准化
标准正态分布
标准正态分布的平均数(数学期望)为0,方差为1 任何一个一般的正态分布,可通过下面的线性变换转化为标 准正态分布 x z ~ N (0,1)
二、常用的统计量与总体参数
样本均值(平均数)
1 n X Xi n i 1 样本方差与标准差
S2
总体均值(平均数)
1 N
N
X
i 1
N
i
( X i X )2
i 1
n
总体方差与标准差
2
( X i )2
i 1
n 1
,S S2
样本成数


n 当N较大时

2
x
2 X N n
N 1
, x

X
n

N n N 1

2
x
2 X N n
n N
, x
wk.baidu.com
X
n
1 f
P146
统计学原理
华东交通大学经济管理学院
4.3.1 重置抽样分布
抽样成数的分布 原理:把是非标志作为(0,1)分布,其总体平均

2

x1 x2 xn x n
x
2 X
n
, x

X
n
抽样成数的分布 原理:把是非标志作为(0,1)分布,其总体平均数
就是总体成数本身 P ;总体方差为 2 P P 1 P 则从总体中用重置抽样方法抽取n个单位计算样本乘数p, 有:
数就是总体成数本身 X P P ;总体方差为 2 P P 1 P 则从总体中用不重置抽样方法抽取n个单位计算样本 乘数p,有:①样本成数p的平均数等于总体成数
E p X P P
②样本成数的标准差(抽样平均误差)等于总体 成数的方差除以样本单位数乘以修正系数的平方根
第5章 抽样分布与抽样方法
5.1 随机抽样与统计推断 5.2 抽样分布(补充:中心极 限定理与正态逼近) 5.3 抽样设计方法
统计学原理 华东交通大学经济管理学院
P137
5.1随机抽样与统计推断
5.1.1 简单随机抽样
设总体为X1,X2,…,XN,用X表示。 从总体X中抽取部分单位就组成总体的一个样本,可 用X1,X2,…,Xn表示。其中n称为样本容量,显然 n<N。 若从总体X中抽样的这个样本满足: (1) X1,X2,…,Xn 与X具有相同的分布; (2) X1,X2,…,Xn相互独立, 则称此样本为简单随机样本,此抽样方法称为简单 随机抽样。
样本平均数的分布——是由总体中全部样本平均数 的可能值和与之相应的概率组成。
【例】某施工班组5个人的 样本日平均工资 频数 频率 日工资为34,38,42,46,50元, (元) 则总体工人日平均工资为多 36 2 1/10 少?总体日工资方差多少? 38 2 1/10 现用不重置方法从5人中随 40 4 2/10 42 4 2/10 机抽2个构成样本,用样本 44 4 2/10 平均工资来推断总体的平均 46 2 1/10 工资水平,请列出样本平均 48 2 1/10 数的概率分布。 合计 20 1
X
n
不重 复抽 样
E x

E p P
N n N 1
x X n
P
p 1 p N n n N 1
5.2抽样分布的有关定理
在研究正态总体的抽样分布之前,我们首先要了解 什么是正态分布以及它有什么样的性质。 一、正态分布的密度函数
统计学原理 华东交通大学经济管理学院
P138
5.1.2 统计量
一、统计量与抽样分布 样本统计量:是指样本指标,是样本空间上样本随 机变量的函数。如:样本平均数、样本成数(样本 比例)、样本方差等。 抽样分布:就是样本统计量的概率分布。即每个样 本统计量的取值与相应的概率,就组成样本统计量 的概率分布,简称抽样分布。 总体参数:与样本统计量对应的一个概念就是总体 参数,简称参数。参数是总体各变量的函数,是反 映总体数量特征的指标,包括:总体平均数、总体 成数、总体方差等。




统计学原理
华东交通大学经济管理学院
P143
重置抽样分布
上述结论具有普遍意义(重置抽样): 设总体变量 X :X 1 , X 2 , , X N , 其平均数为 ,标准差 为 X , 样本容量为n的变量 x : x1 , x2 , , xn

E x
n1 p n
N
,
2
总体成数
N1 P N 总体极差等(略)
样本极差等(略)
补充:何谓统计推断?
总体参数具有唯一性和未知性。 因为参数是根据总体所有变量数据计算等到的,而 一般事先不是所有的变量数据都是已知的,故、、 样本统计量具有随机性和可知性 因为统计量随着样本的变化而改变,故统计量是随 机变量,但只要进行抽样调查,就能获得样本数据, 就能计算出相应的统计量,故它又是可知的 统计推断:是指用非唯一的、但又是可知的样本统 计量去推断唯一的、但又是未知的总体参数的统计 方法。统计推断的具体内容又包括:参数估计和参 数假设检验。
P120
f (x)
f(x) B
x
x
x
x
A
C x
图4-8 正态分布图
正态分布函数及其标准化
正态分布密度函数: 1 2 x 2 1 f ( x) e 2 2
x
, x
x 2
2 2
正态分布的分布函数:F ( x ) P ( X x )
样本 34,34 34,38 34,42 34,46 34,50 38,34 38,38 38,42 38,46 38,50 42,34 42,38 42,42 42,46 42,50 样本平 均数 X 34 36 38 40 42 36 38 40 42 44 38 40 42 44 46 样本 46,34 46,38 46,42 46,46 46,50 50,34 50,38 50,42 50,46 50,50 样本平 均数 X 40 42 44 46 48 42 44 46 48 50
2 2 4 4 4 2 2 20
1/10 1/10 2/10 2/10 2/10 1/10 1/10 1
利用上面资料计算样本平均数的平均数和 样本平均数的方差。
E x 42元

2

X
12元
2
X 12 2 3元
不重置抽样分布
从例题得到重要结论(不重置抽样): 不重置抽样的样本平均数 x 的平均数(数学期望) 等于总体平均数 E x
具体做法:每次从总体抽取一个单位,记录其标 准值后不放回原总体,下一次继续从余下的单位 中抽取。 其特点: 1)实质上相当于从总体中同时抽取n个样本单位; 2)每次试验结果不独立,上次中选情况影响下次抽 选结果; 3)每个单位在多次抽选中中选的概率不等。 N! 如果考虑顺序,其样本可能个数为 P n N ( N n)! 如果不考虑,其样本个数为 N! n CN ( N n)!n!
p 2 P N n
n N 1 P 1 P N n n N 1 P 1 P (1 f ) n
抽样分布总结
样本平均数的分布 样本成数的分布
重复 抽样
E x
x


E p P
p 1 p P n
统计学原理 华东交通大学经济管理学院
P146
不重置抽样分布
上述结论具有普遍意义(不重置抽样): 设总体变量 X : 1 , X 2 , , X N , 其平均数为 X ,标准差为 X , X 样本容量为n的变量 x : x1 , x2 , , xn x1 x2 xn x n E x
E ( X ) X Xf 42(元) f
( X X )2 f 16(元2 ) (X ) f
2
重置抽样分布
从例题得到重要结论(重置抽样): 重置抽样的样本平均数 x 的平均数(数学期望) 等于总体平均数 E x

抽样平均数的标准差 ( x ) 反映样本平均数与总体 平均数的平均误差程度,称之为抽样平均误差,或抽 样标准误差 2 2 (X ) ( x) E x E x E x X n 重置抽样的抽样平均误差等于总体标准差除以样本单 位数的平方根
5.3 抽样设计方法(P143页)
一、重复抽样(有放回抽样、重置抽样) 具体做法:从总体中抽出一个样本单位,记录其标 志值后,又将其放回总体中继续参与下一轮抽取。 其特点: 容量为n的样本是由n次实验的结果构成; 每次实验是独立的; 每次实验是在相同条件下进行的,每个单位在 多次实验中被选中的机会(概率)相同。 n 样本可能的个数为N 个。
①样本成数p的平均数等于总体成数 E p P ②样本成数的标准差(抽样平均误差)等于总体成 数的方差除以样本单位数之商的平方根
P 2 P P 1 P p n n n
统计学原理 华东交通大学经济管理学院
P143
二、不重复抽样(不重置抽样)
1 f ( x) e 2 , x 2 f(x) = 随机变量 X 的频率 =正态分布的方差 =3.14159; e = 2.71828 μ = 正态分布的平均数 正态分布简记为: N , 2

1
x 2 2


统计学原理
华东交通大学经济管理学院
1 F ( x) P( X x) f x dx 2
基本性质: 对 于 任 何 , 有F x o x


e
x
dx

1 f ( x )dx= 2 -
统计学原理

e

x 2
2 2
dx 1
华东交通大学经济管理学院
P121

抽样平均数的标准差 ( x ) 反映样本平均数与总体 平均数的平均误差程度,称之为抽样平均误差,或抽 样标准误差
( x)
E xE x


2

E x X


2

2(X ) N n
n N 1
不重置抽样的抽样平均误差等于重置抽样的抽样平均 误差乘以修正因子,说明不重置抽样的抽样平均误差 小于重置抽样的抽样平均误差
样本日工资平均数
单位:元
样本变量 34 34
38 42 46 50
38 36
38 40 42 44
42 38
40 42 44 46
46 40
42 44 46 48
50 42
44 46 48 50
34
36 38 40 42
抽样分布为:
示例
样本平均数 X 34 36 38 40 42 44 46 48 50 合计 频数 1 2 3 4 5 4 3 2 1 25
相关文档
最新文档