ch04抽样分布、第五章抽样推断(一)
合集下载
第五章 抽样分布与参数估计
对于分层抽样: 层内是抽样调查 , 层间是全面调查
对于整群抽样: 群内是全面调查 , 群间是抽样调查
4.系统随机抽样
系统随机抽样又称为机械随机抽样或等距随机抽样。 它是先将总体中各单位按一定的标志排队,然后每隔一定 的距离抽取一个总体单位(个体)的抽样方式。
例如:从100人中抽取10人构成样本,先将100人排队编号, 然后在1~10号之间随机抽取一个数字,比如抽到3,那么 编号为 3,13,23,33,43,53,63,73,83,93的10个 人组成样本。
总体
样本均值
样本
样本方差
抽样分布
二、抽样调查的分类
❖ 随机抽样:按照随机原则,完全排除了人为的主观 因素,总体中每个单位都有一定的概率被选入样本。
❖ 非随机抽样:从方便出发或者根据研究者主观的判 断来抽取样本,不遵循随机原则。无法估计和控制 抽样误差,无法用样本的数量特征来推断总体。 (方便抽样、配额抽样、 不等概率PPS抽样等)
具体排队时又分
按无关标志排队 按有关标志排队
5.多阶段随机抽样
多阶段随机抽样是将一次抽样后得到的样本当作总 体再次进行随机抽样,得到第二次抽样样本,然后再如 此进行下去的抽样方式。
例如:我国农产量调查就采用五阶段抽样方式。省抽县、县 抽乡、乡抽村、村抽地块、地块抽样本点,对样本点进行实 割实测的调查方法。
四、抽样调查的应用
对一些社会现象不可能或不必要进行全面调查时, 一种是被调查总体包含有无穷多个单位,第二种是 对破坏性和消耗性产品的检验(如:家用电器检验、 食品卫生检验等)。
企业产品质量的管理。 对一些时效性较强但有来不及采取全面调查的。 可以对大规模的全面调查进行检验,以修正资料。
五、抽样推断中的理论依据
对于整群抽样: 群内是全面调查 , 群间是抽样调查
4.系统随机抽样
系统随机抽样又称为机械随机抽样或等距随机抽样。 它是先将总体中各单位按一定的标志排队,然后每隔一定 的距离抽取一个总体单位(个体)的抽样方式。
例如:从100人中抽取10人构成样本,先将100人排队编号, 然后在1~10号之间随机抽取一个数字,比如抽到3,那么 编号为 3,13,23,33,43,53,63,73,83,93的10个 人组成样本。
总体
样本均值
样本
样本方差
抽样分布
二、抽样调查的分类
❖ 随机抽样:按照随机原则,完全排除了人为的主观 因素,总体中每个单位都有一定的概率被选入样本。
❖ 非随机抽样:从方便出发或者根据研究者主观的判 断来抽取样本,不遵循随机原则。无法估计和控制 抽样误差,无法用样本的数量特征来推断总体。 (方便抽样、配额抽样、 不等概率PPS抽样等)
具体排队时又分
按无关标志排队 按有关标志排队
5.多阶段随机抽样
多阶段随机抽样是将一次抽样后得到的样本当作总 体再次进行随机抽样,得到第二次抽样样本,然后再如 此进行下去的抽样方式。
例如:我国农产量调查就采用五阶段抽样方式。省抽县、县 抽乡、乡抽村、村抽地块、地块抽样本点,对样本点进行实 割实测的调查方法。
四、抽样调查的应用
对一些社会现象不可能或不必要进行全面调查时, 一种是被调查总体包含有无穷多个单位,第二种是 对破坏性和消耗性产品的检验(如:家用电器检验、 食品卫生检验等)。
企业产品质量的管理。 对一些时效性较强但有来不及采取全面调查的。 可以对大规模的全面调查进行检验,以修正资料。
五、抽样推断中的理论依据
第5章 抽样推断(完整版)(08经济国贸)资料
3、抽样推断的应用
不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时
4、抽样推断的一般步骤
设
抽
收
计
推
计
取
集
算
断
抽
样
样
本
样 本
样 本 统
总 体
方
单
数
计
参
案
位
据
量
数
二、总体参数 指被估计的总体指标,又被称
为全及指标
设总体中 N 个总体单位某项标志的标志值分别 为 X1, X 2 , X N ,其中具有某种属性的有 N1个 单位,不具有某种属性的有 N0个单位,则
1.25
样本均值的抽样分布
(例题分析)
STAT
最优抽取
能使样本结构更接近于总体结构,提高样本的 代表性;能同时推断总体指标和各子总体的指标
3·等距抽样(机械抽样或系统抽样)
——将总体单位按某一标志排序,而后按一 定的间隔抽取样本单位。
随机起点
半距起点
对称起点
······
(总体单位按某一标志排序)
按无关标志排队,其抽样效果相当于简单随机抽样; 按有关标志排队,其抽样效果相当于类型抽样。
4·整群抽样(集团抽样)
—— 将总体全部单位分为若干“群”,然后 随机抽取一部分“群”,被抽中群体的所有 单位构成样本
例:总体群数R=16 样本群数r=4
A D
E
B F G
CM N
J H
L K
P O I
LP HD
样本容量
n nd np nl nh
简单、方便,能节省人力、物力、财 力和时间,但其样本代表性可能较差
第5章抽样推断40页PPT
影响抽样误差的主要因素: 1、总体各单位标志值的差异程度。在其他条件不变的情况下, 总体各单位标志值的变异程度愈大,抽样误差也愈大,反之则 愈小。 2、样本的单位数。在其他条件不变的情况下,样本单位数愈 多,抽样误差就愈小,反之则愈大。 3、抽样方法。抽样方法不同,抽样误差也不同。一般说来,重 复抽样的误差比不重复抽样的误差要大。
例 题二:
某厂生产一种新型灯泡共2000只,随机抽出400只 作耐用时间试验,测试结果平均使用寿命为4800小时, 样本标准差为300小时,求抽样推断的平均误差?
解: 则:
已知 N 20 ,n 0 4 00 ,x 0 48 , 0 3 000
x
n
3001(5小)时 400
x
2 1 n
则:样本合格率 pnn130060.98 n 300
p
p 1 p 0 .9 8 0 .0 20 .8( 0% 8 )
n
300
p
p1p1n
n N
0.980.021 300 0.80(6 %) 300 60000
4、抽样调查的组织形式。选择不同的抽样组织形式,也会有 不同的抽样误差。
抽样平均误差
抽样平均误差是抽样平均数或抽样成数的标准差。反映了抽 样平均数与总体平均数抽样,成数与总体成数的平均误差程度。
抽样平均数的 平均误差
x
抽样成数的 平均误差
p
重复抽样 2
nn
p(1 p) n
不重复抽样
2 (1 n )
总体平均数
X
Xf f
总体标准差
(X X)2 f f
总体成数
p N1 N
成数标准差 p P(1P)
将总体N个单位分成性质相反的两组,其中具有某特征
例 题二:
某厂生产一种新型灯泡共2000只,随机抽出400只 作耐用时间试验,测试结果平均使用寿命为4800小时, 样本标准差为300小时,求抽样推断的平均误差?
解: 则:
已知 N 20 ,n 0 4 00 ,x 0 48 , 0 3 000
x
n
3001(5小)时 400
x
2 1 n
则:样本合格率 pnn130060.98 n 300
p
p 1 p 0 .9 8 0 .0 20 .8( 0% 8 )
n
300
p
p1p1n
n N
0.980.021 300 0.80(6 %) 300 60000
4、抽样调查的组织形式。选择不同的抽样组织形式,也会有 不同的抽样误差。
抽样平均误差
抽样平均误差是抽样平均数或抽样成数的标准差。反映了抽 样平均数与总体平均数抽样,成数与总体成数的平均误差程度。
抽样平均数的 平均误差
x
抽样成数的 平均误差
p
重复抽样 2
nn
p(1 p) n
不重复抽样
2 (1 n )
总体平均数
X
Xf f
总体标准差
(X X)2 f f
总体成数
p N1 N
成数标准差 p P(1P)
将总体N个单位分成性质相反的两组,其中具有某特征
《统计学原理》第5章:抽样推断
σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理
《统计学原理》第5章:抽样推断
用样本方差S2 代替 用样本方差S
总体方差已知
P(1 P) P(1 P) = p = n n
P(1 P) N n p = n N 1
总体方差未知
σ p ≈ Sp =
p (1 p ) n
用样本方差代替总体的
抽样推断的基本原理
抽样极限误差
x
p
在抽样推断中,在一定概率保证下,允许样本统 计量偏离总体统计量的最大幅度。(可允许的误差 范围)
6 3 2 1 0
n=5时x的 抽样分布
.5
.5
.5
.5
.5
45
50
55
60
65
70
.5 72
47
52
57
62
67
75
抽样推断的基本原理
抽样推断的优良标准
x为 的无偏、有效、一致估计量; S n 1为 σ 的无偏、有效、一致估计量; p 为 P 的无偏、有效、一致估计量。
抽样推断的基本原理
抽样推断的样本容量 小样本容量节省 费用但调查误差 大 调查误差 样本容量 调查费用 找出在限定费用范围 内的最大样本容量 大样本容量调查 精度高但费用较 大 找出在规定误差范围 内的最小样本容量
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理
抽样推断的优良标准——无偏性
7 6 5 4 3 2 1 0 100
p =
[( p E( p)]2 ∑ M
总体方差已知
P(1 P) P(1 P) = p = n n
P(1 P) N n p = n N 1
总体方差未知
σ p ≈ Sp =
p (1 p ) n
用样本方差代替总体的
抽样推断的基本原理
抽样极限误差
x
p
在抽样推断中,在一定概率保证下,允许样本统 计量偏离总体统计量的最大幅度。(可允许的误差 范围)
6 3 2 1 0
n=5时x的 抽样分布
.5
.5
.5
.5
.5
45
50
55
60
65
70
.5 72
47
52
57
62
67
75
抽样推断的基本原理
抽样推断的优良标准
x为 的无偏、有效、一致估计量; S n 1为 σ 的无偏、有效、一致估计量; p 为 P 的无偏、有效、一致估计量。
抽样推断的基本原理
抽样推断的样本容量 小样本容量节省 费用但调查误差 大 调查误差 样本容量 调查费用 找出在限定费用范围 内的最大样本容量 大样本容量调查 精度高但费用较 大 找出在规定误差范围 内的最小样本容量
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理
抽样推断的优良标准——无偏性
7 6 5 4 3 2 1 0 100
p =
[( p E( p)]2 ∑ M
统计学第五章抽样推断
X
推断 抽样误差=?
X x x
统计量
x
P b b
S b
25
五、抽样平均误差
1、概念:从总体N个单位中随机抽出n个单位组
成样本,有m种可能的样本,每个样本的指标值
与全及指标值之间都有误差,所有样本的误差之
平均数叫抽样平均误差。
(即:样本指标的标准差)
x , p
26
11
图2-9 不同标准差的正态分布
12
二、标准正态分布及其特性
标准正态分布的密度函数:P37
平均数为0、标准差为1的正态分布。 简记为:
T ~ N (0.1)
P227
附表2 标准正态分布概率积分表
13
三、一般正态分布的标准化
第一步,变量的标准化: 第二步,查表求概率:
t
x
2
n
2 N n 2 n x 1 n N 1 n N
p(1 P) N n p(1 P) n b 1 n N 1 n N
2)样本成数的抽样平均误差:
b
P69 重置抽样及其特点
(二)不重置抽样(sampling without replacement)
P69不重置抽样及其特点
22
(三)、抽样分布(sampling distribution )
抽样分布就是样本统计量的概率分布。P71 从同一总体中抽出样本容量相同的所有可能样本后, 计算每个样本的统计量数值,汇总得出各个统计量出 现的概率,就组成样本统计量的概率分布,简称抽样
推断 抽样误差=?
X x x
统计量
x
P b b
S b
25
五、抽样平均误差
1、概念:从总体N个单位中随机抽出n个单位组
成样本,有m种可能的样本,每个样本的指标值
与全及指标值之间都有误差,所有样本的误差之
平均数叫抽样平均误差。
(即:样本指标的标准差)
x , p
26
11
图2-9 不同标准差的正态分布
12
二、标准正态分布及其特性
标准正态分布的密度函数:P37
平均数为0、标准差为1的正态分布。 简记为:
T ~ N (0.1)
P227
附表2 标准正态分布概率积分表
13
三、一般正态分布的标准化
第一步,变量的标准化: 第二步,查表求概率:
t
x
2
n
2 N n 2 n x 1 n N 1 n N
p(1 P) N n p(1 P) n b 1 n N 1 n N
2)样本成数的抽样平均误差:
b
P69 重置抽样及其特点
(二)不重置抽样(sampling without replacement)
P69不重置抽样及其特点
22
(三)、抽样分布(sampling distribution )
抽样分布就是样本统计量的概率分布。P71 从同一总体中抽出样本容量相同的所有可能样本后, 计算每个样本的统计量数值,汇总得出各个统计量出 现的概率,就组成样本统计量的概率分布,简称抽样
统计学第五抽样推断
抽样推断的几个基本概念
常用的总体参数和统计量 :
抽样推断的几个基本概念
(三)样本容量和样本个数 1、样本容量:即一个样本中所包含的单 位数,一般用n表示。n≥30为大样本,n <30为小样本。 2、样本个数:是指在一个总体中所有可 能被抽取或可能构成的样本数目。 注意:在实际统计中我们只是抽取一个 样本,但进行抽样推断必须要考虑全部 的可能样本。
s x n n
2 ( x x ) s n 2 ( x x ) f f
抽样平均误差的计算
(三)影响抽样(平均)误差的因素 1、总体标志变异程度的大小(总体标准 差σ的大小),它与μ成正比例变化。 2、样本容量的大小,它与μ成反比例。 3、抽样方法的不同,重复抽样的μ总是 大于不重复抽样的μ。 4、抽样的组织形式,抽样的组织形式不 同,抽样误差也不同。
总体参数的区间估计
查正态概率双侧临界值表有:t=1.96
x
2
15 0.9487 n 15.8114
Δx= tμx=1.96×0.9487=1.86 则,65-1.86≤ X ≤65+1.86 即95%的估计区间为:63.14≤ X ≤66.86 计算结果说明有95%的把握认为总体平 均数介于63.14千克到66.86千克之间。
P( x X x t x ) F (t )
即:
P( x t x X x t x ) F (t )
(置信区间) (置信度)
总体参数的区间估计
(二)区间估计的方法及要素 2、总体成数的区间估计 P( p P p t p ) F (t )
(一)区间估计的概念
在统计分析中,我们常常用一个区间及 其出现的概率来估计总体参数。这种估 计总体参数的方法称为区间估计。 具体地说,区间估计是用估计量所构成 的区间来估计总体参数,并以一定的概 率保证总体参数将落在所估计的区间内。
第五章抽样与推断
样本平均数
离差
xБайду номын сангаас
15 20 25 30 25 30 35 35 40 45 -
x X
-15 -10 -5 0 -5 0 5 5 10 15 -
x X
225 100 25 0 25 0 25 25 100 225 750
2
抽样平均误差( x )
( x - X) n
2
750 8.66(元) 10
,则对于任意正数
0
,恒有:
1 n lim P E i n i 1 n i 1
lim P n
x X 1
中心极限定理
若总体变量存在有限的平均数 和方差 X
2
无论总体变量的分布是否为正态分布,在样本单位数目
第五章 抽样与推断
第一节 抽样调查的基本概念 第二节 抽样估计的基本理论依据
第三节 抽样误差与必要样本容量
第四节 参数估计
第五节 抽样设计
第六节 统计假设检验
第一节 抽样估计的意义
抽样调查的概念:抽样调查是按照随机原 则从总体中抽取一部分单位进行观察,并 运用数理统计的原理,以被抽取的那部分 单位的数量特征为代表,对总体作出数量 上的推断分析。
p
p(1 p ) n 0.98 (1 0.98) 150 (1 ) (1 ) 1.1374% n N 150 15000
按不重复纯随机抽样方式估计平均误差
(x X )
i 1 i
n CN
1 x n CN
2
(定义式)
ˆX
ˆ2
n 1 n n (1 ) (1 ) ( xi x ) 2 (计算式) n N n N i 1
统计学05第五章抽样推断
布来计算。
0
2019/11/22
第五章 抽样推断
40
2.3 区间估计
【例 5-4】 从某校学生中随机抽取 25人,调查到他们平均每天参加体育 锻炼的时间为25分钟,标准差为8分 钟。试以95%的置信水平估计该校学 生平均每天参加体育锻炼的时间。
2019/11/22
第五章 抽样推断
41
2.3 区间估计
Z~N ( 0, 1 )
Z
S
μ
ΔΔ
X X X
Z 0 Z
2019/11/22
第五章 抽样推断
31
2.3 区间估计
二 总体平均数的区间估计:
X : FZ 1
Δ
FZ , Z FZ Z
Δ
x
x x
2019/11/22
第五章 抽样推断
总体参数和样本统计量的计算公式
总体参数
样本统计量
X X1 X2 XN N
x x1 x2 xn n
P N1 N
p n1 n
X X X 2 N
S x x-x 2 n1
P P 1 P
p p 1 p
t X : x ,x
2019/11/22
第五章 抽样推断
39
2.3 区间估计
正态分布与 t 分布的比较
t 分布的应用
当 n 大,
N0, 1
S x自实由际 度 参数大估计中,当样本 t 分容布量大N 0于,13 0时,总体均值的
区t 间 0估 , σ 2计ν通 常还是用正态分
0.15
X : 4 0.45, 4 0.45 3.55, 4.45小时
第5章抽样
n
x
X
当总体服从正态分布X~N (μ, σ2)时,来自该总体 的所有容量为n的样本的均值X也服从正态分布, X 的数学期望为μ,方差为σ2/n
即X~N(μ,σ2/n)
=10
= 50 X
总体分布
n=4
x 5
n =16
x 2.5
x 50
X
抽样分布
第二节 三种不同性质的分布
抽样分布 (sampling distribution)
总 体
计算样本统计
样
量
本
例如:样本均
值、比例、方
差
均值
方差
样
本
均
均值
样本一
值
抽
样
方差
样本二
分
布
均值
样本三
样
·
本
方差
·
方
·
差
抽
均值
样本
样
分 布
方差 ·
·
·
均值 总体 方差
第三节 样本均值的抽样分布
容量相同的所有可能样本的样本均值的 概率分布
抽样和抽样估计的主要内容:如何科学地从总体 中抽取样本,如何估计和控制代表性误差,怎样 利用样本去估计和推断总体的特征
总体
抽样
估计
抽样
容量为n
误差
≥30 大样本
样本
< 30 小样本
抽样的方法
1、概率与非概率抽样概率抽样与非概率抽样 概率抽样(随机抽样)——按照随机原则抽取 样本
最基本的组织方式:简单随机抽样、分层抽样、 等距抽样、整群抽样
个总体均值之差 E(X1 X 2 ) 1 2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P( A) = 1− P A = 1−
()
5
3
=
125
4-9
3. 事件的独立性 对事件A与 , 定义 对事件 与B,若p(AB)=p(B)p(A),则称它们 , 是统计独立的,简称相互独立。 是统计独立的,简称相互独立。 已知袋中有6只红球 只白球 只红球, 只白球。 例:已知袋中有 只红球 4只白球。从袋中有放回地 取两次球,每次都取 每次都取1球 表示第i次取到红球 次取到红球。 取两次球 每次都取 球。设 Bi表示第 次取到红球。 那么, 那么, 36 6 3 P( B B ) 3
∑ P( B ) = ∑ C
k =0 k k =0
n
pq
= ∑ ( p + q) = 1
k =0
4-14
2. 连续型随机变量的概率分布 是一实数. 设X是R.V., x 是一实数 记 是 F(x)=P(X<x)。该函数就是随机变量 的分布 。该函数就是随机变量X的分布 函数。分布函数的导数称为密度函数, 函数。分布函数的导数称为密度函数,记作 p(x )。 。 性质 (1) p(x)≥0 ∞ (2) ∫ p (x ) d x = 1 −∞ P(a≤x<b) b (3) p(a < X < b) = ∫ p(x) d x
二、随机变量
随机变量X是定义在样本空间 ={ω1,ω2,…,ωn}上 随机变量 是定义在样本空间 上 的一个函数, 的一个函数,这个函数的取值随试验的结果不同而 变化。这个函数还要求满足条件:对任意的实数x, 变化。这个函数还要求满足条件:对任意的实数 , X<x是随机事件。如果随机变量所有可能的取值是 是随机事件。 是随机事件 有限的,或可排成一列的, 有限的,或可排成一列的,这种随机变量称为离散 型随机变量; 型随机变量;另一种情况是随机变量的取值范围是 一个区间或整个数轴, 一个区间或整个数轴,这种随机变量称为连续型随 机变量。 机变量。 1. 离散型随机变量的概率分布 设离散型随机变量X的所有可能取值为 的所有可能取值为x1, x2,…, 设离散型随机变量 的所有可能取值为 , xn, …,相应的概率为 ,相应的概率为p(x1),p(x2),…,p(xn),…。用 , 。 表格统一表示出来是: 表格统一表示出来是:
4-2
在随机试验中, 在随机试验中,可能出现也可能不出现的结 称之为随机事件,简称事件。 果,称之为随机事件,简称事件。试验的结 果可能是一个简单事件,也可能是一个复杂 果可能是一个简单事件, 事件。简单事件就是不可以再分解的事件, 事件。简单事件就是不可以再分解的事件, 又称为基本事件。 又称为基本事件。复杂事件是由简单事件组 合而成的事件。基本事件还可称为样本点, 合而成的事件。基本事件还可称为样本点, 设试验有n个基本事件 个基本事件, 设试验有 个基本事件,分别记为 ωi (i=1,2,…,n)。集合 ={ω1 ,ω2 , … ,ωn}称为 , 。 称为 样本空间, 中的元素就是样本点。 样本空间, 中的元素就是样本点。
µ = E ( X ) = ∑ x i p (x i )
性质: 性质:E αX1 + βX2 =αE X1 + βE X2 其中X1, 都是随机变量 都是随机变量, , 是任意常数 是任意常数。 其中 ,X2都是随机变量,α,β是任意常数。
(
I
)
( )
( )
4-12
定义: 离散型随机变量X的方差为 定义 离散型随机变量 的方差为 2 2 2 σ = D ( X ) = E ( X − µ ) = ∑ (xi − µ ) p ( xi ) 方差的平方根σ称为标准差。 方差的平方根 称为标准差。 称为标准差 方差σ 或标准差σ反映随机变量 反映随机变量X相对其期望 方差 2或标准差 反映随机变量 相对其期望 值的 离散程度, 越小, 离散程度,σ2或σ越小 说明期望值的代表性 越小 越好; 越大, 越好;σ2或σ越大,说明期望值的代表性越差。 越大 说明期望值的代表性越差。 性质:对于任意的α, 性质:对于任意的 ,D(αX)=α2 D(X) 成立
4-11
X x1 x2 … xn … P p(x1) p(x2) … p(xn) … 这称为离散型随机变量X的概率分布 的概率分布。 这称为离散型随机变量 的概率分布。 性质: 性质:(1) 0≤p(xi)≤1 (i=1,2, …); ; (2) ∑ p(xi ) = 1
i
定义: 离散型随机变量X的期望值为 定义 离散型随机变量 的期望值为
x
a
a
b
4-15
4-4
(二)概率 1. 概率的定义 概率就是指随机事件发生的可能性,或称为机率, 概率就是指随机事件发生的可能性,或称为机率, 是对随机事件发生可能性的度量。 进行n次重复试 是对随机事件发生可能性的度量。 进行 次重复试 随机事件A发生的次数是 发生的次数是m次 验,随机事件 发生的次数是 次,发生的频率是 m/n,当试验的次数 很大时,如果频率在某一数值 很大时, ,当试验的次数n很大时 p附近摆动,而且随着试验次数 的不断增加,频率 附近摆动, 的不断增加, 附近摆动 而且随着试验次数n的不断增加 的摆动幅度越来越小,则称p为事件 发生的概率, 为事件A发生的概率 的摆动幅度越来越小,则称 为事件 发生的概率, 记为: 记为:P(A)=p。在古典概型场合 即基本事件发生的 。在古典概型场合, 概率都一样的场合: 概率都一样的场合 m A包含的样本点个数 A的有利场合数 = P( A) = = 样本点总数 n 样本点总数
第四章 抽样与抽样分布
频率、 第一节 频率、概率与概率分布 第二节 抽样分布
4-1
频率、 第一节 频率、概率与概率分布
一、随机事件与概率 (一)随机试验与事件 随机现象的特点是:在条件不变的情况下, 随机现象的特点是:在条件不变的情况下,一系列 的试验或观测会得到不同的结果, 的试验或观测会得到不同的结果,并且在试验或观 测前不能预见何种结果将出现。 测前不能预见何种结果将出现。对随机现象的试验 或观测称为随机试验,它必须满足以下的性质: 或观测称为随机试验,它必须满足以下的性质: (1)每次试验的可能结果不是唯一的; )每次试验的可能结果不是唯一的; (2)每次试验之前不能确定何种结果会出现; )每次试验之前不能确定何种结果会出现; (3)试验可在相同条件下重复进行。 )试验可在相同条件下重复进行。
P ( B1 ) = P ( B2 ) = 10 = 5
P ( B2 B1 ) =
1 2
P( B1 )
=
100 = 3 5 5
,也就是说, 也就是说, B1,B2相互独立。从题目条件看,这一结论是显然的。 相互独立。从题目条件看,这一结论是显然的。
4-10
3 3 P ( B1 B2 ) = P ( B2 B1 ) P ( B1 ) = × = P ( B1 ) P ( B2 ) 因此, 因此, 5 5
4-3
例:投掷一粒均匀的六面体骰子,出现的点 投掷一粒均匀的六面体骰子, 数有可能是1、 、 、 、 、 共六种 共六种。 数有可能是 、2、3、4、5、6共六种。这六 种结果是基本结果,不可以再分解成更简单 种结果是基本结果, 的结果了, 的结果了,所以 ={1,2,3,4,5,6}为该 , , , , , 为该 试验的样本空间。 出现点数是奇数” 试验的样本空间。“出现点数是奇数”这一 事件就不是简单事件,它是由基本事件{1}, 事件就不是简单事件,它是由基本事件 , {3}和{5}组合而成的。我们通常用大写字母 , 组合而成的。 和 组合而成的 我们通常用大写字母A, B,C,…来表示随机事件,例如,设A表示 来表示随机事件, , , 来表示随机事件 例如, 表示 出现点数是奇数” “出现点数是奇数”,则A={1,3,5};设B , , ; 表示“出现点数是偶数” 表示“出现点数是偶数”,则B={2,4,6}。 , , 。
4-7
2. 概率的基本性质
性质1 1≥P(A)≥0。 性质 。 性质2 P( )=1。 性质 。 性质3 若事件 与事件 互不相容,即AB=Ф, 若事件A与事件 互不相容, 与事件B互不相容 性质 , 则P(A∪B)=P(A)+P(B)。 ∪ 。 推论1 不可能事件的概率为 ,即:P(Ф)=0。 不可能事件的概率为0, 推论 。 推论2 P( A )=1-P(A), A 表示 的对立事件,即 表示A的对立事件 的对立事件, 推论 它们二者必有一事件发生但又不能同时发生。 它们二者必有一事件发生但又不能同时发生。
4-5Βιβλιοθήκη 例:设一个袋子中装有白球2个,黑球 个。(1) 设一个袋子中装有白球 个 黑球3个 从中随机摸出1只球 只球, 从中随机摸出 只球,问刚好是白球的概率有 多大? 从中随机摸出2只球 一问2只球 只球, 多大? (2) 从中随机摸出 只球,一问 只球 都是白球的概率有多大? 二问2只球一白一黑 都是白球的概率有多大 二问 只球一白一黑 的概率有多大? 三问2只球都是黑球的概率有 的概率有多大 三问 只球都是黑球的概率有 多大? 多大 由于摸出的任何1只球都形成一个基 解:(1) 由于摸出的任何 只球都形成一个基 本事件,所以样本点总数为n=5。用A表示摸 本事件,所以样本点总数为 。 表示摸 出的是白球事件, 由两个基本点组成, 出的是白球事件,则A由两个基本点组成,即 由两个基本点组成 A={白球,白球 ,有利场合数 白球, 白球 白球},有利场合数m=2。因此, 。因此, 刚好摸出白球的概率为P(A)=m/n=2/5=0.4 刚好摸出白球的概率为
4-8
只黑球和1只白球 例:袋中装有4只黑球和 只白球,每次从袋中随机 袋中装有 只黑球和 只白球, 地摸出1只球 并换入1只黑球 连续进行, 只球, 只黑球。 地摸出 只球,并换入 只黑球。连续进行,问第三 次摸到黑球的概率是多少? 次摸到黑球的概率是多少? 解: 记A为“第三次摸到黑球”,则 为“第三次 为 第三次摸到黑球” A A 摸到白球” 先计算P( )。 摸到白球”。先计算 。 由于袋中只有1只白球 如果某一次摸到了白球, 只白球, 由于袋中只有 只白球,如果某一次摸到了白球,换 入了黑球,则袋中只有黑球了。所以相当于第一、 入了黑球,则袋中只有黑球了。所以相当于第一、 第二次都是摸到黑球,第三次摸到白球。 第二次都是摸到黑球,第三次摸到白球。注意这是 一种有放回的摸球,样本点总数为53, 一种有放回的摸球,样本点总数为 ,有利场合数 是42×1。故: 2 × 。 4 ⋅1 16 P( A )= 5 3 = 125 , 所以 42 ⋅1 109
()
5
3
=
125
4-9
3. 事件的独立性 对事件A与 , 定义 对事件 与B,若p(AB)=p(B)p(A),则称它们 , 是统计独立的,简称相互独立。 是统计独立的,简称相互独立。 已知袋中有6只红球 只白球 只红球, 只白球。 例:已知袋中有 只红球 4只白球。从袋中有放回地 取两次球,每次都取 每次都取1球 表示第i次取到红球 次取到红球。 取两次球 每次都取 球。设 Bi表示第 次取到红球。 那么, 那么, 36 6 3 P( B B ) 3
∑ P( B ) = ∑ C
k =0 k k =0
n
pq
= ∑ ( p + q) = 1
k =0
4-14
2. 连续型随机变量的概率分布 是一实数. 设X是R.V., x 是一实数 记 是 F(x)=P(X<x)。该函数就是随机变量 的分布 。该函数就是随机变量X的分布 函数。分布函数的导数称为密度函数, 函数。分布函数的导数称为密度函数,记作 p(x )。 。 性质 (1) p(x)≥0 ∞ (2) ∫ p (x ) d x = 1 −∞ P(a≤x<b) b (3) p(a < X < b) = ∫ p(x) d x
二、随机变量
随机变量X是定义在样本空间 ={ω1,ω2,…,ωn}上 随机变量 是定义在样本空间 上 的一个函数, 的一个函数,这个函数的取值随试验的结果不同而 变化。这个函数还要求满足条件:对任意的实数x, 变化。这个函数还要求满足条件:对任意的实数 , X<x是随机事件。如果随机变量所有可能的取值是 是随机事件。 是随机事件 有限的,或可排成一列的, 有限的,或可排成一列的,这种随机变量称为离散 型随机变量; 型随机变量;另一种情况是随机变量的取值范围是 一个区间或整个数轴, 一个区间或整个数轴,这种随机变量称为连续型随 机变量。 机变量。 1. 离散型随机变量的概率分布 设离散型随机变量X的所有可能取值为 的所有可能取值为x1, x2,…, 设离散型随机变量 的所有可能取值为 , xn, …,相应的概率为 ,相应的概率为p(x1),p(x2),…,p(xn),…。用 , 。 表格统一表示出来是: 表格统一表示出来是:
4-2
在随机试验中, 在随机试验中,可能出现也可能不出现的结 称之为随机事件,简称事件。 果,称之为随机事件,简称事件。试验的结 果可能是一个简单事件,也可能是一个复杂 果可能是一个简单事件, 事件。简单事件就是不可以再分解的事件, 事件。简单事件就是不可以再分解的事件, 又称为基本事件。 又称为基本事件。复杂事件是由简单事件组 合而成的事件。基本事件还可称为样本点, 合而成的事件。基本事件还可称为样本点, 设试验有n个基本事件 个基本事件, 设试验有 个基本事件,分别记为 ωi (i=1,2,…,n)。集合 ={ω1 ,ω2 , … ,ωn}称为 , 。 称为 样本空间, 中的元素就是样本点。 样本空间, 中的元素就是样本点。
µ = E ( X ) = ∑ x i p (x i )
性质: 性质:E αX1 + βX2 =αE X1 + βE X2 其中X1, 都是随机变量 都是随机变量, , 是任意常数 是任意常数。 其中 ,X2都是随机变量,α,β是任意常数。
(
I
)
( )
( )
4-12
定义: 离散型随机变量X的方差为 定义 离散型随机变量 的方差为 2 2 2 σ = D ( X ) = E ( X − µ ) = ∑ (xi − µ ) p ( xi ) 方差的平方根σ称为标准差。 方差的平方根 称为标准差。 称为标准差 方差σ 或标准差σ反映随机变量 反映随机变量X相对其期望 方差 2或标准差 反映随机变量 相对其期望 值的 离散程度, 越小, 离散程度,σ2或σ越小 说明期望值的代表性 越小 越好; 越大, 越好;σ2或σ越大,说明期望值的代表性越差。 越大 说明期望值的代表性越差。 性质:对于任意的α, 性质:对于任意的 ,D(αX)=α2 D(X) 成立
4-11
X x1 x2 … xn … P p(x1) p(x2) … p(xn) … 这称为离散型随机变量X的概率分布 的概率分布。 这称为离散型随机变量 的概率分布。 性质: 性质:(1) 0≤p(xi)≤1 (i=1,2, …); ; (2) ∑ p(xi ) = 1
i
定义: 离散型随机变量X的期望值为 定义 离散型随机变量 的期望值为
x
a
a
b
4-15
4-4
(二)概率 1. 概率的定义 概率就是指随机事件发生的可能性,或称为机率, 概率就是指随机事件发生的可能性,或称为机率, 是对随机事件发生可能性的度量。 进行n次重复试 是对随机事件发生可能性的度量。 进行 次重复试 随机事件A发生的次数是 发生的次数是m次 验,随机事件 发生的次数是 次,发生的频率是 m/n,当试验的次数 很大时,如果频率在某一数值 很大时, ,当试验的次数n很大时 p附近摆动,而且随着试验次数 的不断增加,频率 附近摆动, 的不断增加, 附近摆动 而且随着试验次数n的不断增加 的摆动幅度越来越小,则称p为事件 发生的概率, 为事件A发生的概率 的摆动幅度越来越小,则称 为事件 发生的概率, 记为: 记为:P(A)=p。在古典概型场合 即基本事件发生的 。在古典概型场合, 概率都一样的场合: 概率都一样的场合 m A包含的样本点个数 A的有利场合数 = P( A) = = 样本点总数 n 样本点总数
第四章 抽样与抽样分布
频率、 第一节 频率、概率与概率分布 第二节 抽样分布
4-1
频率、 第一节 频率、概率与概率分布
一、随机事件与概率 (一)随机试验与事件 随机现象的特点是:在条件不变的情况下, 随机现象的特点是:在条件不变的情况下,一系列 的试验或观测会得到不同的结果, 的试验或观测会得到不同的结果,并且在试验或观 测前不能预见何种结果将出现。 测前不能预见何种结果将出现。对随机现象的试验 或观测称为随机试验,它必须满足以下的性质: 或观测称为随机试验,它必须满足以下的性质: (1)每次试验的可能结果不是唯一的; )每次试验的可能结果不是唯一的; (2)每次试验之前不能确定何种结果会出现; )每次试验之前不能确定何种结果会出现; (3)试验可在相同条件下重复进行。 )试验可在相同条件下重复进行。
P ( B1 ) = P ( B2 ) = 10 = 5
P ( B2 B1 ) =
1 2
P( B1 )
=
100 = 3 5 5
,也就是说, 也就是说, B1,B2相互独立。从题目条件看,这一结论是显然的。 相互独立。从题目条件看,这一结论是显然的。
4-10
3 3 P ( B1 B2 ) = P ( B2 B1 ) P ( B1 ) = × = P ( B1 ) P ( B2 ) 因此, 因此, 5 5
4-3
例:投掷一粒均匀的六面体骰子,出现的点 投掷一粒均匀的六面体骰子, 数有可能是1、 、 、 、 、 共六种 共六种。 数有可能是 、2、3、4、5、6共六种。这六 种结果是基本结果,不可以再分解成更简单 种结果是基本结果, 的结果了, 的结果了,所以 ={1,2,3,4,5,6}为该 , , , , , 为该 试验的样本空间。 出现点数是奇数” 试验的样本空间。“出现点数是奇数”这一 事件就不是简单事件,它是由基本事件{1}, 事件就不是简单事件,它是由基本事件 , {3}和{5}组合而成的。我们通常用大写字母 , 组合而成的。 和 组合而成的 我们通常用大写字母A, B,C,…来表示随机事件,例如,设A表示 来表示随机事件, , , 来表示随机事件 例如, 表示 出现点数是奇数” “出现点数是奇数”,则A={1,3,5};设B , , ; 表示“出现点数是偶数” 表示“出现点数是偶数”,则B={2,4,6}。 , , 。
4-7
2. 概率的基本性质
性质1 1≥P(A)≥0。 性质 。 性质2 P( )=1。 性质 。 性质3 若事件 与事件 互不相容,即AB=Ф, 若事件A与事件 互不相容, 与事件B互不相容 性质 , 则P(A∪B)=P(A)+P(B)。 ∪ 。 推论1 不可能事件的概率为 ,即:P(Ф)=0。 不可能事件的概率为0, 推论 。 推论2 P( A )=1-P(A), A 表示 的对立事件,即 表示A的对立事件 的对立事件, 推论 它们二者必有一事件发生但又不能同时发生。 它们二者必有一事件发生但又不能同时发生。
4-5Βιβλιοθήκη 例:设一个袋子中装有白球2个,黑球 个。(1) 设一个袋子中装有白球 个 黑球3个 从中随机摸出1只球 只球, 从中随机摸出 只球,问刚好是白球的概率有 多大? 从中随机摸出2只球 一问2只球 只球, 多大? (2) 从中随机摸出 只球,一问 只球 都是白球的概率有多大? 二问2只球一白一黑 都是白球的概率有多大 二问 只球一白一黑 的概率有多大? 三问2只球都是黑球的概率有 的概率有多大 三问 只球都是黑球的概率有 多大? 多大 由于摸出的任何1只球都形成一个基 解:(1) 由于摸出的任何 只球都形成一个基 本事件,所以样本点总数为n=5。用A表示摸 本事件,所以样本点总数为 。 表示摸 出的是白球事件, 由两个基本点组成, 出的是白球事件,则A由两个基本点组成,即 由两个基本点组成 A={白球,白球 ,有利场合数 白球, 白球 白球},有利场合数m=2。因此, 。因此, 刚好摸出白球的概率为P(A)=m/n=2/5=0.4 刚好摸出白球的概率为
4-8
只黑球和1只白球 例:袋中装有4只黑球和 只白球,每次从袋中随机 袋中装有 只黑球和 只白球, 地摸出1只球 并换入1只黑球 连续进行, 只球, 只黑球。 地摸出 只球,并换入 只黑球。连续进行,问第三 次摸到黑球的概率是多少? 次摸到黑球的概率是多少? 解: 记A为“第三次摸到黑球”,则 为“第三次 为 第三次摸到黑球” A A 摸到白球” 先计算P( )。 摸到白球”。先计算 。 由于袋中只有1只白球 如果某一次摸到了白球, 只白球, 由于袋中只有 只白球,如果某一次摸到了白球,换 入了黑球,则袋中只有黑球了。所以相当于第一、 入了黑球,则袋中只有黑球了。所以相当于第一、 第二次都是摸到黑球,第三次摸到白球。 第二次都是摸到黑球,第三次摸到白球。注意这是 一种有放回的摸球,样本点总数为53, 一种有放回的摸球,样本点总数为 ,有利场合数 是42×1。故: 2 × 。 4 ⋅1 16 P( A )= 5 3 = 125 , 所以 42 ⋅1 109