概率论抽样分布.pptx
合集下载
抽样与抽样分布.pptx
参数估计也就是用样本统计量去估计总体的 参数。比如,用样本均值估计总体均值估计 总体均值,用样本方差估计总体方差,用样 本比例估计总体比例等。
用计来量估,计用总符体号参 数表的示统计量的名称,称为估
用来估计总体参数时计算出来的估计量的具 体数值,称为估计值
点估计与区间估计
参数估计的方法有点估计和区间估计 ◆(一)点估计
x 的分布形式与原有总体和样本容量n的大
小有关 .3 总体分布
.3 P ( x ) 抽样分布
.2
.2
.1
0 1
234
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
= 2.5
σ2 =1.25
当总体服从正态分布N(μ, 2 )n时,样本均值的抽
样分布仍然是服从正态分布的,其均值仍为 μ , 方差为 ,即2 n样本均值的方差比原总体的方差 要小,而且样本容量n越大,方差越小。
点估计又称定值估计。它是用实际样本指标 数值代替总体指标数值,即总体平均数的点 估计值就是样本平均数,总体成数的点估计 值就是样本成数。这种估计不考虑是否有抽 样误差。
例如,对一批某种型号的电子元件10000只 进行耐用时间检查,随机抽取100只,测试的 平均耐用时间子元件的平均耐用时 间为1055小时,全部电子元件的合格率也是 91%。
.2
.1 0
1
234
现从总体中抽取n=2的简单随机样本,在重复抽样条件 下,共有42=16个样本。所有样本的结果为
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
用计来量估,计用总符体号参 数表的示统计量的名称,称为估
用来估计总体参数时计算出来的估计量的具 体数值,称为估计值
点估计与区间估计
参数估计的方法有点估计和区间估计 ◆(一)点估计
x 的分布形式与原有总体和样本容量n的大
小有关 .3 总体分布
.3 P ( x ) 抽样分布
.2
.2
.1
0 1
234
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
= 2.5
σ2 =1.25
当总体服从正态分布N(μ, 2 )n时,样本均值的抽
样分布仍然是服从正态分布的,其均值仍为 μ , 方差为 ,即2 n样本均值的方差比原总体的方差 要小,而且样本容量n越大,方差越小。
点估计又称定值估计。它是用实际样本指标 数值代替总体指标数值,即总体平均数的点 估计值就是样本平均数,总体成数的点估计 值就是样本成数。这种估计不考虑是否有抽 样误差。
例如,对一批某种型号的电子元件10000只 进行耐用时间检查,随机抽取100只,测试的 平均耐用时间子元件的平均耐用时 间为1055小时,全部电子元件的合格率也是 91%。
.2
.1 0
1
234
现从总体中抽取n=2的简单随机样本,在重复抽样条件 下,共有42=16个样本。所有样本的结果为
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
6第六章概率与抽样分布.ppt
(2) P(X >2)=1- P(2 X)=1-0.9973=0.0227 (3) P(-1<X 3)= P(X 3)- P(X <-1)
= (3)- (-1)= (3) – [1-(1)]
= 0.9987-(1-0.8413)=0.8354
(4) P(| X | 2) = P(-2 X | 2)= (2)- (-2) = (2)- [1-(2)]=2 (2)- 1=0.9545
三、t—分布
1.构造 若~N(0, 1), ~2(n), 与独立,则
T ~ t(n). /n
t(n)称为自由度为n的t分布。
t(n) 的图形为
2.基本性质:
(1) f(t)关于t=0(纵轴)对称。
(2) f(t)的极限为N(0,1)的密度函数,即
3.分位点limf(t)(t)
1
t2
e2,x
n
[ 例 ] 1人 00 X 的 ~ N ( 1,8 身 7 2 ) 0 P { 1 高 5 x 1 4 } 8 ?6
P { 1 5 x 1 4 } 8 P { 6 Z Z /2 2 } 9 .4 5 % 5
当 Z 1 P 0 .6; 8 当 Z 2 1 . 7 9 6 P 0 .95
第六章 概率与抽样分布
STAT
教学重点 教学过程 教学总结
第六章 概率与抽样分布
• 第一节
★• 第二节
• 第三节 • 第四节
概率基础 随机变量及其概率分布 抽样分布 大数定律与中心极限定律
一、正态分布
• 1. 描述连续型随机变量的最重要的分布 • 2. 可用于近似离散型随机变量的分布
– 例如: 二项分布
正态分布
(例题分析)
【例】设X~N(5,32),求以下概率
= (3)- (-1)= (3) – [1-(1)]
= 0.9987-(1-0.8413)=0.8354
(4) P(| X | 2) = P(-2 X | 2)= (2)- (-2) = (2)- [1-(2)]=2 (2)- 1=0.9545
三、t—分布
1.构造 若~N(0, 1), ~2(n), 与独立,则
T ~ t(n). /n
t(n)称为自由度为n的t分布。
t(n) 的图形为
2.基本性质:
(1) f(t)关于t=0(纵轴)对称。
(2) f(t)的极限为N(0,1)的密度函数,即
3.分位点limf(t)(t)
1
t2
e2,x
n
[ 例 ] 1人 00 X 的 ~ N ( 1,8 身 7 2 ) 0 P { 1 高 5 x 1 4 } 8 ?6
P { 1 5 x 1 4 } 8 P { 6 Z Z /2 2 } 9 .4 5 % 5
当 Z 1 P 0 .6; 8 当 Z 2 1 . 7 9 6 P 0 .95
第六章 概率与抽样分布
STAT
教学重点 教学过程 教学总结
第六章 概率与抽样分布
• 第一节
★• 第二节
• 第三节 • 第四节
概率基础 随机变量及其概率分布 抽样分布 大数定律与中心极限定律
一、正态分布
• 1. 描述连续型随机变量的最重要的分布 • 2. 可用于近似离散型随机变量的分布
– 例如: 二项分布
正态分布
(例题分析)
【例】设X~N(5,32),求以下概率
概率论与数理统计基本概念及抽样分布PPT课件
~
2 (n1 ),
2 2
~
2 (n2 ), 且它们相互独立,
则
2 1
2 2
~
2 (n1
n2 )
《概率统计》
返回
下页
结束
4. 2分布的百分位点
对给定的α(0<α<1)
(1)称满足
P{ 2
2
(n)}
,即
f ( y)dy
x2 ( n)
的点为 2分布的上100α百分位点。
f(y)
(2)称满足
注:在研究中,往往关心每个个体的一个(或几个)数量指标和 该数量指标在总体中的分布情况. 这时,每个个体具有的数量 指标的全体就是总体.
或,总体:研究对象的某项数量指标的值的全体.
《概率统计》
某批 灯泡的 寿命
该批灯泡寿命的 全体就是总体
返回
下页
结束
为推断总体分布及各种特征,按一定规则从总体中抽取若 干个体进行观察试验,以获得有关总体的信息,这一抽取过程 为 “抽样”.
( x)
(1)称满足条件 P{X>Xα} =α,
α
即
( x)dx
X
的点Xα为N(0,1)分布的上100α百分位点.
X1-α
0
由于 P{X X } 1 记 -Xα= X1-α
(2)称满足条件 P {| X | X }
2
2
的点 X 为N(0,1)分布的双侧100α百分位点.
X
2
则
E(X )
E(1 n
n i 1
Xi)
1 n
n i 1
E(Xi )
1 n
n
D(X ) D(1 n
n i1
Xi)
概率第6章 样本及抽样分布PPT课件
Xi
i 1, 2,
,n
显然Y1,Y2, ,Yn相互独立,且Yi N 0,1 i 1, 2,
于是
2
n i 1
(
X
i
)2
n
Yi 2
i 1
2
n
(2)
X1
X2
~
N
(0,
2
2
),
(
X1 X
2 2
2
)2
~
2 (1)
2X3
X4
X5
~
N(0, 6
2 ), (2X3
X4
6 2
X 5 )2
~
[说明]:后面提到的样本均指简单随机样本,由概率论知,若总体X 具有概率密度f(x),
则样本(X1,X2,…,Xn)具有联合密度函数:
n
fn x1, x2, xn f xi
i1
3
统计量:样本的不含任何未知参数的函数。
常用统计量:设(X1,X2,…,Xn)为取自总体X的样本
1.
样本均值
定理6.4:t n分布的概率密度为:f t, n
n1 2
n
n 2
1
t2 n
n1 2
,
t
对给定的 ,
0
1, 称满足条件
t n
f
t, n dt
的点t
n
为t n分布的上分位数。t分布的上分位数可查t分布表
f (x)
n 10
f x
t1 (n) t (n)
n4
n 1
3 2 1 0 1 2 3
Y1 g1 X1, , X n1 ,Y2 g2 X n11, , X n2 , ,Yk gk X , n1 nk11 , X n
三概率分布与抽样分布【共44张PPT】
下表是工商07级1班、2班某门课的考试成绩。
比如,有些产品出厂时不仅需要标注其性能参数均值,而且要标明均值的方差(标准差)。
二项分布、几何分布都是贝努利试验导出的分布。
其中N为产品总数,n为试验次数也即抽取出的产品数;
实际中,要求n≥30。
二项分布、几何分布都是贝努利试验导出的分布。
二项分布与几何分布都是在n重或可列重相互独立的贝努利试验中形成的。
概率是曲线下的面积
P( aXb) bf( x) dx a f(x)
ab
x
从概率的角度重新看这几个指标:
随机变量的均值 E(X)
n
xip(xi )
xif (x)dx
i1
(和的均值 均值之和)
随机变量的方差 var(X)
n
(xi E(X))2 p(xi )
(xi
E(X))2 f
中心极限定理(Central Limit Theorem):
对于样本比例(成数)来说,中心极限定理也同样成立:
设从成数为P0的总体中抽取大小为n的样本,当n充分大
时,样本成数总是近似服从
N(P0,的P0正(1态n分P布0)。)即:
E(p)
P0,D(p)
n1P0(1P0)
p~N(P0,
n1P0(1P0))
P(AB)=P(B)P(A¦B) 将上式中A、B的位置对调,可得:
P(AB)=P(A)P(B¦A) 以上两式统称概率乘法公式。
全概率公式与逆概率公式:
1 1、完备事件组 、完备事件组
其中N为产品总数,n为试验次数也即抽取出的产品数;
若事件A 、A 、…A 互不相容(互斥),且其中之一必然 随机变量:离散型、连续型。
第2章 概率分布与抽样分布.ppt
例4-1 抛硬币的结果不是正面就是反面,如果 每次硬币为正面的概率是0.5。则抛硬币10 次 中6次正面的概率为多少?
(1)建立“BINOMDIST函数.xls”工作表,输 入有关数据,如图4-1所示。
(2)在单元格C2中输入公式 “=BINOMDIST(B2,B3,B4,FALSE)”,按回车 键显示结果等于0.205078,如图4-2所示。表示 抛10硬币出现6次的概率为0.205078。
返回首页Βιβλιοθήκη 4.1.1 概率与概率分布
Excel提供的离散概率分布包括: l BINOMDIST:二项分布 l CRITBINOM:累积二项分布(依临界值,找
最小整数K) l HYPGEOMDIST:超几何分布 l NEGBINOMDIST:负二项分布 l POISSON:泊松分布
Excel提供的连续概率分布包括: l BETADIST:累积概率密度函数 l BETAINV:累积概率密度函数的反函数 l EXPONDIST:指数分布函数 l GAMMADIST:伽玛分布函数 l GAMMAINV:伽玛累积分布函数的反函数 l LOGNORMDIST:对数正态累加分布函数
1.正态分布函数
(1)正态分布函数。 (2)标准正态分布函数。 (3)正态分布函数的反函数。 (4)标准正态分布函数的反函数。
2.绘制正态分布图形
(1)建立正态分布基本数据。 (2)绘制正态分布图形。
图4-7 “序列”对话框
图4-8 结果显示(4~117行隐藏)
图4-9 “坐标轴格式”对话框
值; ,即样本均值抽样分布的方差等于
x
n
总体方差除以样本容量的平方根,即
V(x)
2 x
2 ,
n
此式又称为标准误差,是抽样分布的标准差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Sw2 .
S12和S22分别是来自两个总体样 本的修正
样本方差;
(3)
F
S1*2
/
2 1
S2*2
/
2 2
~
F (n1
1,
n2
1).
证 (1)、略
(2) 由引理及定理5.3,知
X
Y
~
N
(
1
2
,
2
n1
2)
n2
U ( X Y ) (1 2 ) 11
~ N (0,1),
n1 n2
由 (n1
1)S1*2
2)
~
t ( n1
n2
2).
(3)
(n1 1)S1*2
2 1
~
2(n1 1),
(n2
1)S2*2
2 2
~
2(n2
1),
由假设
S*2 1
,
S *2 2
独立,
则由 F 分布的定义知
(n1 1)S1*2
(n1
1)
2 1
(n2
1)S
*2 2
(n2
1)
2 2
~ F (n1 1, n2 1),
第三节 抽样分布
一、问题的提出 二、抽样分布定理
回
停 下
一、问题的提出
由于统计量依赖于样本,而后者又是随机变量
故统计量也是随机变量,因而统计量就有一定的
概率分布.称这个分布为“抽样分布”. 也即抽样 分布就是统计量的分布.
抽样分布
精确抽样分布
渐近分布
(小样本问题中使用) (大样本问题中使用)
这一节, 我们来讨论正态总体的抽样分布.
认为该厂生产的灯泡质量合格,若要使通过检
验的概率超过0.997,问至少检查多少只灯泡.
解 以X记样本均值,则
所以
X ~ N (2250, 2502 ) n
P( X 2200) P( n( X 2250) n(2200 2250))
250
250
1 ( n(2200 2250) 1 ( n) 0.997
i 1
1. 样本来自单个正态总体
定理5.3 设样本 ( X1, X2, , Xn ) 是来自总体 X , 而
X ~ N (, 2 ),
则 (1) 样本均值
X
1 n
i
n 1
X
i
~
N(, 2
/ n),
或 U X n ~ N (0, 1).
目的: 估计总体
标准化样本均值
数学期望 .
样本关于X的平均偏离程度
即
F
S1*2
/
2 1
S2*2
/
2 2
~
F (n1
1,
n2
1).
例2 设X ,Y相互独立,X ~ N (0,4),Y ~ N (2,9)
试求正实数a,b,使得aX bY ~ N (2,13).
解 因为相互独立正态随机变量的线性和仍为 正态,且
E(aX bY ) aEX bY 2b
D(aX bY ) a2DX b2DY 4a2 9b2
n
故他们的线性函数 Ci Xi仍为正态变量,又
i 1
n
n
n
E( Ci X i ) Ci E( X i ) Ci i
i 1
i 1
i 1
n
n
n
D( Ci Xi )
C
2 i
D(
X
i
)
C
i2
2 i
i 1
i 1
i 1
所以
n
n
n
Ci Xi ~ N (
Cii ,
Ci2
2 i
).
i 1
i 1
(2) V
Sn2
2
nSn2
2
(n 1)Sn*2
2
目的 : 估计 2.
n
1
2
n
(Xi
i 1
X )2
~
2(n 1)
D( X ) 2 : 样本
n 均值X关于总体
其中Sn2 是样本方差.
期望的偏离程度
(3) X 与 Sn2 独立.
注
1
V
1
2
n
(Xi
i 1
X )2 ~
2(n
1),
自由度减少一个! 减少一个自由度的原因:
V
(n
1)Sn*2
2
~
2(n
1),
且两者独立, 由 t 分布的定义知
T
U V
X / n
(n 1)Sn*2
2(n 1)
~ t(n 1).
n1
例1 某厂生产的灯泡使用寿命X ~ N (2250,2502 )
现进行质量检查,方法如下:任意挑选若干个
灯泡,如果这些灯泡的平均寿命超过2000h,就
250
5
即
n
n
Φ( ) 0.997 5
5
u10.997 n 190
所以,要是检查能通过的概率超过0.997,至
少应该检查190只灯泡.
灯泡的寿命
2. 样本来自两个正态总体
定理5.4
若X
~
N
(
1
,
2 1
),
Y
~N
(
2
,
2 2
),
X与Y相互独立. 样本( X1, X2, , Xn1 )
与 (Y1, Y2, , Yn2 ) 分别来自总体X和Y,则
所以 由a,b 0,且 2b 2 4a2 9b2 13
得 a 1,b 1.
例3设X1, X2,, Xn是来自正态总体 N (, 2 )的样本
二、抽样分布定理
引理 设随机变量列X1, X2 , , Xn 相互独立,且 Xi ~ N ( i, i2 ) (i 1,2,, n)
则它们的任一确定的线 性函数
n
n
n
Ci Xi ~ N (
Cii ,
Ci
2
2 i
).
i 1
i 1
i 1
其中C1,C2,,Cn为不全为零的常数 .
证 由于X1, X 2 ,, X n独立且均为正态变量 ,
3°在实际问题中,总体方 差 2常常是未知的, 若将标准样本均值 U中的用Sn*代替, 则有如下推论:
推论1 设( X1, X2, , Xn ) 是总体 N (, 2 ) 的样本,
X , Sn*2 分别是样本均值和修正 样本方差, 则有
T
X Sn*
/n
X Sn /
n1
~
t(n 1).
证
U X ~ N (0,1), / n
{ Xi X }(i 1,2,n)不相互独立.
n
事实上,它们受到一个条件的约束: Xi nX
i 1
n
i 1
Xi
X
1
n
(
i 1
Xi
nX )
1
0
0.
2°若X不服从正态分布,由中 心极限定理知,
当 n 1 (一般n 30) 时,
U X
近似
n ~ N (0, 1),
其中 E( X ), 2 D( X ).
(1)
X
Y
~
N
(1
2
,
2 1
n1
2 2
)
n2
或 ( X Y ) (1 2 ) ~ N (0,1);
2 1
/
n1
2 2
/
n2
(2) 当
2 1
2 2
2
时,
T
(X
Y Sw
)
(1
11 n1 n2
2 )
~
t(n1
n2
2),
其中
Sw2
(n1
1)S1*2 n1
(n2 1)S2*2 n2 2
,
Sw
2
~
2(n1
1),
(n2
1)S2*2
2
~
2(n2
1),
且它们相互独立 , 故由 2 分布的可加性知
V
(n1
1)S1*2
2
(n2
1)S2*2
2
~ 2(n1 n2 2),
由于 U 与V 相互独立,按 t 分布的定义
T
U
V /(n1 n2 2)
(X
Y Sw
) (1
11 n1 n2