抽样分布与参数估计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 3.总体是唯一的、确定的,而样本是不确定的、可变
的、随机的。
22
样本容量与样本个数
• 样本容量:一个样本中所包含的单位数,用n 表示。
• 样本个数:又称样本可能数目,指从一个总体 中所可能抽取的样本的个数。对于有限总体, 样本个数可以计算出来。样本个数的多少与抽 样方法有关。(这个概念只是对有限总体有意 义,对无限总体没有意义!)
27
重置抽样分布--样本平均数的分布
• 某班组5个工人的日 工资为34、38、42、 46、50元。
• = 42
• 2 = 32
• 现用重置抽样的方法 从5人中随机抽2个构 成样本。共有52=25 个样本。如右图。
样本
34,34 34,38 34,42 34,46 34,50 38,34 38,38 38,42 38,46 38,50 42,34 42,38 42,42 42,46 42,50
• (2) pxi 1 i
• 定义: 离散型随机变量X的期望值为

EX xi pxi
• 性质:
I
• 其中X1,X2都是随机变量,α,β是任意常数。
EX1 X 2 EX1 EX 2
12
• 定义: 离散型随机变量X的方差为
2 D( X ) EX 2 xi 2 pxi
23
总体参数和样本统计量
• 总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。 • 样本统计量:根据样本分布计算的指标。是随机变量。
总体
样本

☺ ☺
☺☺ ☺☺☺
☺☺ ☺
参数
、2
p
平均数 标准差、方差
成数
统计量
X
S、 S2
P
s2
(x x n 1
)2
s2
(x
f
x)2 1
f
24
重复(置)抽样与不重复(置)抽样
75分的概率。
p(60 X 75)
p(6070 X 70 7570)
10
10
10
p(1 Z 0.5)
0.5328
19
第二节 抽样分布
• 一、抽样的基本概念 • 二、抽样分布
(一)重复抽样分布 (二)不重复抽样分布
• 三、大数定理与中心极限定理
20
一、抽样的基本概念
• 抽样涉及的基本概念有: – 总体与样本(见第一章) – 样本容量与样本个数 – 总体参数与样本统计量 – 重复抽样与不重复抽样
i
• 方差的平方根σ称为标准差。 • 方差σ2或标准差σ反映随机变量X相对其期望值的 • 离散程度,σ2或σ越小, 说明期望值的代表性越好;σ2
或σ越大,说明期望值的代表性越差。 • 性质:对于任意的α,D(αX)=α2 D(X) 成立
13
• 贝努里试验 与二项分布
• 有时我们只对试验中某事件A是否出现感兴趣,如果A
重置抽样分布--样本平均数的分布
样本平均数 X 34 36 38 40 42 44 46 48 50
合计
频数
1 2 3 4 5 4 3 2 1
25
E(X)
X
Xf f
42(元)
2(
– 推论2 P( A)=1-P(A), A表示A的对立事件,即它
们二者必有一事件发生但又不能同时发生。
8
• 例:袋中装有4只黑球和1只白球,每次从袋中随机地 摸出1只球,并换入1只黑球。连续进行,问第三次摸 到黑球的概率是多少?
• 解: 记A为“第三次摸到黑球”,则A 为“第三次摸
到白球”。先计算AP( )。
• 这些概念是统计学特有的,体现了统计学
的基本思想与方法。
21
总体和样本(参见第1章)
• 1.总体:又称全及总体、母体,指所要研究对象的全 体,由许多客观存在的具有某种共同性质的单位构成。 总体单位数用 N 表示。
• 2.样本:又称子样,来自总体,是从总体中按随机原 则抽选出来的部分,由抽选的单位构成。样本单位数 用 n 表示。
• (2) pxd x 1
• (3)
b
• p(a X b) p(x)d x
a
P(a≤x<b)
x
a
b
15
• 定义: 连续型随机变量X的期望值为
EX
xp(x) d
x

• 方差为

2
D(X
)
EX
2
ቤተ መጻሕፍቲ ባይዱ
x
2
pxd
x
• 性质:
EX1 X 2 EX1 EX 2
D(αX)=α2 D(X)
16
P(B1B2 ) P(B1)
36 100 3 5
3 5
• 因此,

• 也就是说,B1,B2相互独立。从题目条件看,这一 结论是显然的。
10
二、随机变量
• 随机变量X是定义在样本空间 Ω={ω1,ω2,…,ωn}上的 一个函数,这个函数的取值随试验的结果不同而变化。 这个函数还要求满足条件:对任意的实数x,X<x是随 机事件。如果随机变量所有可能的取值是有限的,或 可排成一列的,这种随机变量称为离散型随机变量; 另一种情况是随机变量的取值范围是一个区间或整个 数轴,这种随机变量称为连续型随机变量。
pz
1
z2
e2
2
z
17
• 一般正态分布 与标准正态分布 的关系: • 若随机变量X服从正态分布N (μ,σ2),则随机
• 变量 Z = X 服从标准正态分布,即Z~N(0,1)。
18
• 例:某大学英语考试成绩服从正态分布,已知平均成 绩为70分,标准差为10分。求该大学英语成绩在60—
4
• (二)概率 • 1. 概率的定义 • 概率就是指随机事件发生的可能性,或称为机率,是
对随机事件发生可能性的度量。 进行n次重复试验, 随机事件A发生的次数是m次,发生的频率是m/n,当 试验的次数n很大时,如果频率在某一数值p附近摆动, 而且随着试验次数n的不断增加,频率的摆动幅度越来 越小,则称p为事件A发生的概率,记为:P(A)=p。在 古典概型场合, 即基本事件发生的概率都一样的场合:
本空间,Ω中的元素就是样本点。
3
例:投掷一粒均匀的六面体骰子,出现的点数 有可能是1、2、3、4、5、6共六种。这六种结 果是基本结果,不可以再分解成更简单的结果 了,所以Ω={1,2,3,4,5,6}为该试验的样 本空间。“出现点数是奇数”这一事件就不是 简单事件,它是由基本事件{1},{3}和{5}组合而 成的。我们通常用大写字母A,B,C,…来表示 随机事件,例如,设A表示“出现点数是奇数”, 则A={1,3,5};设B表示“出现点数是偶数”, 则B={2,4,6}。
• NOTE:
n
n
n
P(Bk )
C
k n
pk qnk
( p q)n 1
k0
k0
k0
14
• 2. 连续型随机变量的概率分布
• 设X是R.V., x 是一实数. 记
• F(x)=P(X<x)。该函数就是随机变量X的分布函数。分布 函数的导数称为密度函数,记作p(x )。
• 性质
• (1) p(x)≥0
C
n N
n
-
1
(N n-1)! (N -1)!n!
25
重复(置)抽样与不重复(置)抽样
• 不重复抽样:
• 例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2
B AC
D
A
BC D
A B C D
A B DC
A B EC D
E
E
E
E

考虑顺序时:样本个数
PNn
N! (N - n)!
2
• 在随机试验中,可能出现也可能不出现的结 果,称之为随机事件,简称事件。试验的结 果可能是一个简单事件,也可能是一个复杂 事件。简单事件就是不可以再分解的事件, 又称为基本事件。复杂事件是由简单事件组 合而成的事件。基本事件还可称为样本点,
设(i=试1,2验,…有,nn个)。基集本合事Ω件={,ω1分,ω别2记, …为,ωn}i称为样
第六章 抽样分布与参数估计
• 第一节 频率、概率与概率分布 • 第二节 抽样分布 • 第三节 总体参数估计
1
第一节 频率、概率与概率分布
• 一、随机事件与概率 • (一)随机试验与事件 • 随机现象的特点是:在条件不变的情况下,一系
列的试验或观测会得到不同的结果,并且在试验 或观测前不能预见何种结果将出现。对随机现象 的试验或观测称为随机试验,它必须满足以下的 性质: • (1)每次试验的可能结果不是唯一的; • (2)每次试验之前不能确定何种结果会出现; • (3)试验可在相同条件下重复进行。
发生,我们称“成功”,否则称“失败”。像这样只 有两种结果的试验称为贝努里试验。设A出现的概率为 p,我们独立地重复进行n次贝努里试验,称为n重贝努 里试验.以Bk表示n重贝努里试验中事件A正好出现k次 这一事件,则

p Bk
C
k n
pk qnk
(k=0,1,2,…,n)
• 该分布称为二项分布( q= 1- p ).
PA
m n
A包含的样本点个数 样本点总数
A的有利场合数
样本点总数
5
• 例:设一个袋子中装有白球2个,黑球3个。(1) 从中随机摸出1只球,问刚好是白球的概率有 多大? (2) 从中随机摸出2只球,一问2只球都 是白球的概率有多大? 二问2只球一白一黑的概 率有多大? 三问2只球都是黑球的概率有多大?
样本平
均数 X
34 36 38 40 42 36 38 40 42 44 38 40 42 44 46
样本
46,34 46,38 46,42 46,46 46,50 50,34 50,38 50,42 50,46 50,50
样本平
均数 X
40 42 44 46 48 42 44 46 48 50
28
• 1. 离散型随机变量的概率分布 • 设离散型随机变量X的所有可能取值为x1, x2,…,
xn, …,相应的概率为p(x1),p(x2),…,p(xn),…。用表格 统一表示出来是:
11
X x1 x2 … xn …
P p(x1) p(x2) … p(xn) … • 这称为离散型随机变量X的概率分布。 • 性质:(1) 0≤p(xi)≤1 (i=1,2, …);
2 5


P(A)=P(2只球都是白球)=1/
C
2 5
=1/10
• P(B)=P(2只球一白一黑)=2×3/10=6/10
• P(C)=P(2只球都是黑球)=3/10
• NOTE: P(A+B+C)=1
7
2. 概率的基本性质 – 性质1 1≥P(A)≥0。 – 性质2 P(Ω)=1。 – 性质3 若事件A与事件B互不相容,即AB=Ф,则 P(A∪B)=P(A)+P(B)。 – 推论1 不可能事件的概率为0,即:P(Ф)=0。
• 重置抽样与不重置抽样(各有3个特点P90)
• 重复抽样:例如从A、B、C、D、E五个字母中随机抽 取两个作为样本。N=5,n=2
A B AC D E
A B BC D E
A B CC D E
A B DC D E
A B EC D E
– 考虑顺序时:样本个数=Nn=52=25
– 不考虑顺序时:
– 样本个数=
• 由于袋中只有1只白球,如果某一次摸到了白球,换入
了黑球,则袋中只有黑球了。所以相当于第一、第二
次都是摸到黑球,第三次摸到白球。注意这是一种有
放回的摸球,样本点总数为53,有利场合数是42×1。
故:
P( A)=

42 1 ,16 53 125

所以
PA 1 P A
42 1 109 1
53 125
9
• 3. 事件的独立性
• 定义 对事件A与B,若p(AB)=p(B)p(A),则称它们是 统计独立的,简称相互独立。
• 例:已知袋中有6只红球, 4只白球。从袋中有放回
地那取么两,次球,每次都取1球。设Bi表示第i次取到红球。
63 P(B1) P(B2 ) 10 5
P(B2
B1)
B
AC
BC
C
D
E
D
D
D
E
E
E

不考虑顺序时:样本个数
C
n N
N! (N - n)!n!
E
26
二、抽样分布
• 抽样分布的概念:由样本统计量的全部可能取值和与之 相应的概率(频率)组成的分配数列。(主要求出样本 平均数的期望与方差)
• 包括以下内容 – 重置抽样分布 • 样本平均数的分布 • 样本成数的分布 – 不重置抽样分布 • 样本平均数的分布 • 样本成数的分布
• 正态分布
• 如果连续型随机变量X的密度函数为
p x
1
x 2
e 2 2
2
x
• 则称随机变量X服从均值为μ,方差为σ2的正态分布, 记为X~N(μ,σ2)。
• 如果一个正态分布的μ=0,σ=1,则称该正态布为标准 正态分布,相应的随机变量称为标准正态随机变量, 用Z表示,即Z~N(0,1),相应的分布密度函数为
• 解:(1) 由于摸出的任何1只球都形成一个基本 事件,所以样本点总数为n=5。用A表示摸出的 是白球事件,则A由两个基本点组成,即A={白 球,白球},有利场合数m=2。因此,刚好摸出 白球的概率为P(A)=m/n=2/5=0.4
6
• (2) 由于摸出2只球才成一个基本事件,所以样本点总
数为
C
相关文档
最新文档