统计量及样本分布的数字特征
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解:由T~N (62,52 )及n 20得
T~N (62, 25),即T~N (62,1.25) 20
由例1知 T 62 ~N (0,1) 1.12
所以P{T 60} P{T 62 60 62} (1.79) 0.0367 1.12 1.12
由此可见,任取一容量为20的样本,其保温温度平均值低于 600 C的概率约为3.67%。
T1 T2 25 25 20 12
1 P
3 T1 T2 10 10
3
10
3
1[( 3 ) ( 3 )]
10
10
2[1 ( 3 )] 2[1 (0.548)] 10
2(1 0.7088) 0.5824
1
25 20
25 12
58.24%
以即 上两 的次 概独 率立 为抽
S 2 1 n n 1 i1
2
Xi X
它的观测值为:
s2
1 n 1
n i1
( xi
2
x)
3.样本均方差或标准差
S
1n n 1 i1
Xi X
2
它的观测值为:
s
s2
1 n 1
n i 1
( xi
2
x)
样本均值反映总体X取值的平均,样本方差或 标准差反映总体X取值的离散程度。
例如: 设 ( X1, X 2 , X3) 是从正态总体 N (, 2 ) 中抽取
的一个样本,其中 为已知参数, 为未知参数,
则
1 n
(
X1
X
2
X
n
)
X12
X
2 2
Xn2
X1 X 2 3 X3 X12 3 X 2 X 3 都是统计量
X1
X2
X
2 3
X1X 2 X3 不是统计量
几个常用的统计量(样本分布的数字特征)
n
要使P{| X 30 | 1} 0.95,即有2(0.25 n)1 0.95,
也即(0.25 n) 0.975,查标准正态分布表得(1.96) 0.975
由于(x)单调增加,所以应有0.25 n 1.96, 即n 61.4656,因此,样本容量至少应取为62.
2.样本方差(sample variance)
样 的 平 。均 值 相 差
10 C
例4:设总体X~N (30,16),从总体X中抽取容量为n的样本, 要使P{| X 30 | 1} 0.95,问样本容量n至少应取多大?
解:由于 P{| X 30 | 1} P{1 X 30 1}
P{ 1 4
n
X
30 4
1 4
n} 2(0.25 n) 1
因此,
X
1
,
X
2
,,
X
的线性函
n
数X
1 n
n i 1
X
服从正态分
i
布,
因为E( X i ) ,D( X i ) 2,所以
E(X )
1 n
n i 1
E(Xi ) , D(X )
1 n2
n i 1
D(
X
i
)
2
n
故X~N (, 2 )
n
X的标准化随机变量X
服从标准正态分布,即
n
X
定义1:设X1, X 2,, X n是来自总体X的样本,x1, x2,, xn 是样本观测值,如果g(t1,t2,,tn )为已知的n元函数,则 g( X1,X 2,, X n )为样本函数,它也是一个随机变量,称 g(x1, x2,, xn )为样本函数的观测值。
如果样本函数 g( X1,X 2,, X n )中不含有任何未 知参数,则称这种样本 函数为统计量。
~N(0,1)
n
例2:设X~N
(1
,
2 1
),Y~N
(
2
,
2 2
)
.X
,
Y相互独立。
分别从总体X和总体Y中抽取样本X1, X 2 ,, X n1及
Y1,Y2 ,,Yn2 , 记样本均值分别为X和Y ,
试讨论 X Y (1 2 ) 满足什么样的分布
2 1
2 2
n1 n2
解: X1, X 2 ,, X n与Y1,Y2 ,,Yn相互独立,因此X和Y相互
解:由抽样的结果计算得:
x
1 n
n i 1
xi
1 (20.06 19.99) 10
y
1 n
n i 1
yi
1 (19.88 19.98) 10
s甲2
1 n 1
n i 1
( xi
2
x)
1 9
(2)设T1是容量为20的样本平均值,T2是容量为12的样本
平均值,则
T1~N
(62,
25 20
),T2~N
(62,
25) 12
由例2知:T1
T2~N
(62
ห้องสมุดไป่ตู้
62,
25 20
25) 12
从而 T1 T2 ~N(0,1)
25 25 20 12
P{T1 T2 1} 1 P
1 25 25 20 12
第三节 统计量及样本分布的数字特征
通过上一节可以知道:如果给出了样本观测 值,那么我们就可以通过直方图知道该总体的大 致概率密度函数图形。但我们在获得样本观测值 之后,还要根据统计推断问题的需要进行加工、 整理。实际工作中,往往是针对具体问题构造样 本的某种函数,通过它提取样本中与总体有关的 信息,以推断总体的某些特性。
设 ( X1, X 2, , X n ) 是总体 X 的一个样本,
1.样本均值(sample mean)
X
1 n
n i 1
Xi
它的观测值记为
x
1 n
n i 1
xi
例1:设总体X~N
(
,
2
),
X
1,
X
2
,,
X
是来自总体
n
X的样本,试判断X满足什么样的分布。
解:由于X1, X 2 ,, X n相互独立,X i~N (, 2 ),
独立,且X
~N
(
1
,
2 1
n1
),Y~N
(
2
,
2 2
n2
)
从而有
X
Y~N (1
2
,
2 1
n1
2 2
n2
)
所以
X Y (1 2 ) ~N (0,1)
2 1
2 2
n1 n2
例3:某厂检验保温瓶的保温性能,在瓶中灌满沸水, 24小时后测定其保温温度为T,若已知T~N(62,52)。 (1)随机地抽取20只进行测定,其样本均值T低于600 C 的概率有多大? (2)若独立进行两次抽样测试,各次分别抽取20只和 12只,那么两个样本平均值差的绝对值大于10 C的概率 是多少?
例5:甲、乙两台机器生产同一种产品,标准长度为20cm,允许误 差为0.08cm,今从两台机器生产的产品中各抽取10件进行检测,得 到如下两组数据。
机器甲:20.06,20.02,19.96,19.98,20.01,20.05,19.94,20.04,19.95,19.99
机器乙:19.88,20.04,20.10,19.92,20.17,20.02,19.90,19.96,20.08,19.98
T~N (62, 25),即T~N (62,1.25) 20
由例1知 T 62 ~N (0,1) 1.12
所以P{T 60} P{T 62 60 62} (1.79) 0.0367 1.12 1.12
由此可见,任取一容量为20的样本,其保温温度平均值低于 600 C的概率约为3.67%。
T1 T2 25 25 20 12
1 P
3 T1 T2 10 10
3
10
3
1[( 3 ) ( 3 )]
10
10
2[1 ( 3 )] 2[1 (0.548)] 10
2(1 0.7088) 0.5824
1
25 20
25 12
58.24%
以即 上两 的次 概独 率立 为抽
S 2 1 n n 1 i1
2
Xi X
它的观测值为:
s2
1 n 1
n i1
( xi
2
x)
3.样本均方差或标准差
S
1n n 1 i1
Xi X
2
它的观测值为:
s
s2
1 n 1
n i 1
( xi
2
x)
样本均值反映总体X取值的平均,样本方差或 标准差反映总体X取值的离散程度。
例如: 设 ( X1, X 2 , X3) 是从正态总体 N (, 2 ) 中抽取
的一个样本,其中 为已知参数, 为未知参数,
则
1 n
(
X1
X
2
X
n
)
X12
X
2 2
Xn2
X1 X 2 3 X3 X12 3 X 2 X 3 都是统计量
X1
X2
X
2 3
X1X 2 X3 不是统计量
几个常用的统计量(样本分布的数字特征)
n
要使P{| X 30 | 1} 0.95,即有2(0.25 n)1 0.95,
也即(0.25 n) 0.975,查标准正态分布表得(1.96) 0.975
由于(x)单调增加,所以应有0.25 n 1.96, 即n 61.4656,因此,样本容量至少应取为62.
2.样本方差(sample variance)
样 的 平 。均 值 相 差
10 C
例4:设总体X~N (30,16),从总体X中抽取容量为n的样本, 要使P{| X 30 | 1} 0.95,问样本容量n至少应取多大?
解:由于 P{| X 30 | 1} P{1 X 30 1}
P{ 1 4
n
X
30 4
1 4
n} 2(0.25 n) 1
因此,
X
1
,
X
2
,,
X
的线性函
n
数X
1 n
n i 1
X
服从正态分
i
布,
因为E( X i ) ,D( X i ) 2,所以
E(X )
1 n
n i 1
E(Xi ) , D(X )
1 n2
n i 1
D(
X
i
)
2
n
故X~N (, 2 )
n
X的标准化随机变量X
服从标准正态分布,即
n
X
定义1:设X1, X 2,, X n是来自总体X的样本,x1, x2,, xn 是样本观测值,如果g(t1,t2,,tn )为已知的n元函数,则 g( X1,X 2,, X n )为样本函数,它也是一个随机变量,称 g(x1, x2,, xn )为样本函数的观测值。
如果样本函数 g( X1,X 2,, X n )中不含有任何未 知参数,则称这种样本 函数为统计量。
~N(0,1)
n
例2:设X~N
(1
,
2 1
),Y~N
(
2
,
2 2
)
.X
,
Y相互独立。
分别从总体X和总体Y中抽取样本X1, X 2 ,, X n1及
Y1,Y2 ,,Yn2 , 记样本均值分别为X和Y ,
试讨论 X Y (1 2 ) 满足什么样的分布
2 1
2 2
n1 n2
解: X1, X 2 ,, X n与Y1,Y2 ,,Yn相互独立,因此X和Y相互
解:由抽样的结果计算得:
x
1 n
n i 1
xi
1 (20.06 19.99) 10
y
1 n
n i 1
yi
1 (19.88 19.98) 10
s甲2
1 n 1
n i 1
( xi
2
x)
1 9
(2)设T1是容量为20的样本平均值,T2是容量为12的样本
平均值,则
T1~N
(62,
25 20
),T2~N
(62,
25) 12
由例2知:T1
T2~N
(62
ห้องสมุดไป่ตู้
62,
25 20
25) 12
从而 T1 T2 ~N(0,1)
25 25 20 12
P{T1 T2 1} 1 P
1 25 25 20 12
第三节 统计量及样本分布的数字特征
通过上一节可以知道:如果给出了样本观测 值,那么我们就可以通过直方图知道该总体的大 致概率密度函数图形。但我们在获得样本观测值 之后,还要根据统计推断问题的需要进行加工、 整理。实际工作中,往往是针对具体问题构造样 本的某种函数,通过它提取样本中与总体有关的 信息,以推断总体的某些特性。
设 ( X1, X 2, , X n ) 是总体 X 的一个样本,
1.样本均值(sample mean)
X
1 n
n i 1
Xi
它的观测值记为
x
1 n
n i 1
xi
例1:设总体X~N
(
,
2
),
X
1,
X
2
,,
X
是来自总体
n
X的样本,试判断X满足什么样的分布。
解:由于X1, X 2 ,, X n相互独立,X i~N (, 2 ),
独立,且X
~N
(
1
,
2 1
n1
),Y~N
(
2
,
2 2
n2
)
从而有
X
Y~N (1
2
,
2 1
n1
2 2
n2
)
所以
X Y (1 2 ) ~N (0,1)
2 1
2 2
n1 n2
例3:某厂检验保温瓶的保温性能,在瓶中灌满沸水, 24小时后测定其保温温度为T,若已知T~N(62,52)。 (1)随机地抽取20只进行测定,其样本均值T低于600 C 的概率有多大? (2)若独立进行两次抽样测试,各次分别抽取20只和 12只,那么两个样本平均值差的绝对值大于10 C的概率 是多少?
例5:甲、乙两台机器生产同一种产品,标准长度为20cm,允许误 差为0.08cm,今从两台机器生产的产品中各抽取10件进行检测,得 到如下两组数据。
机器甲:20.06,20.02,19.96,19.98,20.01,20.05,19.94,20.04,19.95,19.99
机器乙:19.88,20.04,20.10,19.92,20.17,20.02,19.90,19.96,20.08,19.98