确定统计量的分布
63常用统计量的分布
§6.3常用统计量的分布一、样本均值的分布1、单个正态总体下的样本均值的分布2、两个正态总体下的样本均值的分布3、非正态总体下的样本均值的近似分布二、-分布1、分布定义2、分布的性质3、分布的典型模式4、分布的上α分位点2χ2χ2χ2χ2χ三、t-分布1、t 分布的定义2、t(n)的性质3、t(n)的典型模式4、t(n)分布的上α分位点四、F-分布1、F分布的定义2、F分布的性质3、F分布的典型模式4、F分布的上α分位点五、正态总体样本均值与样本方差的分布1、单个正态总体下样本均值与样本方差的分布2、两个正态总体下样本均值差与样本方差比的分布)2.3(1)(1)1()(1)(1)1()(,,,2,1,)(,)(,,,1)1.3(),(~11,,,,),,(1.31222121112212121212n n nX D n X n D X D n nX E n X n E X E n i X D X E X X X X nN X n X nX n X X X X X N X n i i n i i n i i n i i i i n ni i ni i n σσµµσµσµσµσµ=⋅====⋅========∑∑∑∑∑∑======于是有相互独立同分布,故与:由于注的正态分布,即,方差为服从均值为值的一个样本,则样本均为来自服从正态总体设总体定理本均值的分布、单个正态总体下的样一、样本均值的分布"""这点处。
望取值几乎集中在数学期时且当高的集中程度远比总体要的取值于即倍的方差的的方差却只是但有相同的数学期望与由上述可知注µµX n X nX X X X ,,,1,,:2∞→212(1,0.2),,,,,{0.9 1.1}0.95?n X N n X X X X P X n ≤<≥"例 设总体服从正态分布从中抽取容量为的样本欲使样本均值满足不等式试求样本容量最小应为取多大2110.2:~(1,)1.110.910.95{0.9 1.1}0.20.2()()2()1222ni i X X N nnP X n n n n n==⎛⎞⎛⎞−−≤≤<=Φ−Φ⎜⎟⎜⎟⎝⎠⎝⎠=Φ−Φ−=Φ−∑解由题设知故0.951()0.975; 1.96,15.3664222,16n n n n +Φ≥=≥≥即查表得故因此样本容量最少应取。
统计量及其分布
样本均值的抽样分布 (例题分析)
【例】设一个总体含有4 个个体,分别为X1=1、X2=2、 X3=3 、X4=4 。总体的均值、方差及分布如下。
总体均值和方差
总体的频数分布
X
i 1
N
i
N
N
2.5
2
2 ( X ) i i 1
0.02 0 2 1 0.1
21 Φ0.2
0.8414
(4) 样本 k 阶(原点)矩
1 n k Ak X i , k 1, 2, ; n i 1
1 n k 其观察值 k x i , k 1, 2, . n i 1
n n 1 2 1 2 2 E( S ) E X i nX (Xi X ) E n 1 i 1 n 1 i 1
2
1 n 2 2 E ( X i ) nE ( X ) n 1 i 1 2 1 n 2 2 2 ( ) n 2 n 1 i 1 n
n
k 1
n
2
2
n
,
定理 设总体X的期望E(X) = ,方差D(X) = 2,X1, X2,…,Xn为总体X的样本, X,S2分别为样本均值 和样本方差,则
E( X ) E( X )
D( X ) 2 D( X ) n n
E( S 2 ) D( X ) 2
思考:在分组样本场合,样本均值如何计算? 二者结果相同吗?
x1 f1 x n f n 其中 x n
统计学第6章统计量及其抽样分布
整理ppt
16
2. T统计量
设X1,X2,…,Xn是来自正态总体N~ (μ,σ2 )
n
的一个样本,
X
1 n
n i 1
Xi
(Xi X )2 s 2 i1
n 1
则 T(X) ~t(n1)
S/ n
称为T统计量,它服从自由度为(n-1)的t分布。
整理ppt
17
F分布
定义:设随机变量Y与Z相互独立,且Y和Z分别服 从自由度为m和n的c2分布,随机变量X有如下表达式:
整理ppt
8
中心极限定理
设从均值为,方差为2的一个任意总 体中抽取容量为n的样本,当n充分大时, 样本均值的抽样分布近似服从均值为μ、 方差为σ2/n的正态分布。
当样本容量足够大时
(n≥30),样本均值的抽样
分布逐渐趋于正态分布
整理ppt
9
标准误差
标准误差:样本统计量与总体参数之间的平均差异
1. 所有可能的样本均值的标准差,测度所有样本 均值的离散程度
因此,估计这100名患者治愈成功的比 例在85%至95%的概率为90.5%
整理ppt
22
6.5 两个样本平均值之差的分布
设
X
1
是独立地抽自总体
X1 ~N(1,12)
的一个容量
为n1的样本的均值。 X 2 是独立地抽自总体
X2 ~N(2,22)的一个容量为n2的样本的均值,则有
E (X 1X 2)E (X 1) E (X 2)12
2. 样本均值的标准误差小于总体标准差
3. 计算公式为
x
n
整理ppt
10
【例】设从一个均值μ=8、标准差σ=0.7的总 体中随机抽取容量为n=49的样本。要求:
统计学中自由度的名词解释
统计学中自由度的名词解释自由度(degrees of freedom)是统计学中一个重要的概念,用来描述数据集中的信息总量和所能提供的独立信息数量。
在统计分析和假设检验中,自由度的概念是必不可少的。
一、自由度的定义自由度是指能够独立变动的数值的个数。
在统计学中,一般用n-1(n为样本量大小)来表示自由度。
这是因为在计算样本统计量时,通过已知样本数据计算得出的统计量在计算过程中受到了一定程度的限制,因此需要减去一个自由度来消除约束。
二、自由度的意义1. 自由度与数据的独立性有关自由度反映了数据集的独立性,即数据集中所包含的独立信息的个数。
在统计分析中,我们需要样本数据能够反映总体的特征,但是由于数据本身的限制,无法完全反映总体的全部信息。
通过引入自由度的概念,我们可以在一定程度上解决这个问题,对样本数据进行合理的统计分析。
2. 自由度与数据的适应性有关在进行参数估计和假设检验时,自由度是确定统计量分布的关键因素。
统计量的分布受到样本数据量的限制,分布的形状和特征会随着自由度的变化而变化。
自由度越大,分布越接近正态分布,可靠性越高。
通过自由度的调整,我们可以更准确地估计总体参数,并进行合理的假设检验。
三、自由度的应用1. 参数估计在进行参数估计时,自由度是决定估计量分布的重要因素。
例如,对于正态总体的均值的点估计,使用样本均值作为估计量,自由度为n-1,其中n为样本量大小。
通过计算自由度,我们可以确定估计量的抽样分布,进而估计总体参数的置信区间和点估计的精度。
2. 假设检验在进行假设检验时,自由度是计算检验统计量的重要参数。
以t检验为例,t统计量的自由度为n-1,用于计算t统计量的临界值和p值。
通过自由度的计算,我们可以判断样本观测值和假设值之间的差异是否显著,从而得出对总体的假设检验结论。
四、自由度的解读自由度是统计学中极其重要的概念,不仅与参数估计和假设检验紧密相关,还涉及到回归分析、方差分析等统计方法。
管理统计学第5章
总体(累积)概率分布曲线F(x)不一定 是连续的。 例如,有限(累积)概率分布曲线F(x)是 阶跃式的。
随着样本数 n 的增大, 样本分布会越来越接 近 于 总 体 分 布 。
5.1.4 格利文科定理
定理 :设总体X的分布函数为F(x), 样本分布函数
Fn(x),则对于任何实数x,有
n x
研究多指标时,就是多维随机变量,或称随机向量。
2. 总体(母体)
3. 总体分布(母体分布)
取直径为随机变量X,通常服从正态分布。这个分布,就称为 “生产线上生产出来的零件的直径”这个总体的分布。
5.1.2 随机样本与样本观察值 (样本数据) 1. 随机样本
每个个体被抽取到的机会(概率)均等。
F (m, n)
x
5.2.3 由一般正态分布的随机样本构 成的若干重要统计量的分布
例1 从总体 N ( 52,6.32 ) 中随机抽取
一容量为 36 的样本,求样本均值 X 落在
50.8 到 53.8 之间的概率。
X ~ N (0, 1) , 解:n 36, 52, 6.3 。由 / n
解:由题意可知, X1+X2+…+X9~N(0,9×16),
1 2 2 1 ( Y ) ~ ( 16 ) 则 i Yi ~ N (0,1), i 1,2, ,16 i 1 3 3 X1 X 2 X 9 从而 2 2 2
Y1 Y2 Y16 1 ( X1 X 2 X 9 ) 3 4 ~ t (16) 16 1 2 ( Yi ) i 1 3 16
p 0.46 0.5 0.46 P( p 0.5) P( ) 0.0352 0.0352 P( Z 1.136) 1 P( Z 1.136) 1 (1.136 ) 0.128
统计量的分布
S12
2 1
S22
2 2
~
F(n1 1, n2 1)
U—分布 正态总体样本均值的分布
设总体 X ~ N , 2 , X1, X2,..., Xn 是 X 的一
个样本, 则样本均值服从正态分布
U
X
1 n
n i1
Xi
~
N
0,1
n n
X
1 n
n i 1
Xi
~
N
,
2
n
2 ——分布
量和样本方差;且两个样本相互独立,则统计量
证明
S12 S22
由已知条12件知22
~
F(n1 1, n2 1)
且(n相1 互112独)S立12 ,~由F2(n分1 布 1的),定义(n有2
1)S22
2
2
~
2(n2
1)
(n1 1)S12
2 1
(n2 1)S22
2 2
(n1 1) (n2 1)
在附表5、6、7中所列的值都比较小,当 较大
时,可用下面公式
F1(n1, n2)
1 F(n2, n1)
例如,F0.99(18, 2)
1 F0.01(2,18)
1 6.01
≈0.166
F 分布的双侧分位数
称满足条件
P F
F12(n1, n2)
P F
F 2
(n1,
n2)
2
的F 1
2
(n1,
n2),
P{ X x 2} ,
则称 x
为X分布的双侧分位数或双侧临界值.
2
y
如图.
2
2
x 2 O x 2 x
统计量及其分布
思考题
设 X1, X2 , … , Xn 是取自正态总体 N (, 2 ),
的一个样本,求 E( XS 2 ) ?
定理 2 设 X1, X2 , … , Xn 是取自正态总体 N (, 2 )
的样本,X 和S 分别为样本均值和样本均方差,则有
1) X ~ N(0, 1); / n
2) X ~ t(n 1).
nx 2 ];
③ s
1 n 1
n i 1
( xi
x )2
;
④
ak
1 n
n i 1
xik ,
k 1, 2
;
⑤ bk
1 n
n
(xi x )k ,
i 1
k
1, 2
.
例1 设总体X 的期望为 E(X ) , 方差为 D(X ) 2 其样本为 X1, X2, , Xn , 求E(X ), D(X ), E(S 2) .
为t分布的上 分位点。
t1 (n) t (n)
若 0.5,直接查表;若 0.5, t (n) t1 (n).
当 n 45 , t (n) z .
(3) F-分布
设随机变量X与Y相互独立,且 X ~ 2 (n1), Y ~ 2 (n2 ),
则随机变量
F
X Y
/ n1 / n2
所服从的分布是自由度为 (n1, n2 )
~
F (2,
2)
作 业 17
P137: 4 P147: 4
1.6664.
解:因为
(n 1)
2
S
2
~ 2(n 1)
15S 2
2
~ 2(15)
P
S
2 2
1.6664
应用统计硕士统计学简答题专项强化真题试卷1(题后含答案及解析)
应用统计硕士统计学简答题专项强化真题试卷1(题后含答案及解析) 题型有:1.1.为什么要计算变异系数?[江苏大学2012研]正确答案:变异系数又称离散系数或者标准差率。
它与均值和方差相同,是衡量统计资料离散程度的指标统计量。
方差和标准差是反映数据分散程度的绝对值,其数值的大小一方面受原变量值本身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高的,离散程度的测度值自然也就大,绝对水平小的离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同。
采用不同计量单位计量的变量值,其离散程度的测度值也就不同。
因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的。
为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算变异系数。
变异系数的计算方法是:均值与标准差的比。
比值越大,说明样本离散程度越小。
比值越小,说明样本离散程度越大。
涉及知识点:数据的概括性度量2.简述标志变异指标的意义和作用。
[浙江工商大学2011研]正确答案:标志变异指标又称为标志变动度,是反映总体各单位标志值之间差异程度大小的综合指标。
标志变异指标说明的是变量的集中趋势。
标志变异指标的作用是:(1)衡量平均指标代表性的尺度;(2)研究现象的稳定性和均衡性;(3)为科学确定抽样单位数提供依据。
测量标志变异的主要指标有极差、平均差、方差、标准差和标志变动系数等。
涉及知识点:数据的概括性度量3.简述假设检验的过程。
[上海财经大学2013研、中央财经大学2011研]正确答案:假设检验的过程如下:(1)根据所研究问题的要求提出原假设H0(或称为零假设、无效假设)和备择假设H1,确定显著性水平。
显著性水平为拒绝假设检验犯第一类错误的概率。
(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。
(3)根据统计量确定P值,做出统计推断。
根据计算的统计量,查阅相应的统计表,确定P值,以P值与显著性水平α比较,若p≤α,则拒绝H0,接受H1;若p>α,则不拒绝风。
第十六讲(数理统计中常用的分布、抽样分布定理)
3 n足够大 时, (n)近似服从• (n,2n) N
2
证
1设
2 (n) X i2
i 1
n
X i ~ N (0,1) i 1,2, , n
X 1 , X 2 , , X n
相互独立,
2 i
则 E ( X i ) 0, D( X i ) 1, E ( X ) 1
•2
P{ X z } 1
-z= z1-
例1 求
z0.05 , z0.025 , z0.005 , z0.95 .
解: P{ X 1.645} 0.05, P{ X 1.96} 0.05, P{ X 2.575} 0.005.
z0.05 1.645 , z0.025 1.96 , z0.005 2.575
0.4 0.3 0.2 0.1
n= 1 n=20
-3
-1
1
2
3
t 分布的图形(红色的是标准正态分布)
t分布的性质: 1. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形, 1 t 2 2 再 由函数的性质有 lim f (t ) 2 e . n
~ ( n2 ), U
2
与V 相互
U n1 F V n2
服从自由度为n1及 n2 的F分布,n1称为 第 一自由度,n2称为第二自由度,记作
F~F(n1,n2) . 由定义可见,
1 V n2 ~F(n2,n1) F U n1
若F~F(n1,n2), F的概率密度为
( n1 n2 ) n n1 n21 1 n n 2 n ( n1 ) 2 ( y ) 1 n1 y 2 ( y ) ( 1 ) ( 2 ) 2 2 2 0
确定统计量的分布是数理统计的基本问题之一.ppt
1.2 1
?
f
(
x)
?
? ?
?1 ? 1 ? x
x e , 2 2 2
x? 0
0.8 0.6 0.4
?? 0,
0.2
x? 0
2
4
6
8 10
ch6-49
n = 2 时,其密度函数为
?
f
(x)
?
? ?
1
e?
x 2
,
2
x? 0
?? 0,
x? 0
为参数为1/2的指数分布.
0.4 0.3 0.2 0.1
2
4
确定统计量的分布 是数理统计的基本
问题之一
正态总体是最常见的总体, 本节介绍 的几个抽样分布均对正态总体而言.
统计中常用分布
ch6-45
(1) 正态分布
若
X1, X2 ,? , Xn
~
N
(?
i
,?
2 i
)
则
? ? ? ? ? n
i?1
ai Xi
~
N?? n ? i?1
ai
n
i , ai2
i?1
2 i
D(Xi2 ) ? E(Xi4 ) ? E2 (Xi2 ) ? 2
? ? ? D ? 2(n)
?
D?? n ? i?1
Xi2
?? ?
?
2n
(3) t 分布 (Student 分布)
ch6-54
定义 设 X ~ N(0,1) , Y~ ?2(n), X ,Y相互独立,
T? X Y n
则称 T 服从自由度为 n 的T 分布. 其密度函数为
? (n ? 1) ? n! (n ? N)
(完整版)清华大学_杨虎_应用数理统计课后习题参考答案
习题一1 设总体X 的样本容量5=n ,写出在下列4种情况下样本的联合概率分布. 1)),1(~p B X ; 2))(~λP X ; 3)],[~b a U X ; 4))1,(~μN X .解 设总体的样本为12345,,,,X X X X X , 1)对总体~(1,)X B p ,1122334455511155(1)(,,,,)()(1)(1)i inx x i i i i x x P X x X x X x X x X x P X x p p p p -==-========-=-∏∏其中:5115ii x x ==∑2)对总体~()X P λ11223344555115551(,,,,)()!!ixni i i i i xi i P X x X x X x X x X x P X x e x e x λλλλ-==-==========∏∏∏其中:5115ii x x ==∑3)对总体~(,)X U a b5511511,,1,...,5 (,,)()0i i i i a x b i f x x f x b a==⎧≤≤=⎪==-⎨⎪⎩∏∏,其他4)对总体~(,1) X N μ()()()25555/222151111 (,,)()=2exp 2i x i i i i i f x x f x x μπμ---===⎛⎫==-- ⎪⎝⎭∑∏2 为了研究玻璃产品在集装箱托运过程中的损坏情况,现随机抽取20个集装箱检查其产品损坏的件数,记录结果为:1,1,1,1,2,0,0,1,3,1,0,0,2,4,0,3,1,4,0,2,写出样本频率分布、经验分布函数并画出图形.解 设(=0,1,2,3,4)i i 代表各箱检查中抽到的产品损坏件数,由题意可统计出如下的样本频率分布表1.1:表 1.1 频率分布表i 0 1 2 3 4 个数6 7 3 2 2 iX f0.3 0.35 0.15 0.1 0.1经验分布函数的定义式为:()()()(1)10,(),,=1,2,,1,1,n k k k x x kF x x x x k n n x x +<⎧⎪⎪≤<-⎨⎪≥⎪⎩,据此得出样本分布函数:200,00.3,010.65,12()0.8,230.9,341,4x x x F x x x x <⎧⎪≤<⎪⎪≤<⎨≤<⎪⎪≤<⎪≥⎩图1.1 经验分布函数3 某地区测量了95位男性成年人身高,得数据(单位:cm)如下:组下限165 167 169 171 173 175 177 组上限167 169 171 173 175 177 179x()n F x人 数3 10 21 23 22 11 5试画出身高直方图,它是否近似服从某个正态分布密度函数的图形.解图1.2 数据直方图它近似服从均值为172,方差为5.64的正态分布,即(172,5.64)N .4 设总体X 的方差为4,均值为μ,现抽取容量为100的样本,试确定常数k ,使得满足9.0)(=<-k X P μ.解 ()- 54100X P X k P k μμ⎫-⎪<=<⎪⎭()()555 P k X k μ=-<-<因k 较大,由中心极限定理(0,1)4100X N : ()()()-55P X k k k μ<≈Φ-Φ-(5)(1(5))k k =Φ--Φ()2510.9k =Φ-=所以:()50.95k Φ=查表得:5 1.65k =,0.33k ∴=.5 从总体2~(52,6.3)X N 中抽取容量为36的样本,求样本均值落在50.8到53.8之间的概率.解 ()50.853.8 1.1429 1.7143X P X P ⎛⎫<<=-<< ⎪⎝⎭(0,1) 6.3X U N =()()50.853.8 1.1429 1.7143(1.7143)( 1.14290.9564(10.8729)0.8293P X P U ∴<<=-<<=Φ-Φ-=--=)6 从总体~(20,3)X N 中分别抽取容量为10与15的两个独立的样本,求它们的均值之差的绝对值大于0.3的概率.解 设两个独立的样本分别为:110,,X X 与115,,Y Y ,其对应的样本均值为:X 和Y .由题意知:X 和Y 相互独立,且: 3~(20,)10X N ,3~(20,)15Y N(0.3)1(0.3)P X Y P X Y ->=--≤1P =-~(0,0.5)~(0,1)(0.3)22(0.4243)0.6744X Y N X YN P X Y -->=-Φ=7 设110,,X X 是总体~(0,4)X N 的样本,试确定C ,使得1021()0.05ii P XC =>=∑.解 因~(0,4)i X N ,则~(0,1)2iX N ,且各样本相互独立,则有:10122~(10)2i i X χ=⎛⎫⎪⎝⎭∑所以:10102211()()144iii i CP X C P X ==>=>∑∑1021110.0544i i c P X =⎛⎫=-≤= ⎪⎝⎭∑102110.9544i i c P X =⎛⎫≤= ⎪⎝⎭∑查卡方分位数表:c/4=18.31,则c=73.24.8 设总体X 具有连续的分布函数()X F x ,1,,n X X 是来自总体X 的样本,且i EX μ=,定义随机变量:1,,1,2,,0,i i i X Y i n X μμ>==≤⎧⎨⎩试确定统计量∑=ni i Y 1的分布.解 由已知条件得:~(1,)i Y B p ,其中1()X p F μ=-.因为i X 互相独立,所以i Y 也互相独立,再根据二项分布的可加性,有1~(,)nii YB n p =∑,1()X p F μ=-.9 设1,,n X X 是来自总体X 的样本,试求2,,EX DX ES 。
统计量及其分布ppt课件
图5.1.1 SONY彩电彩色浓度分布图q
表5.1.1 各等级彩电的比例(%)
等级
I
|X-m|<5/3
II
III
5/3<|X-m|<10/3 10/3 <|X-m|<5
IV
|X-m|>5
美产 33.3 33.3 33.3
0
日产 68.3 27.1 4.3
0.3
抽样 :
5.1.2 样本
要了解总体的分布规律,在统计分析工作中,往往 是从总体中抽取一部分个体进行观测,这个过程称为抽 样。样本
x 344 344 x 347 347 x 351 351 x 355
x 355
由伯努里大数定律:
第25页
两点分布,只要 n 相当大,Fn(x)依概率收敛于F(x) 。
更深刻的结论:格里纹科定理
定理5.2.1 设 x1,x2,L,xn 是取自总体分布函数为F(x) 的样本F,n ( x ) 为其经验分布函数,当n 时,有
若以 p 表示这堆数中1的比例(不合格品率), 则该总体可由一个二点分布表示:
X01 P 1p p
比如:两个生产同类产品的工厂的产品 的总体分布:
例5.1.2 在二十世纪七十年代后期,美国消费者购买
日产SONY彩电的热情高于购买美产 SONY彩电,原因何在?
原因在于总体的差异上!
➢ 1979年4月17日日本《朝日新闻》刊登调查报 告指出N(m, (5/3)2),日产SONY彩电的彩色浓 度服从正态分布,而美产SONY彩电的彩色浓 度服从(m5 , m+5)上的均匀分布。
元件数 4 8 6 5 3 4 5 4
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184]
统计量及其分布..
服从的分布可能是完全不知道的,或者知道其分布概
型,但是其中的某些参数是未知的。
例 5.0.1
某公司要采购一批产品,每件产品不
是合格品就是不合格品,但该批产品总有一 个不合格品率 p 。由此,若从该批产品中随 机抽取一件,用 X 表示这一件产品的不合格 数,不难看出 X 服从一个二点分布 b ( 1 , p ) , 但分布中的参数 p 是不知道的。一些问题:
表5.2.1 例5.2.2 的频数频率分布表 组序 分组区间 组中值 频数 频率 (%) 1 (147,157] 152 4 0.20 2 (157,167] 162 8 0.40 3 (167,177] 172 5 0.25 4 (177,187] 182 2 0.10 5 (187,197] 192 1 0.05 合计 20 1 累计频率 20 60 85 95 100
样;其中样本中所包含的个体数量称为样本容量。样本
中的个体称为样品。
5.1.2 样本
样本具有两重性:
• 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1, X2, …, Xn 表示;
• 另一方面,样本在抽取以后经观测就有确定的 观测值,因此,样本又是一组数值。此时用小 写字母 x1, x2, …, xn 表示是恰当的。 在本书中,无论是样本还是其观测值,样本一般均用 x1, x2,… xn 表示,大家要注意从上下文中加以识别。
§5.1
总体与个体
在数理统计中,把研究对象的全体称为总体 (population)或母体,而把组成总体的每个单元
称为个体。
总体的三层含义:
• 研究对象的全体; • 数据; • 分布
数理统计-第一章 统计量及其分布
太原理工大学 景英川
第一章 统计量及其分布
太原理工大学 景英川
第一章 统计量及其分布
但在实际中,在样本量特别大时 (如 n≥100 ),又常用分组样本来代替完 全样本,这时需要对样本进行分组整理, 它能简明扼要地表示样本,使人们能更 好地认识总体,这是分组样本的优点。
太原理工大学 景英川
第一章 统计量及其分布
则 Fn (x)是一非减右连续函数,且满足 Fn (-∞) =0, Fn (+ ∞)=1 由此可见, Fn (x)是一个分布函数,称 Fn (x)为经验分 布函数。 太原理工大学 景英川
第一章 统计量及其分布
1.6 某食品厂生产听装饮料,现从生产线上随机 抽取 5 听饮料,称得其净重为(单 位:克) 351 347 355 344 351 这是一个容量为 5 的样本,经排序可得有序样本:
而若第一次抽到的是合格品,则第二次抽到不合格品 的概率为
太原理工大学 景英川
第一章 统计量及其分布
显然,如此得到的样本不是简单随 机样本。但是,当 N 很大时,我们可 以看到上述二种情 形的概率都近似等 于 p。所以当 N 很大,而 n不大(一个 经验法则是 )时可以把 该样本近似地 看成简单随机样本。
从总体中抽取样本可以有不同的抽法,为了能 由样本对总体作出较可靠的推断,就希望 样本能很 好的代表总体。这就需要对抽样方法提出一些要 求,最常用的"简单随机抽样”有 如下二个要求: (1)样本具有随机性,即要求总体中每一个个体 都有同等机会被选入样本,这便意味着每一样品xi 与总体X有相同的分布。 (2)样本要有独立性,即要求样本中每一样品的 取值不影响其它样品的取值,这意 味着x1, x2, …,xn 相互独立。
第一章 统计量及其分布
应用数理统计—顺序统计量的分布
x0 x
f (x)
证明:考虑“第k个次序统计量 X(k) 落入很小的区间 (x, x+x]内”这一事件的概率。记X(k) 的分布函数为 Fk(x)。则该概率为Fk(x +x)- Fk(x)。
另外,该事件等价于“容量为n的样本X1,X2,…,Xn中
有k-1个分量小于或等于x,1个分量落入(x, x+x]内,余 下的n-k个分量大于x+x。
为f(x). X1, X 2,..., X n 是取自X的样本。则最小次
序统计量 X(1) 的概率密度函数为
f1(x) n[1 F(x)]n1 f (x)
分布函数为
F1(x) 1[1 F(x)]n
例4 设某型号电子元件的寿命 X 服从参数为的指
数分布,X1,…,Xn是对X 进行n次独立观测的寿命。 求n次观测中(1)最大寿命小于b的概率;(2)最
例5 设X1, X2,…, Xn是取自[0, 1]上均匀分布的样本 ,求第 k 个次序统计量 X(k) 的数学期望。
解:由于
由定理知,X(k) 的概率密度为 于是有
, X2,…, Xn是取自该总体的样本。则(X(1), X(n))的联 合密度函数为
小寿命大于a的概率。(a>0, b>0)
解:由于
F(x) 1 ex , x 0
所以,最大次序统计量 X(n) 的分布函数为
于是
Fn (x) [F (x)]n [1 ex ]n , x 0
P( X(n) b) Fn (b) [1 eb ]n
例4 设某型号电子元件的寿命 X 服从参数为的指
数分布,X1,…,Xn是对X 进行n次独立观测的寿命。 求n次观测中(1)最大寿命小于b的概率;(2)最
6.2.常用统计量及抽样分布
1.
(n 1) S 2
2
~ 2 (n 1)
2. X 与 S 2 独立。 定理三 设 X 1 , X 2 , , X n 是来自正态总体N ( , 2 ) 的样本,X 是样
X , S 2 分别是样本均值和样本方差, 则有
X S/ n ~ t (n 1)
定理四 设 X 11,,X 22,,,X nn 与Y11,,Y22,,,,Ynn 是来自正态总体 N ((11,, 1212))和 N Y 是来自正态总体 N 和 设 X X , X 与Y Y 2 ) 和 N ( 2 , 2 ) 的样本,且这两个样本相互独立。设 n 1 1 n1 X i 1 X i , Y i 1 Yi 分别是这两个样本的均值; n2 n1 n 1 1 n1 2 2 2 S2 (Yi Y ) 2 S1 i1 ( X i X ) , n21 1 i 1 n1 1 分别是这两个样本的样本方差, 则有
则称随机变量
[(n1 n 2 ) / 2](n1 / n 2 ) n1 / 2 y ( n1 / 2 ) 1 , y0 ( y ) (n1 / 2)(n 2 / 2)[1 (n1 y / n 2 )]( n1 n2 ) / 2 0, 其它
其图形如右图所示
U / n1 F V / n2 服从自由度为 ((n1 ,,n 22)的2)) 服从自由度为 n1 n )的F 分布,记为 F ~ F n1 n
F (n1 , n 2 ) 分布的概率密度为
2 2 设 U ~ ( n1 ), V ~ (n 2 ), 且U , V 独立,
1 0.357 2.80
二、抽样分布定理
定理一 设 X 1 , X 2 , , X n 是来自正态总体N ( , 2 ) 的样本,X 是样 本,X 是样本均值,则有 X ~ N ( , 2 / n) 定理二 设 X 1 , X 2 , , X n 是来自正态总体N ( , 2 ) 的样本,X 是样 X , S 2 分别是样本均值和样本方差, 则有
应用统计硕士《432统计学》中央财大考研真题解析
应用统计硕士《432统计学》中央财大考研真题解析中央财经大学432统计学[专业硕士]考研真题及详解一、单项选择题(本题包括1~20题共20个小题,每小题1.5分,共30分)1.网站把调查问卷刊登在网页上,然后由感兴趣的网民自行填写。
对于此类调查,以下说法正确的是()。
A.这是简单随机抽样B.这是方便抽样C.这是雪球抽样D.这是全面调查【答案】B~~~~【解析】B项,方便抽样是指调查过程中由调查员依据方便的原则,自行确定入抽样本的单位。
A项,简单随机抽样是指从总体N个单位中任意抽取n 个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式;C项,滚雪球抽样是指先随机选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查对象,往往用于对稀少群体的调查;D项,全面调查是指国家统计系统和各个业务部门为了定期取得系统的、全面的基本统计资料,按一定的要求和表式自上而下统一布置,自下而上提供资料的一种统计调查方法。
2.随机变量X的方差为2,随机变量Y=2X,那么Y的方差是()。
A.1B.2C.4D.8【答案】D~~~~【解析】由于,故3.某政府机构想尽快了解社会公众对其出台的一项政策的态度,最恰当的数据搜集方式是()。
A.面访B.深度访谈C.计算机辅助电话调查D.邮寄调查【答案】C~~~~【解析】C项,计算机辅助电话调查是利用现代化电脑程控通讯设备进行的随机电话访问方式,采用这种访问调查方式,具有调查内容客观真实、保密性强、访问效率高等特点。
A项,面访即调查者直接走访被调查者,当面听取被调查者的意见,可以比较全面、深入,能获得大量真实的研究资料,但这种方法容易使研究结论带有主观成分;B项,深度访谈是一种无结构的、直接的、一对一的访问形式。
最常应用于探测性调查,但是这种访谈方法所得的资料难以进行统计处理和定量分析,而且特别耗费时间,使得访谈的规模受到较大的限制;D 项,邮寄调查法,是指将事先设计好的调查问卷,通过邮政系统寄给被调查者,由被调查者根据要求填写后再寄回,是市场调查中一种比较特殊的调查方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
问题之一
正态总体是最常见的总体, 本节介绍 的几个抽样分布均对正态总体而言.
统计中常用分布
ch6-45
(1) 正态分布
若
X1, X 2,", X n ~
N
(
μ
i
,
σ
2 i
)
则
∑ ∑ ∑ n
i=1
ai Xi
~
N⎜⎛ ⎝
n i=1
aiμi ,
n i=1
ai2σ
2 i
⎟⎞ ⎠
n
n ⎟⎞2 m⎠
t
n 2
−1⎜⎛1+ ⎝
n m
t
⎟⎞− ⎠
n+m 2
t >0
⎜⎝
0,
t ≤0
ch6-60
0.8
0.6
m = 10, n = 4
0.4
m = 10, n = 10
0.2
m = 10, n = 15
1 23 4 56
0.8
0.6
m = 4, n =10
0.4
m = 10, n = 10
⎧ ⎪ f (x) = ⎨
n
22
1 Γ(
n 2
)
e−
x 2
x
n 2
−1,
x>0
⎪
其中, ⎩
0, x ≤ 0
∫ Γ ( x) = +∞ t x−1e−t dt 0
在x > 0时收敛,称为Γ函数,具有性质
Γ(x +1) = xΓ(x), Γ(1) = 1, Γ(1/ 2) = π
Γ(n +1) = n! (n ∈ N)
ch6-51
0.4 0.3 0.2 0.1
n=2
n=3 n=5 n = 10
n = 15
5 10 15 20 25
χ 2 (n) 分布的性质
ch6-52
( ) ( ) 1D E χ 2 (n ) = n, D χ 2 (n ) = 2 n
2D
若X1
=
χ 2 (n1), X 2
=
χ 2 (n2 ),
正态分布的双侧 α 分位数.
标准正态分布的α 分位数图形
ch6-47
P(X > zα ) =α 0.4 0.3 0.2 0.1
-2 -1
( ) P
X
>
z2 α
=α
z0.05 = 1.645 常用
α
z0.025 z0.005
= 1.96 = 2.575
数字
1 z• α2
0.4
0.3
-zα/2=z1-α/2
2
( ) P T > tα /2 = α
0.35
0.3
0.25
0.2
0.15
α/2
0.1
0.05
•
-3 --2tα/2 -1
α/2
• 1 tα2/2 3
P(T > 2.2281 ) = 0.025
P(T > 2.2281 ) = 0.05
⇒ t0.025 (10 ) = 2.2281
(4) F 分布
特别地,
若
X1, X2,", Xn
i.i.d. ~
Xi ~ N(μ,σ 2)
∑ 则
X
=
1 n
n i=1
Xi
~
N⎜⎜⎝⎛
μ
,
σ2
n
⎟⎟⎠⎞
ch6-46
标准正态分布的 α 分位数
定义
若 P(X > zα ) =α ,则称z α为标准正态
分布的上α 分位数.
( ) 若 P
X
>
z2 α
=α
,
则称
Z2 α
为标准
T= X Y n
则称 T 服从自由度为 n 的T 分布. 其密度函数为
f (t) =
Γ⎜⎛n +1⎟⎞
⎝2⎠
nπΓ⎜⎛ n ⎟⎞
⎜⎜⎝⎛1+
t2 n
⎟⎟⎠⎞−n2+1
⎝2⎠
−∞<t <∞
0.4
ch6-55
0.3
0.2
n= 1
0.1
-3 -2 -1
n=பைடு நூலகம்0
123
t 分布的图形(红色的是标准正态分布)
0.15
0.1
α
0.05
• -3 --tα2 -1
1
•2tα 3
P(T >1.8125) = 0.05⇒t0.05(10) =1.8125
P(T <−1.8125) =0.05, P(T >−1.8125) =0.95
⇒ t0.95(10) = −1.8125
ch6-58
P(T
>
tα / 2 )
=α
0.2
m = 15, n = 10
123 45 6
⎪ ⎨
1 x e , −
1 2
−
x 2
2π
0.8
x > 0 0.6 0.4
0.2
⎪⎩ 0,
x≤0
2
4
6
8 10
ch6-49
n = 2 时,其密度函数为
⎧
f
(x)
=
⎪ ⎨
1
e−x 2
,
2
x>0
⎪⎩ 0,
x≤0
为参数为1/2的指数分布.
0.4 0.3 0.2 0.1
2
4
6
8
10
一般 自由度为 n 的 χ 2 (n ) 的密度函数为ch6-50
2
n = 10
α
5
10
• 15χ20.0250(10)
n
∑ 证 1°设 χ 2(n) =
X
2 i
i=1
X 1, X 2 ," , X n
ch6-53
Xi ~ N(0,1) i = 1,2,", n
相互独立,
则 E(Xi) =0, D(Xi) =1, E(Xi2) =1
( ) ∑ E
χ 2 (n)
= E⎜⎛ n ⎝ i=1
X1,
X
相互独立,
2
则 X1+X 2~χ 2 (n1+n2 ) 3D n → ∞ 时,χ 2 (n) → 正态分布
4D χ 2 ( n) 分布的上 α 分位数有表可查
0.1
( ) 例如
0.08
P χ (10) > 18.307 = 0.05 0.06
2
0.04
χ0.05(10) = 18.307
0.02
Xi2
⎟⎞ ⎠
=
n
∫ E(Xi4) =
1
∞
x4e−
x2 2
dx
=
3
2π −∞
D(Xi2) = E(Xi4) − E2(Xi2) = 2
( ) ∑ D χ2(n)
= D⎜⎛ n ⎝ i=1
X
2 i
⎟⎞ ⎠
=
2n
(3) t 分布 (Student 分布)
ch6-54
定义 设 X ~ N(0,1) , Y ~ χ2(n), X ,Y相互独立,
ch6-59
定义 设 X~χ2(n), Y~χ2(m), X, Y 相互独立,
令 F = X /n Y /m
则称 F 服从为第一自由度为n ,第二自由
度为 m 的F 分布. 其密度函数为
f
(t,
n,
m)
=
⎜⎛ Γ
⎜
⎜ ⎜Γ ⎜
⎜⎛ ⎝
⎜⎛ n+m⎟⎞ ⎝2⎠ n⎟⎞Γ ⎜⎛ m⎟⎞ 2⎠ ⎝ 2⎠
⎜⎛ ⎝
ch6-56
t 分布的性质
1°f n(t)是偶函数,
n → ∞, fn (t) → ϕ (t) =
1
−t2
e2
2π
2°T 分布的上α 分位数 tα 与双测 α
分位数 tα/2 均 有表可查.
ch6-57
P(T > tα ) = α
0.35 0.3
− tα = t1−α
0.25 0.2
n = 10
0.2
α/2 0.1
α/2
-z• -2 -1 α/2
1 z•α2/2
ch6-48
(2) χ2(n)分布( n为自由度 )
定义 设 X 1 , X 2 ," , X n 相互独立,
且都服从标准正态分布N (0,1),则
n
∑X
2 i
~
χ 2(n)
i=1
n = 1 时,其密度函数为
1.2 1
⎧
f
(x)
=