统计量的分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P( X 1) ( 1 ) ( 1 ) 2 ( 1 ) 1 0 .6 8 2 6
一般正态分布的标准化
定理
如 果 X~N (,2),则 F (x) x
概率计算
若X~N(,2)
P (aXb ) (b ) (a )
查标准正态 分布表
一般正态分布的区间概率
X~N(, 2) (x )为 标 准 正 态 分 布 函 数
P(X<b)=F(b) P(X≥b)=1﹣ P(X<b)=1 - F(b) P(a≤X<b)=F(b) ﹣ F(a) P(a≤X<b)=P(X < b)-P(X<a)= F(b)- F(a)
密度函数和分布函数的关系 积分关系
x
F(x) f(x)dx
x
F(x)P{Xx} f (x)dx
2
(n1)
X Sn T~t(n1)
定理3 设(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2) 分别
n
从表面上看, (X i X )2是n个正态随机变量 X i X 的平方和, i1
但实际上它们不是独立的, 它们之间有一种线性约束关系:
=0 n
n
(Xi X)Xi nX
i1
i1
这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下
的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1
项是独立的.所以(1)式的自由度是n-1.
导数关系
若 f( x ) 在 x 处 连 续 , 则 F ( x ) f( x )
正态分布的分布函数
x
F(x)
1 e(x22)2dx
2
F(x) 1
1 2
x
标准正态分布
Standard Normal distribution
定义 X ~ N(0,1)分布称为标准正态分布
密度函数
(x)
1
3准则
X~N(,2)
X的取值几乎都落入以为中心,以3为半径 的区间内。这是因为:
P 3 X 3 ( 3 ) ( 3 )
( 3 ) [ 1 ( 3 ) ] 2 ( 3 ) 1 0 . 9 9 7 4
F(x) 0.9974
X3
是小概率事件
3
3
概率分布的分位数(分位点)
Distribution Function 分布函数的定义
设X为一随机变量,则对任意实数x, (X<x)是一个随机事件,称
F(x)P(Xx)
为随机变量X的分布函数
F(x)是一个普
通的函数!
定义域为 (-∞,+∞); 值域为 [0,1]。
分布函数表示事件的概率
引进分布函数F(x)后,事件的概率都 可以用F(x)的函数值来表示。
或双侧临界值. 见图.
2
(
n
)
为 2分布的上2
显然, 分位数.
2
2
2
2 1
2
(
n
)
为
2分布的上1
2
O
分位数.
2 1
2
(
n
)
2
2(n )
x
如当n=8, =0.05时,
122(n)02.975(8)2.18
2(n)02.025(8) 17.53 2
2分布的数学期望与方差
设 2~ 2(n),则E( 2)=n,D( 2)=2n.
~ 2(n)
t分布
定义:设随机变量X~N(0,1),Y~ 2(n) ,且X与Y
相互独立,则称统计量 T
X Y
n
服从自由度为n的t分布或学生氏分布,记作T ~t(n).
t分布的概率密度函数为 f(t) n ( n 2 (1 n 2 ))(1tn 2)n2 1, (t )
其形状类似标准正态分布的概率密度
当X的分布关于y轴对称时, 若存在 x 2 , 使
P{Xx2},
则称 x
为X分布的双侧分位数或双侧临界值.
2
y
如图.
2
2
x 2 O x 2 x
标准正态分布的分位数
在实际问题中, 常取0.1、0.05、0.01.
常用到下面几个临界值:
u0.05 =1.645, u0.05/2=1.96,
u0.01 =2.326 u0.01/2=2.575
P (aX b ) (b ) (a )
正态分布的实际应用
某单位招聘155人,按考试成绩录用,共有526
人报名,假设报名者的考试成绩 X ~N(,2)
已知90分以上的12人,60分以下的83人,若从高分 到低分依次录取,某人成绩为78分,问此人能否被录 取?
分析
首先求出 和
然后根据录取率或者分数线确定能否录取
1y
2
中间高 两边低
-
+ x
对称性 单调性 拐点
关于 x = 对称
(- ,)升,(,+ )降
(,
1
1
e 2);
2
f最大 ()
1
2
μ,σ对密度曲线的影响
1
1 21 1 22
相同,不同
图形相似,位置平移
2
1 0.75 2 1.25
不同,相同 越小,图形越陡; 越大,图形越平缓
随机变量的分布函数
f(t)
的图形.
当n较大时, t分布近似于标准正态分
布.
O
当n较大时, t分布近似于标准正态分布. 一般说来,当n>30时,t分布与标准正态分布N(0,
1)就非常接近.
但对较小的n值,t分布与标准正态分布之间有较大
差异.且P{|T|≥t0}≥P{|X|≥t0},其中X ~N(0,1),即在t分 布的尾部比在标准正态分布的尾部有着更大的概率.
则
Xi
~
N(0,1)且各
X
i
相互独立,
由定义得
n
2i n1Xi2i1(X i2)2~2(n).
定理 设(X1,X2,…,Xn)为来自正态总体
X~N( , 2)的样本,则
(1) 样本均值 X 与样本方差S 2相互独立;
n
(2)
(n1)S2
2
(Xi X)2
i1
2
~2(n1)
(1)
(1)式的自由度为什么是n-1?
其几何意义见图所示.
其中f(y)是 2-分布的概率密度. O
2
(
n
)
x
显然,在自由度n取定以后,
2
(
n
) 的值只与有关.
例如,当n=21,=0.05时,由附表可查得
02.05(21) 32.67 即 P2 (2 1 ) 3 2 .6 7 0 .0 5 .
2分布的双侧分位数
的把数满足12P 2( n),2 22(1 2 n )2称(n 为) 2f分(P x布) 的2 双 侧 2 2 分(n 位) 数2
解 成绩X服从 N ,2
PX90120.0228 PX60830.1588
526
526
录取率为 155 0.2947
526
可得 P X 9 0 1 9 0 1 0 .0 2 2 8 0 .9 7 7 2
PX60 600.1588
得
6010.15880.8412
查表得 90 2.0
x2
e 2 偶函数
2
分布函数
x
1 x2
(x)
Байду номын сангаас
e 2 dx
2
y (x)
0 1
标准正态分布的概率计算
分布函数
( x) P{ X x}
x
1
x2
e 2 dx
2
y (x)
(x)1(x)
(0)0.5
-x
X
标准正态分布的概率计算
公式
P ( a X b ) (b ) (a ) P ( Xb) (b) P ( Xa ) 1 (a)
的一个样本, 则称统计量 2X1 2X2 2LXn 2服从自
由度为n的 2 分布,记作 2 ~ 2(n)
自由度是指独立随机变量的个数, df n
2 ( n ) 分布的密度函数为
f
(y)
2n
1
2n
2
yn
e 21 y
2,
y0
0,
y0
(n1)n!
2 ( n ) 分布密度函数的图形
f(y)
0.5 0.4
n=1
0.3
0.2 n=4
0.1
n=10
0 1 3 5 7 9 11 13 15 17 x
图
其图形随自由度的 不同而有所改变.
P2(n ) 2(n )
2分布表
2分布的上分位数
满足
的数
P 2 ( n )为2 (n 2)分 布的 2 (n )f (y) 2 (n )f(y )d y
上分位数或上侧临界值,
f(x) 0 , x ( , )
规范性
f (x)
f (x)dx 1
P { x }1
正态分布 Normal Distribution
若连续型随机变量X的概率密度为
f(x) 1
(x)2
e22
2
,(0)为 常 数
则称X服从参数为 ,2 正 态 分 布 , 记 为
X ~N(,2)
正态分布的密度函数的性质与图形
统计量的分布称为抽样分布。
由于正态总体是最常见的总体,因此主要讨论正态 总体下的抽样分布。
由于这些抽样分布的论证要用到较多的数学知识, 故在本节中,主要给出有关结论。
概率密度函数
Probability density function p.d.f.
定义 设X为一随机变量,若存在非负实函数 f (x) , 使对任意实数 a < b ,有
b
P{axb}a f(x)dx
则称X为连续型随机变量, f (x) 称为X 的概 率密度函数,简称概率密度或密度函数.
x
分布函数 F(x) f (t)dt
密度函数在区间上的积分 = 随机变量在区间上取值的概率
P {x1Xx2}xx 12 f(x)dx
x1
x2
概率密度函数的性质 非负性
数理统计中常用的分布除正态分布外,还有 三个非常有用的连续型分布,即
2分布 t 分布 数理统计的三大分布(都是连续型). F分布 它们都与正态分布有密切的联系.
在本节中特别要求掌握对正态分布、 2分布、
t分布、F分布的一些结论的熟练运用. 它们
是后面各章的基础.
2 ——分布
定义 设总体 X ~N0,1 ,X1,X2,...,Xn是 X
60 1.0
解 ……….. 查表得 90 2.0
60 1.0
解得 70, 10
x75.4
故 X~N70,102
设录取的最低分为 x
某人78分,可 被录取。
则应有 PXx0.2947
P X x 1 0 .2 9 4 7 0 .7 0 5 3
x1070 0.7053
x 70 0.54 10
定理 设(X1,X2,…,Xn)为来自正态总体
X~N( , 2)的样本,则
(1) 样本均值 X 与样本方差S 2相互独立;
n
(2)
(n1)S2
2
(Xi X)2
i1
2
~2(n1)
(1)
与以下补充性质的结论比较:
性质 设(X1,X2,…,Xn)为取自正态总体
n
(Xi )2
X~N( , 2)的样本,则 i1 2
查表 x 0 时 , (x ) 的 值 可 以 查 表
x 0 时 , ( x ) 1 (x )
例 X ~N(0,1)
P ( 1X2) ( 2 ) ( 1 ) 0 . 9 7 7 2 0 . 8 4 1 3 0 . 1 3 5 9 P (X1) ( 1 ) 1 ( 1 ) 1 0 . 8 4 1 3 0 . 1 5 8 7
t 分布的数学期望与方差
设T~t (n),则E(T)=0,D(T)= nn2. (n2)
定理2
设(X1,X2,…,Xn)为来自正态总体
X~N( , 2)的样本,则统计量
TX~t(n1)
Sn
证 由于 X 与S 2相互独立,且
UXn ~ N(0,1),
(n1)S2
2
~2(n1)
由定义得
X
n
(n1)S2
随机样本和统计量
统计推断问题:电子产品的寿命
个体:组成总体的单元-随机变量 总体:研究对象的全体-随机变量的全体-分布函数 样本: X1,X2,...,Xn 为同一分布函数F的相互独立
的随机变量,称其为从分布函数得到容量为n的简 单随机样本,简称样本。
统计量 f(X1,X2,...,Xn) 是样本 X1,X2,...,Xn 的 不含任何未知数的函数,它是一个随机变量。
2分布的可加性
设 1 2~2 (n 1 ),
2 2~2 (n 2),
且
12 ,
2 2
相互独立,
则 122 2~2(n1n2)
性质 设(X1,X2,…,Xn)为取自正态总体X~N( , 2)
n
(Xi )2
的样本,则 i1 2
~ 2(n)
证明 由已知,有
Xi~N( , 2)且X1,X2,…,Xn相互独立,
定义 对总体X和给定的 (0<<1),若存在x,
使P{X≥x} =, 则称x为X分布的上侧分位数或
上侧临界值. 如图.
y
P{X≥x} =
x f(x)dx
o
x x
y
若存在数1、2,使
P{X≥1}=P{X≤2}
2
则称1、2为X分布的双
2
2 o
侧分位数或双侧临界值.
x
1
2
2
1 x
x 2
双侧 分位数或双侧临界值的特例
。 P(aXb)(b)(a)
。 P(X b) ( b )
。 P(X a) 1 (a )
例
设X~N(1,4),求 P(0<X<1.6)
解 1, 2
P(0X1.6)(1.61)(01)
2
2
(0.3)(0.5)
(0.3)1 (0.5)
0 .6 1 7 9 1 0 .6 9 1 5 0 .3 0 9 4
一般正态分布的标准化
定理
如 果 X~N (,2),则 F (x) x
概率计算
若X~N(,2)
P (aXb ) (b ) (a )
查标准正态 分布表
一般正态分布的区间概率
X~N(, 2) (x )为 标 准 正 态 分 布 函 数
P(X<b)=F(b) P(X≥b)=1﹣ P(X<b)=1 - F(b) P(a≤X<b)=F(b) ﹣ F(a) P(a≤X<b)=P(X < b)-P(X<a)= F(b)- F(a)
密度函数和分布函数的关系 积分关系
x
F(x) f(x)dx
x
F(x)P{Xx} f (x)dx
2
(n1)
X Sn T~t(n1)
定理3 设(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2) 分别
n
从表面上看, (X i X )2是n个正态随机变量 X i X 的平方和, i1
但实际上它们不是独立的, 它们之间有一种线性约束关系:
=0 n
n
(Xi X)Xi nX
i1
i1
这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下
的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1
项是独立的.所以(1)式的自由度是n-1.
导数关系
若 f( x ) 在 x 处 连 续 , 则 F ( x ) f( x )
正态分布的分布函数
x
F(x)
1 e(x22)2dx
2
F(x) 1
1 2
x
标准正态分布
Standard Normal distribution
定义 X ~ N(0,1)分布称为标准正态分布
密度函数
(x)
1
3准则
X~N(,2)
X的取值几乎都落入以为中心,以3为半径 的区间内。这是因为:
P 3 X 3 ( 3 ) ( 3 )
( 3 ) [ 1 ( 3 ) ] 2 ( 3 ) 1 0 . 9 9 7 4
F(x) 0.9974
X3
是小概率事件
3
3
概率分布的分位数(分位点)
Distribution Function 分布函数的定义
设X为一随机变量,则对任意实数x, (X<x)是一个随机事件,称
F(x)P(Xx)
为随机变量X的分布函数
F(x)是一个普
通的函数!
定义域为 (-∞,+∞); 值域为 [0,1]。
分布函数表示事件的概率
引进分布函数F(x)后,事件的概率都 可以用F(x)的函数值来表示。
或双侧临界值. 见图.
2
(
n
)
为 2分布的上2
显然, 分位数.
2
2
2
2 1
2
(
n
)
为
2分布的上1
2
O
分位数.
2 1
2
(
n
)
2
2(n )
x
如当n=8, =0.05时,
122(n)02.975(8)2.18
2(n)02.025(8) 17.53 2
2分布的数学期望与方差
设 2~ 2(n),则E( 2)=n,D( 2)=2n.
~ 2(n)
t分布
定义:设随机变量X~N(0,1),Y~ 2(n) ,且X与Y
相互独立,则称统计量 T
X Y
n
服从自由度为n的t分布或学生氏分布,记作T ~t(n).
t分布的概率密度函数为 f(t) n ( n 2 (1 n 2 ))(1tn 2)n2 1, (t )
其形状类似标准正态分布的概率密度
当X的分布关于y轴对称时, 若存在 x 2 , 使
P{Xx2},
则称 x
为X分布的双侧分位数或双侧临界值.
2
y
如图.
2
2
x 2 O x 2 x
标准正态分布的分位数
在实际问题中, 常取0.1、0.05、0.01.
常用到下面几个临界值:
u0.05 =1.645, u0.05/2=1.96,
u0.01 =2.326 u0.01/2=2.575
P (aX b ) (b ) (a )
正态分布的实际应用
某单位招聘155人,按考试成绩录用,共有526
人报名,假设报名者的考试成绩 X ~N(,2)
已知90分以上的12人,60分以下的83人,若从高分 到低分依次录取,某人成绩为78分,问此人能否被录 取?
分析
首先求出 和
然后根据录取率或者分数线确定能否录取
1y
2
中间高 两边低
-
+ x
对称性 单调性 拐点
关于 x = 对称
(- ,)升,(,+ )降
(,
1
1
e 2);
2
f最大 ()
1
2
μ,σ对密度曲线的影响
1
1 21 1 22
相同,不同
图形相似,位置平移
2
1 0.75 2 1.25
不同,相同 越小,图形越陡; 越大,图形越平缓
随机变量的分布函数
f(t)
的图形.
当n较大时, t分布近似于标准正态分
布.
O
当n较大时, t分布近似于标准正态分布. 一般说来,当n>30时,t分布与标准正态分布N(0,
1)就非常接近.
但对较小的n值,t分布与标准正态分布之间有较大
差异.且P{|T|≥t0}≥P{|X|≥t0},其中X ~N(0,1),即在t分 布的尾部比在标准正态分布的尾部有着更大的概率.
则
Xi
~
N(0,1)且各
X
i
相互独立,
由定义得
n
2i n1Xi2i1(X i2)2~2(n).
定理 设(X1,X2,…,Xn)为来自正态总体
X~N( , 2)的样本,则
(1) 样本均值 X 与样本方差S 2相互独立;
n
(2)
(n1)S2
2
(Xi X)2
i1
2
~2(n1)
(1)
(1)式的自由度为什么是n-1?
其几何意义见图所示.
其中f(y)是 2-分布的概率密度. O
2
(
n
)
x
显然,在自由度n取定以后,
2
(
n
) 的值只与有关.
例如,当n=21,=0.05时,由附表可查得
02.05(21) 32.67 即 P2 (2 1 ) 3 2 .6 7 0 .0 5 .
2分布的双侧分位数
的把数满足12P 2( n),2 22(1 2 n )2称(n 为) 2f分(P x布) 的2 双 侧 2 2 分(n 位) 数2
解 成绩X服从 N ,2
PX90120.0228 PX60830.1588
526
526
录取率为 155 0.2947
526
可得 P X 9 0 1 9 0 1 0 .0 2 2 8 0 .9 7 7 2
PX60 600.1588
得
6010.15880.8412
查表得 90 2.0
x2
e 2 偶函数
2
分布函数
x
1 x2
(x)
Байду номын сангаас
e 2 dx
2
y (x)
0 1
标准正态分布的概率计算
分布函数
( x) P{ X x}
x
1
x2
e 2 dx
2
y (x)
(x)1(x)
(0)0.5
-x
X
标准正态分布的概率计算
公式
P ( a X b ) (b ) (a ) P ( Xb) (b) P ( Xa ) 1 (a)
的一个样本, 则称统计量 2X1 2X2 2LXn 2服从自
由度为n的 2 分布,记作 2 ~ 2(n)
自由度是指独立随机变量的个数, df n
2 ( n ) 分布的密度函数为
f
(y)
2n
1
2n
2
yn
e 21 y
2,
y0
0,
y0
(n1)n!
2 ( n ) 分布密度函数的图形
f(y)
0.5 0.4
n=1
0.3
0.2 n=4
0.1
n=10
0 1 3 5 7 9 11 13 15 17 x
图
其图形随自由度的 不同而有所改变.
P2(n ) 2(n )
2分布表
2分布的上分位数
满足
的数
P 2 ( n )为2 (n 2)分 布的 2 (n )f (y) 2 (n )f(y )d y
上分位数或上侧临界值,
f(x) 0 , x ( , )
规范性
f (x)
f (x)dx 1
P { x }1
正态分布 Normal Distribution
若连续型随机变量X的概率密度为
f(x) 1
(x)2
e22
2
,(0)为 常 数
则称X服从参数为 ,2 正 态 分 布 , 记 为
X ~N(,2)
正态分布的密度函数的性质与图形
统计量的分布称为抽样分布。
由于正态总体是最常见的总体,因此主要讨论正态 总体下的抽样分布。
由于这些抽样分布的论证要用到较多的数学知识, 故在本节中,主要给出有关结论。
概率密度函数
Probability density function p.d.f.
定义 设X为一随机变量,若存在非负实函数 f (x) , 使对任意实数 a < b ,有
b
P{axb}a f(x)dx
则称X为连续型随机变量, f (x) 称为X 的概 率密度函数,简称概率密度或密度函数.
x
分布函数 F(x) f (t)dt
密度函数在区间上的积分 = 随机变量在区间上取值的概率
P {x1Xx2}xx 12 f(x)dx
x1
x2
概率密度函数的性质 非负性
数理统计中常用的分布除正态分布外,还有 三个非常有用的连续型分布,即
2分布 t 分布 数理统计的三大分布(都是连续型). F分布 它们都与正态分布有密切的联系.
在本节中特别要求掌握对正态分布、 2分布、
t分布、F分布的一些结论的熟练运用. 它们
是后面各章的基础.
2 ——分布
定义 设总体 X ~N0,1 ,X1,X2,...,Xn是 X
60 1.0
解 ……….. 查表得 90 2.0
60 1.0
解得 70, 10
x75.4
故 X~N70,102
设录取的最低分为 x
某人78分,可 被录取。
则应有 PXx0.2947
P X x 1 0 .2 9 4 7 0 .7 0 5 3
x1070 0.7053
x 70 0.54 10
定理 设(X1,X2,…,Xn)为来自正态总体
X~N( , 2)的样本,则
(1) 样本均值 X 与样本方差S 2相互独立;
n
(2)
(n1)S2
2
(Xi X)2
i1
2
~2(n1)
(1)
与以下补充性质的结论比较:
性质 设(X1,X2,…,Xn)为取自正态总体
n
(Xi )2
X~N( , 2)的样本,则 i1 2
查表 x 0 时 , (x ) 的 值 可 以 查 表
x 0 时 , ( x ) 1 (x )
例 X ~N(0,1)
P ( 1X2) ( 2 ) ( 1 ) 0 . 9 7 7 2 0 . 8 4 1 3 0 . 1 3 5 9 P (X1) ( 1 ) 1 ( 1 ) 1 0 . 8 4 1 3 0 . 1 5 8 7
t 分布的数学期望与方差
设T~t (n),则E(T)=0,D(T)= nn2. (n2)
定理2
设(X1,X2,…,Xn)为来自正态总体
X~N( , 2)的样本,则统计量
TX~t(n1)
Sn
证 由于 X 与S 2相互独立,且
UXn ~ N(0,1),
(n1)S2
2
~2(n1)
由定义得
X
n
(n1)S2
随机样本和统计量
统计推断问题:电子产品的寿命
个体:组成总体的单元-随机变量 总体:研究对象的全体-随机变量的全体-分布函数 样本: X1,X2,...,Xn 为同一分布函数F的相互独立
的随机变量,称其为从分布函数得到容量为n的简 单随机样本,简称样本。
统计量 f(X1,X2,...,Xn) 是样本 X1,X2,...,Xn 的 不含任何未知数的函数,它是一个随机变量。
2分布的可加性
设 1 2~2 (n 1 ),
2 2~2 (n 2),
且
12 ,
2 2
相互独立,
则 122 2~2(n1n2)
性质 设(X1,X2,…,Xn)为取自正态总体X~N( , 2)
n
(Xi )2
的样本,则 i1 2
~ 2(n)
证明 由已知,有
Xi~N( , 2)且X1,X2,…,Xn相互独立,
定义 对总体X和给定的 (0<<1),若存在x,
使P{X≥x} =, 则称x为X分布的上侧分位数或
上侧临界值. 如图.
y
P{X≥x} =
x f(x)dx
o
x x
y
若存在数1、2,使
P{X≥1}=P{X≤2}
2
则称1、2为X分布的双
2
2 o
侧分位数或双侧临界值.
x
1
2
2
1 x
x 2
双侧 分位数或双侧临界值的特例
。 P(aXb)(b)(a)
。 P(X b) ( b )
。 P(X a) 1 (a )
例
设X~N(1,4),求 P(0<X<1.6)
解 1, 2
P(0X1.6)(1.61)(01)
2
2
(0.3)(0.5)
(0.3)1 (0.5)
0 .6 1 7 9 1 0 .6 9 1 5 0 .3 0 9 4