概率论与数理统计中的三种重要分布
概率论与数理统计各种分布总结
概率论与数理统计各种分布总结概率论与数理统计中有许多不同的概率分布,每个分布都具有不同的特征和应用。
下面是一些常见的概率分布的总结:1. 均匀分布(Uniform Distribution):在一个区间内的所有取值都具有相等的概率。
它可以是离散的(离散均匀分布)或连续的(连续均匀分布)。
2. 二项分布(Binomial Distribution):描述了在一系列独立的伯努利试验中成功次数的概率分布。
每个试验只有两个可能结果(成功和失败),并且成功的概率保持不变。
3. 泊松分布(Poisson Distribution):用于描述在给定时间或空间单位内发生某事件的次数的概率分布。
它通常用于模拟稀有事件的发生情况。
4. 正态分布(Normal Distribution):也称为高斯分布,是最常见的连续概率分布之一。
它具有钟形曲线的形状,对称且具有明确的均值和标准差。
许多自然现象和测量数据都可以近似地用正态分布来描述。
5. 指数分布(Exponential Distribution):描述了连续随机事件之间的时间间隔的概率分布。
它通常用于模拟无记忆性事件的发生情况,如设备故障、到达时间等。
6. 卡方分布(Chi-Square Distribution):由正态分布的平方和构成的概率分布。
它在统计推断中广泛应用,特别是在假设检验和信赖区间的计算中。
7. t分布(Student's t-Distribution):用于小样本量情况下参数估计和假设检验。
与正态分布相比,t分布具有更宽的尾部,因此更适用于小样本数据。
8. F分布(F-Distribution):用于比较两个或多个样本方差是否显著不同的概率分布。
它经常用于方差分析和回归分析中。
这只是一些常见的概率分布的总结,还有其他许多分布,每个都在不同的领域和应用中起着重要的作用。
概率论与数理统计 7.2 数理统计中的三大分布
7.2 数理统计中的三大抽样分布
在数理统计中,以标准正态变量为基石而构 造的三个著名统计量有着广泛的应用,这是因为 这三个统计量不仅有明确背景,而且其抽样分布 的密度函数有明显的数学表达式,它们被称为统 计中的“ 三大抽样分布 ” 。
1. 2 分布
数理统计
2分布是由正态分布派生出来的一种分布.
t1 (n) t (n)
o t (n)
x
t分布的上分位点t (n)可查表
求得,例t0.025(15) 2.1315.
当n 45时,对于常用的的值,可用正态近似 t (n) z
例3:X ~ t(15)
(1)求 0.01的上侧分位数; (2) P( X ) 0.05,求 ; (3)P( X ) 0.95 ,求 .
记为 t ~ t(n). t分布概率密度函数为:
f (t)
[(n 1)
2]
(1
t
2
)
n1 2
,
t
(n 2) n n
t 分布的图像
y N (0,1) 数理统计
t(n)
t分布的性质: 1. 设t ~ t(n),则E(t) 0, D(t) n (n 2) (n 2)
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
F分布的上分位点的性质:
F1 (n1, n2 )
1 F (n2 , n1 )
F分布的上分位点可查表求得.例,
F0.95 (12,9)
1 F0.05 (9,12)
1 2.80
0.357
例4. F ~ F (24,15),求 1,2 使 P(F 2 ) 0.025 P(F 1) 0.025
概率论中几种常用重要分布
概率论中几种常用的重要的分布摘要:本文主要探讨了概率论中的几种常用分布,的来源和他们中间的关系。
其在实际中的应用。
关键词1 一维随机变量分布随机变量的分布是概率论的主要内容之一,一维随机变量部分要介绍六中常用分布,即( 0 -1) 分布、二项分布、泊松分布、均匀分布、指数分布和正态分布. 下面我们将对这六种分布逐一地进行讨论.随机事件是按试验结果而定出现与否的事件。
它是一种“定性”类型的概念。
为了进一步研究有关随机试验的问题,还需引进一种“定量”类型的概念,即,根据试验结果而定取什么值(实值或向量值)的变数。
称这种变数为随机变数。
本章内将讨论取实值的这种变数—— 一维随机变数。
定义1.1 设X 为一个随机变数,令 ()([(,)])([]),()F x P X x P Xx x=∈-∞=-∞+∞.这样规定的函数()F x 的定义域是整个实轴、函数值在区间[0,1]上。
它是一个普通的函数。
成这个函数为随机函数X 的分布函数。
有的随机函数X 可能取的值只有有限多个或可数多个。
更确切地说:存在着有限多个值或可数多个值12,,...,a a 使得 12([{,,...}])1P X a a ∈=称这样的随机变数为离散型随机变数。
称它的分布为离散型分布。
【例1】下列诸随机变数都是离散型随机变数。
(1)X 可能取的值只有一个,确切地说,存在着一个常数a ,使([])1P X a ==。
称这种随机变数的分布为退化分布。
一个退化分布可以用一个常数a 来确定。
(2)X 可能取的值只有两个。
确切地说,存在着两个常数a ,b ,使([{,}])1P X a b ∈=.称这种随机变数的分布为两点分布。
如果([])P X b p ==,那么,([])1P X a p ===-。
因此,一个两点分布可以用两个不同的常数,a b 及一个在区间(0,1)内的值p 来确定。
特殊地,当,a b 依次为0,1时,称这两点分布为零-壹分布。
3个重要分布和抽样定理
7
0.989
1.690 9.803 12.017 14.067 16.013 16.622 18.475 20.278 22.601 24.322
8
1.344
2.180 11.030 13.362 15.507 17.535 18.168 20.090 21.955 24.352 26.124
9
1.735
则称随机变量
t
X
Y /n
服 从 自 由 度 为n 的 t 分 布,
记为 t ~ t(n).
自由度为n的t分布概率密度
f (x)
n 2
n
1
n
1
x2 n
n1 2
2
x
其中 ( ) x 1e x dx 0
是Gamma函数
不同自由度下的t分布密度曲线
0
t 分布密度曲线特点
服从自由度为n 的²分布,记
2 ~ 2 (n)
独立的随机变量的个数n: 自由度
.
²n分布的概率密度
f (x) 2n
1 2 (n
n 1
x -
x2 e 2,
2)
x
0,
0,
x 0.
其中 ( ) x 1e x dx 0
是Gamma函数
²n分布密度曲线
不同自由度下的2 n分布
f(x)
设X服从N(0, 1) 设f(x)是N (0, 1)的密度函数
则
E
X4
x4
f
x
dx
x3
xf
xdx
x 3d
f x
x 3
f x
f
x
d
x3
3
x
概率论五大分布
概率论五大分布
概率论五大分布是指概率论中重要的五种分布,分别是正态分布、泊松分布、二项分布、指数分布和伽马分布。
正态分布是自然界中最常见的分布,其特征是钟形曲线,用于描述一些观测值在平均值附近的分布情况。
泊松分布用于描述单位时间内某事件发生次数的概率分布,例如单位时间内电话呼叫数或交通事故数等。
二项分布是一种离散概率分布,常用于描述在一系列独立的二元实验中成功次数的概率分布,例如抛硬币的结果或者射击的命中率。
指数分布是一种连续概率分布,用来描述时间或距离等连续变量的概率分布,例如等待下一次电话呼叫的时间或者两个事故发生的距离等。
伽马分布是一种连续概率分布,常用于描述随机事件发生时间间隔的概率分布,例如在一定时间内发生多次事件的时间间隔等。
这五种分布在实际应用中广泛存在,对于理解概率论及其在实际中的应用具有重要意义。
- 1 -。
数理统计中几种分布之间的关系
数理统计中有几种常见的概率分布,包括正态分布、泊松分布和指数分布。
这些分布在实际应用中有着重要的意义,它们之间的关系也是数理统计中的一个重要内容。
1. 正态分布正态分布是自然界和社会现象中最常见的分布之一,也被称为高斯分布。
它具有钟形曲线,呈现出中间高、两端低的特点。
正态分布有着许多重要的性质,比如均值和标准差能够完全描述一个正态分布。
在实际应用中,正态分布可以用来描述许多自然现象,比如身高、体重等。
另外,中心极限定理告诉我们,大量独立同分布的随机变量之和的分布趋于正态分布。
2. 泊松分布泊松分布是描述单位时间内随机事件发生次数的概率分布。
它适用于描述少量成功事件在长时间内发生的情况。
泊松分布的参数是平均发生率λ,它决定了事件发生的概率。
泊松分布在实际应用中被广泛运用,比如描述单位时间内接到的通信方式数、一段时间内发生的交通事故数等。
3. 指数分布指数分布是描述事件发生间隔时间的概率分布,它是泊松分布的补充。
指数分布的参数是事件发生率λ,它与泊松分布的参数相互关联。
指数分布常用来描述无记忆性的随机变量,比如设备的寿命、服务时间间隔等。
数理统计中,这三种分布之间存在着密切的联系。
正态分布和泊松分布在一定条件下可以近似互相转化。
当事件发生率λ趋向无穷大时,泊松分布将近似于正态分布。
而在一些特殊情况下,指数分布也可以退化为泊松分布。
这三种分布之间并不是孤立存在的,它们在一定条件下是相互联系、相互激发的。
在我的理解中,这三种概率分布之间的关系可以帮助我们更好地理解和应用概率统计的相关知识。
通过对它们之间关系的深入了解,我们可以更准确地选择合适的分布来描述实际问题,从而提高统计分析的准确性和实用性。
总结起来,正态分布、泊松分布和指数分布是数理统计中常见的概率分布,它们之间存在着密切的联系。
深入理解它们之间的关系有助于我们更好地应用统计学知识,提高数据分析的准确性和实用性。
希望通过本篇文章的阐述,能为读者带来一些启发和帮助。
概率论与数理统计期末复习重要知识点
概率论与数理统计期末复习重要知识点第二章知识点:1.离散型随机变量:设X 是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X 为一个离散随机变量。
2.常用离散型分布:(1)两点分布(0-1分布):若一个随机变量X 只有两个可能取值,且其分布为12{},{}1(01)P X x p P X x pp ====-<<,则称X 服从12,x x 处参数为p 的两点分布。
两点分布的概率分布:12{},{}1(01)P X x p P X x pp ====-<<两点分布的期望:()E X p =;两点分布的方差:()(1)D X p p =-(2)二项分布:若一个随机变量X 的概率分布由式{}(1),0,1,...,.k kn k n P x k C p p k n -==-=给出,则称X 服从参数为n,p 的二项分布。
记为X~b(n,p)(或B(n,p)). 两点分布的概率分布:{}(1),0,1,...,.k kn k n P x k C p p k n -==-=二项分布的期望:()E X np =;二项分布的方差:()(1)D X np p =-(3)泊松分布:若一个随机变量X 的概率分布为{},0,0,1,2,...!kP X k ek k λλλ-==>=,则称X 服从参数为λ的泊松分布,记为X~P (λ)泊松分布的概率分布:{},0,0,1,2,...!kP X k ek k λλλ-==>=泊松分布的期望:()E X λ=;泊松分布的方差:()D X λ=4.连续型随机变量:如果对随机变量X 的分布函数F(x),存在非负可积函数()f x ,使得对于任意实数x ,有(){}()xF x P X x f t dt-∞=≤=⎰,则称X 为连续型随机变量,称()f x 为X 的概率密度函数,简称为概率密度函数。
5.常用的连续型分布:(1)均匀分布:若连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧<<-=其它,0,1)(bx a a b x f ,则称X 在区间(a,b )上服从均匀分布,记为X~U(a,b)均匀分布的概率密度:⎪⎩⎪⎨⎧<<-=其它,0,1)(b x a a b x f 均匀分布的期望:()2a bE X +=;均匀分布的方差:2()()12b a D X -= (2)指数分布:若连续型随机变量X 的概率密度为00()0xe xf x λλλ-⎧>>=⎨⎩,则称X 服从参数为λ的指数分布,记为X~e (λ)指数分布的概率密度:00()0xe xf x λλλ-⎧>>=⎨⎩指数分布的期望:1()E X λ=;指数分布的方差:21()D X λ=(3)正态分布:若连续型随机变量X的概率密度为22()2()x f x x μσ--=-∞<<+∞则称X 服从参数为μ和2σ的正态分布,记为X~N(μ,2σ)正态分布的概率密度:22()2()x f x x μσ--=-∞<<+∞正态分布的期望:()E X μ=;正态分布的方差:2()D X σ=(4)标准正态分布:20,1μσ==,2222()()x t xx x e dtϕφ---∞=⎰标准正态分布表的使用: (1)()1()x x x φφ<=--(2)~(0,1){}{}{}{}()()X N P a x b P a x b P a x b P a x b b a φφ<≤=≤≤=≤<=<<=-(3)2~(,),~(0,1),X X N Y N μμσσ-=故(){}{}()X x x F x P X x P μμμφσσσ---=≤=≤={}{}()()a b b a P a X b P Y μμμμφφσσσσ----<≤=≤≤=-定理1: 设X~N(μ,2σ),则~(0,1)X Y N μσ-=6.随机变量的分布函数: 设X 是一个随机变量,称(){}F x P X x =≤为X 的分布函数。
概率论与数理统计几种重要的分布
np
p1
k0
np
p
p
p n
1 n
k0 n
p
p n
n , k0 p n
n很大时,频率为概率的可能最大
例5、某批产品有80%的一等品,对它们进行重复抽样检验, 共取出4个样品,求其中一等品数X的最可能值k,并用贝努 利公式验证。
解:一等品数X服从二项分布,np+p=3.2+0.8=4,
所以k=3,4时P{X=k}最大。
N1 p, N
N2 1 p. N
例3、一大批种子的发芽率为90%,从中任取10粒,求 (1)播种后恰好有8粒发芽的概率。 (2)播种后不少于8粒发芽的概率。
解 设X为10粒种子中发芽的种子数目,服从超几何分布。 但是N很大,n=10项对于N很小,可以认为X近似服从二 项分布B(10,0.9)。
1)) n!
n! m!(n m)!
N
m 1
N
n 2
m
(1
1 N1
)(1
2 N1
)(1
m 1) (1 N1
1 N2
)(1
2 N2
)(1
n m 1) N2
N n (1 1 )(1 2 )(1 n 1)
NN
N
C
m n
N1 N
m
N2 N
nm
C
m n
pmqnm (N
)
当N 时,超几何分布以二项 分布为极限,
P(X
k)
C
k 5
C 4 15
k
C
4 20
(k 0,1,2,3,4)
例2:某班有学生20名,其中3名女同学,今从班上任选4名学 生去参观展览,被选到的女学生数X是一个随机变量,求X的 分布。
统计三大分布
根据独立随机变量商的密度公式(3-32),
可以证明(过程从略):(6-13)中的
Tn
概率密度函数为
根据独立随机变量商的密度公式(3-32),可
以证明(过程从略):(6-13)中 Tn 的概率
密度函数为
, x . fn(x)
Γ(
n1 2
)
n
Γ(
n 2
)
1
x2 n
n1 2
(6-14)
另外,t -分布具有以下性质:
变量不小于该数的概率为 . 比如,若记 2-
变量
2 n
的
-上侧分位数为,则满足(见图
6.2).
fn (x)
2 (n)
x
图 6.2
对不太大的n,如
n
60,可用附表3查
2
(n)
的
值,而对较大的n,则可用(6-11)近似计
算
2 (n) n 2n U , (6-12)
其中U 是标准正态分布N(0,1)的 -上侧分位
数,可通过附表2查出.
二、t -分布
定则 自义称由6.2度T为设n nX的Y~XtN/ -n(0分,1)布,Y,(6~记-123作()n)所,Tn 服X~ t与从(n)Y的.独t分-立分布,布是
也称为学生分布,是英国统计学家戈塞特 (Goset,1876-1937)在1908年“Student”
的笔名首次发表的,这个分布在数理统计 中也占有重要的地位.
,则
顺便指出,自由度为1的t -分布也称为柯西
(Cauchy)分布,它以其数学期望和方差
均不存在而闻名(见例4.3).
记t -分布t(n) 的 -上侧分位数为t (n),附表4
给出了不同n和 所对应的t (n) 数值. 另外,
三种分布介绍(正态分布,伯努利分布,泊松分布)
1、正态分布正态分布(Normal distribution)又名高斯分布(Gaussiandistribution),若随机变量X服从一个数学期望为μ、方差为σ^2的高斯分布,记为N(μ,σ^2)。
其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。
当μ=0,σ=1时,正态分布就成为标准正态分布N(0,1)。
概率密度函数为:正态分布的密度函数的特点是:关于μ对称,并在μ处取最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点,形状呈现中间高两边低,图像是一条位于x轴上方的钟形曲线。
2、伯努利分布如果随机变量X只取0和1两个值,并且相应的概率为:则称随机变量X服从参数为p的伯努利分布,若令q=1一p,则X的概率函数可写为:伯努利分布(二点分布)的期望E(X)=p,D(X)=p(1-p)。
(其中,离散数据的方差计算公式为D(X)=E{[X-E(X)]^2})n重伯努利分布(二项分布)的期望E(X)=np,D(X)=np(1-p)。
3、泊松分布在统计学上,只要某类事件满足三个条件,它就服从"泊松分布"。
三个条件分别是:①事件X的发生是小概率事件②事件X的发生是随机而且互相独立的③事件X发生的概率相对稳定。
泊松分布的公式为:各个参数的含义:单位时间(或单位面积)内随机事件的平均发生率,即P(X=k)事件X发生k次的概率,λ表示事件X稳定发生的概率。
当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似。
设X~B(n,p),当n很大,p很小,且λ=np适中时,有P(x=k)≈λ^k/k! ·e^(-λ),推导过程如下所示:为第二重要极限公式,上面的推到会涉及到。
概率论与数理统计第四章_几种重要的分布
ξ
0
1
2
3
4
p 0.0016 0.0256 0.1536 0.4096 0.4096
4.2超几何分布(了解)
主要内容: (一)了解超几何分布的概念 (二)了解超几何分布的期望和方差
4.2超几何分布
例1 某班有学生20名,其中有5名女同学,今从 班上任选4名学生去参观展览,被选到的女同学数ξ
k1 (k 1)!(n k)!
n
(k 11)n! pk (1 p)nk
k1 (k 1)!(n k)!
n
(k 1)n!
n
pk (1 p)nk
n!
pk (1 p)nk
k1 (k 1)!(n k)!
k1 (k 1)!(n k)!
n
n!
n
pk (1 p)nk
n!
pk (1 p)nk
k2 (k 2)!(n k)!
解 可以取0,1,2,3这4个值。
P(
=k)=
C3k
C4k 17
C420
(k=0,1,2,3,)
列成概率分布如下
ξ
0
1
2
3
p 0.4912 0.4211 0.0842 0.0035
定义42 设N个元素分为两类,有N1个属于第一类, N2个属于第二类(N1+N2=N)。从中按不重复抽 样取n个,令ξ表示这n个中第一(或二)类元素的个数,
k1 (k 1)!(n k)!
n2
n1
n(n 1)Cnl 2 pl2 (1 p)n2l nCnj1 p j1(1 p)n1 j
l0
j0
n2
n(n 1)Cnl 2 pl2 (1 p)n2l l0
三大分布概率论与数理统计
1,
X
2 2
~
2
1,
X
2 1
X
2 2
~
2
2.
下图分别是当 n 1,4,10,20 时的概率密度函数图形.
例1 设 X1, X 2 , , X6 是取自总体 N 0,32 的简单随
机样本, 求非零常数 a,b, c , 使得
Q aX12 b X2 X3 2 c X4 X5 X6 2
② 2 分布的可加性: 设 X ~ 2 m,Y ~ 2 n , 且 X
与Y 相互独立, 则
X Y ~ 2 m n.
证①: E Y n, DY 2n
由卡方分布定义知
E
Y
E
n
X
2 i
n
E
X
2 i
i1 i1
X
2 5
3
所以, 取 d 3 6 即可, 且自由度为3. 22
⑵分位数
设 X ~ t n , 记它的 p 分位数为 tp n , 即tp n满足
P X tp n p.
根据 t 分布密度函数的对称性, 有性质 tp n t1 p n.
该性质类似于正态分布的分位数性质. 分位数值查表可得.
则有
X
2 1
~
2
1,
X
2 2
X
2 3
~
2
2
且
X
2与
1
X
2 2
X
2 3
相互独立,
故
X
2 1
/1
(
X
2 2
概率论三大分布
概率论三大分布
概率论中,三大分布指的是正态分布、泊松分布和指数分布。
这些分布都有自己独特的性质和应用。
正态分布是一种连续分布,也被称为高斯分布。
它是自然界中最常见的分布之一,例如人类身高、智力测试分数和环境因素等。
正态分布的特点是呈钟形曲线,它的中心是对称的,平均值和标准差可以用来描述它的形状。
泊松分布是一种离散分布,它通常用于描述事件发生的次数。
例如,在一段时间内到达某个地点的车辆数量或在一天内接收到的电子邮件数量。
泊松分布的特点是事件的发生是独立的,且所有事件发生的概率相等。
指数分布是一种连续分布,它通常用于描述时间间隔或持续时间。
例如,两个人之间的通话时间或两次地震之间的时间间隔。
指数分布的特点是它的概率密度函数呈指数形式衰减,即随着时间的增加,事件发生的概率逐渐减少。
这三种分布在统计学和数据分析中都有广泛的应用,特别是在模型构建和预测分析中。
因此,熟悉它们的性质和应用是非常重要的。
- 1 -。
三大抽样分布的定义及应用
三大抽样分布的定义及应用三大抽样分布是指正态分布、t分布和卡方分布。
它们在统计学中具有重要的应用,并且广泛地被用于估计和推断总体参数。
正态分布是指具有钟形曲线的连续概率分布,其概率密度函数的形状由均值和标准差决定。
在实际应用中,正态分布广泛用于描述许多自然现象,例如人的智力分布、心脏跳动的间隔时间等等。
对于大样本量的情况下,根据中心极限定理,样本均值的分布可以近似服从正态分布。
因此,正态分布在统计推断中起到了至关重要的作用,例如用于构建置信区间、假设检验、回归分析等。
t分布是由英国统计学家威廉·戴韦提出的,是用来处理小样本量情况下的统计推断问题的一种概率分布。
t分布与正态分布相似,但是其概率密度函数的形状更加平坦,有更宽的尾部。
t分布的自由度是影响其形状的一个参数,自由度越小,尾部越厚重。
在小样本量的情况下,使用t分布进行统计推断可以更准确地估计总体参数。
例如,当样本量较小时,使用t分布来计算置信区间或进行假设检验,可以避免过度自信导致错误的推断结果。
卡方分布是由皮尔逊提出的,是应用在统计推断中的一种概率分布。
卡方分布常用于分析分类数据的相关性以及拟合度。
在这两个统计问题中,卡方分布提供了一个用于检验观察值与期望值之间的差异程度的方法。
卡方分布的自由度取决于数据的维度。
在统计推断中,卡方分布被广泛用于拟合度检验,例如用于检验样本的观察频数与理论频数是否有显著差异。
正态分布、t分布和卡方分布的应用在各个领域和学科中都非常广泛。
在医学研究中,这些分布被用于分析临床试验的数据,进行数据建模以及推断总体参数。
在市场研究中,这些分布被用于对市场数据进行概率分析和预测。
在财务管理中,这些分布被用于分析股价的波动性和风险评估。
在工程领域中,这些分布被用于分析产品的可靠性和质量控制。
总之,正态分布、t分布和卡方分布是统计学中的三大抽样分布,它们在统计推断中具有重要的应用价值。
通过使用这些分布进行数据分析和推断,我们可以准确地估计总体参数,进行假设检验,以及进行优化和决策制定等重要统计任务。
概率论中三个重要分布
χ2统计量
• χ2统计量也可表示成
n
2
(xi X )2
i 1
2
(n
1) s 2
2
χ2分布的概率密度函数
• χ2(n)分布的概率密度为
f
( y)
2n
1 2 Γ(n
2)
n 1 y
y2 e 2,
• 其中Γ( ·)为伽玛函0,数
y0 其他
Γ (s) x e s1 xdx 0
χ2分布的统计特性
例题分析
1. n=12, α=0.05, 求 2. n=12, α=0.95, 求 3. n=18, α=0.95, 求
2 0.05
(12
)
02和.95 (12)
2 0.95
(18
)
使得
2 0.05
(18
)
4.
n=50,
α=P0(.0502.,95求(18)
2
2 0.05
(18
))
0.9
2 0.05
n3
t分布的统计特性(续)
• t(n-1)分布的形状类似标准正态分布,但由 于t(n-1)的方差大于1(当n>3时,(n-1)/(n3)>1),所以t(n-1)分布比标准正态分布更 分散。即t(n-1)的概率密度函数是中央部分 较标准正态分布低,而两尾部分则较标准 正态分布高
t分布的统计特性(续)
P(t0.975(18)≤t≤ t0.025(18))=0.95 4. n=50, α=0.05,求t0.05(50)
F分布
• χ2分布的变量值始终为正 • χ2(n)分布的形状取决于其自由度n的大小
,通常为不对称的右偏分布,但随着自由 度的增大逐渐趋于对称 • χ2分布的期望为:E(χ2(n))=n,方差为: D(χ2(n))=2n • χ2分布具有可加性。若U~χ2(n1), V~χ2(n2) ,则U+V~χ2(n1+n2)
《概率论与数理统计》学习笔记
《概率论与数理统计》(19)电子科技大学应用数学学院,徐全智吕恕主编。
2004版第6章数理统计的基本概念概率论与数理统计是两个紧密联系的姊妹学科,概率论是数理统计学的理论基础,而数理统计学则是概率论的重要应用.数理统计学是使用概率论和数学的方法,研究如何用有效的方式收集带有随机误差的数据,并在设定的模型下,对收集的数据进行分析,提取数据中的有用信息,形成统计结论,为决策提供依据. 这就不难理解,数理统计应用的广泛性,几乎渗透到人类活动的一切领域! 如:农业、生物和医学领域的“生物统计”,教育心理学领域的“教育统计”,管理领域的“计量经济”,金融领域的“保险统计”等等,这些统计方法的共同基础都是数理统计.数理统计学的内容十分丰富,概括起来可以分为两大类:其一是研究如何用有效的方式去收集随机数据,即抽样理论和试验设计;其二是研究如何有效地使用随机数据对所关心的问题做出合理的、尽可能精确和可靠的结论,即统计推断.本书主要介绍统计推断的基本内容和基本方法. 在这一章中先给出数理统计中一些必要的基本概念,然后给出正态总体抽样分布的一些重要结论.6.1总体、样本与统计量一、总体在数理统计中,我们将研究对象的全体称为总体或母体,而把组成总体的每个基本元素称为个体.二、样本样本是按一定的规定从总体中抽出的一部分个体" 这里的“按一定的规定”,是指为保证总体中的每一个个体有同等的被抽出的机会而采取的一些措施" 取得样本的过程,称为抽样.三、统计量6.2抽样分布统计量是我们对总体的分布规律或数字特征进行推断的基础. 由于统计量是随机变量,所以在使用统计量进行统计推断时必须要知道它的分布. 统计量的分布称为抽样分布.一、三个重要分布二、抽样分布定理6.3应用一、顺序统计量及其应用二、极值的分布及其应用。
概率论与数理统计常用的统计分布
概率论与数理统计
2 X ~ N ( , ) , X1 , X 2 ,... X n 是 定理 2 设总体
取自 X 的一个样本, X 与 S 为该样本的样 本均值与样本方差,则有
2 2 S 2 2 ( X i X )2 ~ 2 (n 1) (1) i 1
概率论与数理统计
设总体 X 的均值和方差 2 E( X ) , D( X ) 都存在. X1 , X 2 , , Xn 是来自总体 X 的样本,则 2 E ( X ) , D( X ) n , E ( S 2 ) 2
n n 1 1 E( X ) E( n X i ) n E( X i ) i 1 n i 1 n
n
X (2) T S / n ~ t (n 1)
概率论与数理统计
设 X1 , X 2 , , Xn 是总体 X ~ N ( , 2 ) 的样本, X , S 2分别为样本均值和样本方差,则有 X ~ t (n 1) S/ n 由定理一、定理二有 2 ( n 1) S X 2 Y ~ N ( 0 , 1) , 2 ~ (n 1) 2 / n 2 且 Y 与 独立,由 t 分布的定义有 X X / n Y ~ t (n 1) S/ n (n 1) S 2 / 2 S 2/n n 1
3 0.1 P3 |X | 99.7%. P | X | X | 0.03} 99.7%. P{| n 100
概率论与数理统计
例3 在设计导弹发射装置时, 重要事情之 一是研究弹着点偏离目标中心的距离的方 差.对于一类导弹发射装置, 弹着点偏离目标 中心的距离服从正态分布N(μ,100), 现在进 行了25次发射试验, 用S2记这25次试验中弹 着点偏离目标中心的距离的样本方差. 试求 S2超过50的概率.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率论与数理统计中的三种重要分布摘要:在概率论与数理统计课程中,我们研究了随机变量的分布,具体地研究了离散型随机变量的分布和连续型随机变量的分布,并简单的介绍了常见的离散型分布和连续型分布,其中二项分布、Poisson 分布、正态分布是概率论中三大重要的分布。
因此,在这篇文章中重点介绍二项分布、Poisson 分布和正态分布以及它们的性质、数学期望与方差,以此来进行一次比较完整的概率论分布的学习。
关键词:二项分布;Poisson 分布;正态分布;定义;性质一、二项分布二项分布是重要的离散型分布之一,它在理论上和应用上都占有很重要的地位,产生这种分布的重要现实源泉是所谓的伯努利试验。
(一)泊努利分布[Bernoulli distribution ] (两点分布、0-1分布)1.泊努利试验在许多实际问题中,我们感兴趣的是某事件A 是否发生。
例如在产品抽样检验中,关心的是抽到正品还是废品;掷硬币时,关心的是出现正面还是反面,等。
在这一类随机试验中,只有两个基本事件A 与A ,这种只有两种可能结果的随机试验称为伯努利试验。
为方便起见,在一次试验中,把出现A 称为“成功”,出现A 称为“失败” 通常记(),p A P = ()q p A P =-=1。
2.泊努利分布定义:在一次试验中,设p A P =)(,p q A P -==1)(,若以ξ记事件A 发生的次数,则⎪⎪⎭⎫⎝⎛ξp q 10~,称ξ服从参数为)10(<<p p 的Bernoulli 分布或两点分布,记为:),1(~p B ξ。
(二)二项分布[Binomial distribution]把一重Bernoulli 试验E 独立地重复地进行n 次得到n 重Bernoulli 试验。
定义:在n 重Bernoulli 试验中,设(),()1P A p P A q p ===-若以ξ记事件A 发生的次数,则ξ为一随机变量,且其可能取值为n ,,2,1,0 ,其对应的概率由二项分布给出:{}k n kk n p p C k P --==)1(ξ,n k ,,3,2,1,0 =,则称ξ服从参数为)10(,<<p p n 的二项分布,记为),(~p n B ξ。
若记}{),,(k P p n k b ==ξ,显然满足:(1) 非负性: ),,(p n k b ≥0(2) 规范性:1)]1([)1(),,(0=-+=-=∑∑=-=n nk k n k knn k p p p p Cp n k b二项分布描绘的是n 重Bernoulli 试验中成功出现的次数。
若记ξ为成功出现的次数,则ξ的可能取值为n k ,,3,2,1,0 =,其相应的概率为:{}k P =ξ=()p n k b p p C k n kk n ,,)1(=--事实上:若记,次试验中成功恰好出现重""k B n B k =""次试验出现成功第i A i =""次试验出现失败第i A i = n i ,,3,2,1 =,则:n k n k n n k k k A A A A A A A A A A B 1121121......+-+-+++=,其共有kn C 个项,且两两互不相容。
由试验的独立性可知:k n k n k k n k k p p A P A P A P A P A P A A A A A P -++-==)1()()()()()(}......{121121∴()k n k kn k p p C B P --=)1(.(三)二项分布的数学期望与方差设()p n B ,~ξ,{}k n k k n p p C k P --==)1(ξ ,n k 2,1,0= 由数学期望的定义: ()()()()k n k nk kn k nk nk p p k n k n np p p k n k n k k kP E --=-==-⋅---=-⋅⋅-⋅==ξ=ξ∑∑∑)1(!!1!1)1(!!!}{1100(令l k =-1) =()()np p p np p p np p p l n l n npn l n l n ol ln ln ln l C =-+=-=--------=----=∑∑111111)]1([)1()1(!1!!1即:np E =ξ由方差的定义:22)()(ξξξE E D -=()()k n k nk kn kk nnk q p k n k n kqp C k E -=-=--==∑∑!!1!)(122ξ (令l k =-1)=()()()ln l n l q p l n l n l np ---=---+∑110!1!!11=⎥⎦⎤⎢⎣⎡+∑∑-=-=------10101111n l n l l n l l n l n l l n q p C q p lC np =()[]1)(1-++-n q p p n np =()21p n n np -+()()npq p np np p n n np D =-=--+=∴1)(122ξ二、泊松分布[Poisson distribution ](一)定义:称ξ服从参数为()0>λ的Poisson 分布,若{}λλξ-==e k k p k!,...2,1,0=k记为:()λξ;~k p 或),(λπk ,()λλλ-=e k k p k!; ,...2,1,0=k显然:{}0>=k p ξ{}1!!0=====-∞=-∞=-∞=∑∑∑λλλλλλξe e k eek k p k kk kk【说明】历史上Poisson 分布是作为二项分布的近似于1837年由法国数学家泊松引入的,若把-B 试验中成功概率p 值很小的事件叫做稀有事件,则由上面TH 当n 充分大时,n 重-B 试验中稀有事件发生的次数近似服从Poisson 分布。
这时,参数λ的整数部分 []λ恰好是稀有事件发生的最可能次数,在实际中常用Poisson 分布来作为大量重复独立试验中稀有事件发生的概率分布情况的数学模型,诸如不幸事件,意外事故、故障,非常见病,自然灾害等,都是稀有事件。
许多随机现象都服从Poisson 分布。
一是社会生活对服务的要求:如电话交换机中来到的呼叫次数;公共车站来到的乘客数都近似服从Poisson 分布。
另一领域是物理学。
放射性分裂落到某区域的质电点;热电子的放射等都服从Poisson 分布。
(二)Poisson 分布的数学期望和方差设()λξ,~k p ,即{}λλξ-==e k k p k!,...2,1,0,=k()λλλλλξλλλλ==-===-∞=---∞=∞=∑∑∑e e k eek kkp E k k k kk k 11!1!()()()⎪⎪⎭⎫ ⎝⎛+=-=-==∑∑∑∑∞=-∞=---∞=-∞=011122!1!1!1)(l kk k k k k k l l e k k e e k kp k E λλλλλλξλλλ(令l k =-1)=⎥⎦⎤⎢⎣⎡+∑∑∞=∞=-00!!l l l l l l l e λλλλ=[]λλλλλe ee +-=()1+λλ所以:λλλλξξξ=-+=-=2222)()(E E D三、正态分布前面我们已经研究了概率论中三个重要分布中的两个:二项分布和Poisson 分布,这是两个离散型分布;下面研究第三个重要分布——正态分布,这是一个连续型分布,它不仅具有重要的理论意义,而且其应用相当广泛。
(一)定义若连续型随机变量ξ的概率密度函数为)(x f =σπ21()222σμ--x e(-)0,>∞<<∞σx 则称ξ服从参数为,μ2σ的正态分布。
简记为ξ~N (,μ2σ)。
[Normal distribution ]其相应的分布函数为:)(x F =σπ21()⎰∞---xy dy e222σμ特别地:当1,0==σμ时,称ξ服从标准正态分布。
记作)1,0(~N ξ, 其相应的密度函数和分布函数分别是:)(x ϕ=π2122x e-+∞<<∞-x )(x Φ=π21dy exy ⎰∞--22为说明上述定义的合理性,需验证)(x f 满足密度函数的性质:1.非负性:显然)(x f ≥0.2.规范性:dx x f ⎰+∞∞-)(=σπ21dx x ⎰∞+∞-⎥⎦⎤⎢⎣⎡σμ--222)(exp (令σμ-=2x t )=π1⎰+∞∞--dt e t 2=1 (概率积分:22π=⎰∞+-dx e x ) 即)(x f 确为密度函数。
(二)正态分布的特点与性质正态分布又叫Gauss 分布,它在概率论的理论和应用中占有很重要的地位,因此需要研究其性质及特点。
(1))(x f 的各阶导均存在;(2))(x f 关于x =μ对称 即)(x f -μ=)(x f +μ 且当x =μ时,)(x f 取最大值)(μf =σπ21;x 离μ越远,)(x f 值越小,这表明对于同样长度的区间,当区间离μ越远,则落在该区间上的概率越小,μ------位置参数, σ--------形状参数;(3))(x f 在x =μ±σ处有拐点,且以ox 轴为水平渐近线,即±∞→x lim )(x f =0。
(三)正态分布的概率计算(1)若)1,0(~N ξ,则0≥∀x ,)(}{x x P Φ=≤ξ,)(1)(}{x x x P Φ-=-Φ=-≤ξ。
从而P {}x ≤ξ=P {-x }x ≤≤ξ=P {}{)x P x -≤-≤ξξ=)()(x x -Φ-Φ=1)(2-Φx(2)若),(~2σμξN ,则σμξη-=~)1,0(N ,且)(x F =P {x ≤ξ}=)(σμ-Φx 。
proof :P {=≤}y ηP {σμξ-y ≤}=P {}μσξ+≤y =σπ21()dt ey t ⎰+∞---μσσμ222=π21dv ey⎰∞--22ν (令σμν-=t )即)1,0(~N η,于是F (x )=P {}x ≤ξ=P {σμξ-≤σμ-x }=)(σμ-Φx 从而对任意实数a <b ,有}{b a P ≤<ξ=⎪⎭⎫⎝⎛σμ-Φb ⎪⎭⎫⎝⎛σμ-Φ-a 。
从上述分析可知:我们对所有有关正态分布的概率计算问题,都是归结为对标准正态分布的概率计算。
(四)正态分布的应用一方面,在现实中,正态分布是有广泛应用的概率分布,许多随机现象可以用正态分布或近似的正态分布来刻画。
如在生产中,在生产条件不变的前提下,各种产品的某些量度(如建筑材料的抗压强度、细沙的强力、电灯泡的使用寿命、零件的尺寸等)一般都服从正态分布;在生物学中,同一种群的某种特征(像身高、体重等)一般也服从正态分布;在自然科学中,热力学中理想气体分子的速度分量,射击时命中位置目标沿某个坐标轴的偏差,测量同一物体的测量误差,考试成绩等都服从或近似服从正态分布;气象学中,每年某日的平均气温和降雨量,水文中的水位等也都服从或近似服从正态分布。