概率论与数理统计 常用的统计分布共61页文档
6.2数理统计中几种常用的分布.
性质3. 设T~t(n),则:T ~F(1,n) .
2
证明:
由t分布定义 T
2
X Y /n
其中X∼N(0,1),Y~χ (n),且X与Y相互独立. 2 2 (1) / 1 X /1 2 F T 2 Y /n ( n) / n
且 2 (1)与 2 ( n)相互独立.
由F分布定义, ∴ F = T2~F(1,n) .
2
条件: 的点χ
P ( n)
2 2
2
( n )
f ( x)dx
2
(n)为χ 2(n)分布的上分位点.
χ (n)分布 的上分位点 图形如右图.
χ2(n)分布的上分位点可以查 附表5.
2Hale Waihona Puke 13例1:求2 2 0 ( 10 ) , )。 .05 0.1 (20
1.) 因为
P X z0.05 1 P X z0.05 1 0.05 0.95.
P X 1.64 0.9495.
P X 1.65 0.9505.
z0.05 1.64 1.65 1.645. 2
4
2.)
P X z0.005 1 PX z0.005 1 0.005 0.995.
i 1 n i 1
n
EX i2 n.
2 DX i
D D(
2n.
10
4.应用中心极限定理可得,若 若 X ~ 2 (n) ,则当n充分大时, X n 2n 的分布近似正态分布N(0,1).
11
2 (n)
分布的密度函 数的图形如右 图.
数理统计分布类型
数理统计分布类型数理统计是数学和统计学的交叉学科,研究收集、整理、分析和解释数据的方法和原则。
其中,分布类型是数理统计的重要概念之一。
统计分布是指一组数据按照一定规律的分布情况,根据数据分布的形状和特点,可以将统计分布分为不同的类型。
常见的数理统计分布类型有正态分布、均匀分布、伯努利分布、二项分布、泊松分布、几何分布、指数分布、正态分布、t分布和F分布等。
以下将逐一介绍这些常见的分布类型。
1.正态分布:正态分布(或高斯分布)是数理统计中最常见的一种分布类型。
正态分布的密度函数呈钟形曲线,对称且具有峰值,其分布的均值、方差决定了曲线的位置和形状。
正态分布在自然界和社会现象中广泛存在,如身高、体重、考试成绩等。
2.均匀分布:均匀分布是指数据在给定区间内的分布是均匀的,即每个数据点出现的概率相等。
均匀分布的密度函数是一个常数,对应的分布函数是线性的。
均匀分布常用于模拟随机数产生、建立实验设计等领域。
3.伯努利分布:伯努利分布是一种离散型的分布,只有两个可能的取值(例如0和1),其中一个取值的概率为p,另一个取值的概率为1-p。
伯努利分布常用于描述二项式试验中的成功和失败的概率。
4.二项分布:二项分布是由多次独立的伯努利试验组成的概率分布,其中每个试验只有两个可能的结果(例如成功和失败)。
二项分布可以用于描述多次独立重复试验中成功次数的分布情况。
5.泊松分布:泊松分布是一种用于描述单位时间或空间内事件发生次数的概率分布。
泊松分布假设事件以恒定的平均速率独立地发生,其参数λ表示单位时间或空间内事件的平均发生次数。
6.几何分布:几何分布是一种描述第一次成功发生需要的独立试验次数的概率分布。
每次试验只有两个可能的结果(例如成功和失败),成功的概率为p,几何分布描述了第一次成功发生之前需要进行的试验次数的分布情况。
7.指数分布:指数分布是描述时间间隔或空间间隔的分布,它的特点是具有无记忆性。
指数分布可以用于描述等待时间、服务时间、设备故障时间等。
(完整word版)概率论与数理统计(完整公式,知识点梳理)(word文档良心出品)
则称随机变量 X 服从参数为 的泊松分布,记为 X ~ () 或
超几何分布 几何分布
者 P( )。
泊松分布为二项分布的极限分布(np=λ ,n→∞)。
P( X
k)
CMk
C nk N M
,
k
0,1,2, l
CNn
l min(M , n)
随机变量 X 服从参数为 n,N,M 的超几何分布,记为 H(n,N,M)。
在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有
如下性质:
①每进行一次试验,必须发生且只能发生这一组中的一个事件;
(5)基本 事件、样本 空间和事 件
②任何事件,都是由这一组中的部分事件组成的。
这样一组事件中的每一个事件称为基本事件,用 来表示。
基本事件的全体,称为试验的样本空间,用 表示。
概率论与数理统计完整版公式
第 1 章 随机事件及其概率
(1)排列 组合公式
Pmn
m! (m n)!
从 m 个人中挑出 n 个人进行排列的可能数。
Cmn
m! n!(m n)!
从 m 个人中挑出 n 个人进行组合的可能数。
加法原理(两种方法均能完成此事):m+n
(2)加法 和乘法原 理
某件事由两种方法来完成,第一种方法可由 m 种方法完成,第二种方法可由 n 种方法来完成,则这件事可由 m+n 种方法来完成。 乘法原理(两个步骤分别不能完成这件事):m×n 某件事由两个步骤来完成,第一个步骤可由 m 种方法完成,第二个步骤可由 n
(15)全概 公式
(16)贝叶 斯公式
若事件 A 、B 相互独立,则可得到 A 与 B 、 A 与 B 、 A 与 B 也都相互独
常用统计分布
X
2 i
,
其中X
1
,
X
2
,,
X
n
i 1
独立且每个X i
~
N
(0,1),因而X
2 1
,
X
2 2
,,
X n2独立同分布,
且
E
(
X
2 i
)
1,
D(
X
2 i
)
2
(i 1,2,, n)
由中心极限定理得
n
2 n
X
2 i
n
lim P{
x} lim P{ i1
x}
x
n
2n
n
n
1
e
t2 2
dt
2
即 2分布的极限分布是正态分布,也即,当n很大时
一、常见分布
1. 2分布(卡方分布)
定义5.6、设 X1, X 2,, X n 相互独立,同服从N (0, 1)
分布, 则称统计量
2=X
2 1
X
2 2
X
2 n
服从自由
度为 n 的 2分布, 记为 2 ~ 2 (n).
自由度:
指
2
X
2 1
X
2 2
X
2 n
中右端包含独立
变量的个数.
定理5.4 2(n)分布的概率密度为
附表4只详列到 n=45 为止.
在Matlab中求解
费歇(R.A.Fisher)证明:
费歇资料
当
n
充分大时,
2
(n)
n
2nu .
其中 u 是标准正态分布的上 分位数.
利用上公式,
可以求得 n 45 时, 上 分位点的近似值.
概率论与数理统计中的三种重要分布
概率论与数理统计中的三种重要分布摘要:在概率论与数理统计课程中,我们研究了随机变量的分布,具体地研究了离散型随机变量的分布和连续型随机变量的分布,并简单的介绍了常见的离散型分布和连续型分布,其中二项分布、Poisson 分布、正态分布是概率论中三大重要的分布。
因此,在这篇文章中重点介绍二项分布、Poisson 分布和正态分布以及它们的性质、数学期望与方差,以此来进行一次比较完整的概率论分布的学习。
关键词:二项分布;Poisson 分布;正态分布;定义;性质一、二项分布二项分布是重要的离散型分布之一,它在理论上和应用上都占有很重要的地位,产生这种分布的重要现实源泉是所谓的伯努利试验。
(一)泊努利分布[Bernoulli distribution ] (两点分布、0-1分布)1.泊努利试验在许多实际问题中,我们感兴趣的是某事件A 是否发生。
例如在产品抽样检验中,关心的是抽到正品还是废品;掷硬币时,关心的是出现正面还是反面,等。
在这一类随机试验中,只有两个基本事件A 与A ,这种只有两种可能结果的随机试验称为伯努利试验。
为方便起见,在一次试验中,把出现A 称为“成功”,出现A 称为“失败” 通常记(),p A P = ()q p A P =-=1。
2.泊努利分布定义:在一次试验中,设p A P =)(,p q A P -==1)(,若以ξ记事件A 发生的次数,则⎪⎪⎭⎫⎝⎛ξp q 10~,称ξ服从参数为)10(<<p p 的Bernoulli 分布或两点分布,记为:),1(~p B ξ。
(二)二项分布[Binomial distribution]把一重Bernoulli 试验E 独立地重复地进行n 次得到n 重Bernoulli 试验。
定义:在n 重Bernoulli 试验中,设(),()1P A p P A q p ===-若以ξ记事件A 发生的次数,则ξ为一随机变量,且其可能取值为n ,,2,1,0 ,其对应的概率由二项分布给出:{}k n kk n p p C k P --==)1(ξ,n k ,,3,2,1,0 =,则称ξ服从参数为)10(,<<p p n 的二项分布,记为),(~p n B ξ。
常用统计分布(ppt文档可编辑修改)
x2
e 2 dx
3
D(Xi2 ) 3 1 2, i 1, 2, , n.
故 E( 2 ) E n Xi2 n E( Xi2 ) n,
i1
i1
D( 2 ) D n Xi2 n D( Xi2 ) 2n.
t 分布具有下列性质:
性质5.6 设 T ~ t(n) , 则当n 2 时有
E(T ) 0 D(T ) n
n2
性质5.7 设 T ~ t(n) ,p(t) 是T的分布密度,
则
lim p(t)
1
t2
e2
n
2
此性质说明,当 n 时,T分布的极限
分布是标准正态分布。
例2
2
近似
~
N
(n,2n).
2n
例1
设X
1
,
X
2
,,
X
为
6
来
自
正
态
总
体N
(0,1)的
一
组
样
本,
求C1
,
C
使
2
得
Y C1( X1 X 2 )2 C2( X 3 X4 X5 X6 )2
服 从 2分 布.
解
X1
X2
~
N (0,2), 则
X1
X2 2
~
N (0,1)
同理
X3 X4
性质2 ( 2分布的数学期望和方差) 若 2 ~ 2(n), 则 E( 2 ) n, D( 2 ) 2n.
证明 因为 Xi ~ N (0, 1), 所以 E( Xi2 ) D( Xi ) 1,
概率论与数理统计:常用统计分布
0,
x 0, 其它.
F-分布的性质 由F分布定义可得:
F
~
F(n1, n2 )
1 F
~
F(n2, n1)
五、F-分布与t分布的关系
定理3 若X~t(n),则Y=X2~F(1,n)。
证明:X~t(n),X的分布密度p(x)= n 1 2 nπ n 2
1
x2 n
n 1 2
Y=X2的分布函数F(y) =P{Y<y}=P{X<y}。当y≤0时,FY(y)=0,
② X 与 S2相互独立。
二、χ2-分布(卡方分布)
定义 设X1,X2,…,Xn是来自标准正态总体 N(0,1)的样本,称统计量
2
X
2 1
X
2 2
X
2 n
服从自由度为n的 χ2-分布 ,记为 2 ~ 2( n ).
2 (n)-分布的概率密度为
f
(
y
)
2n /
1
2 (
n
/
2
)
y
n 1
2e
服从正态分布,且
i 1
i 1
一、正态分布
定理2 若( X1, X 2 ,, X n )是来自总体X ~ N(,2) 的一个
样本,X 为样本均值,则 (1) X ~ N (, 2 ) ,(由上述结论可知:X 的期望与 X 的期望相同,而 X
n
的方差却比 X 的方差小的多,即 X 的取值将更向 集中.)
p(y)=0;当y>0时,FY(y) =P{-
,
y
y
n
n 2 1 n
Y=X的分布密度p(y)= 2,•
1 n
2 2
<X<
最常用的统计学概率分布总结(含清晰图)
复习: 统计推断常用概率分布1.随机变量分布函数(1)累积分布函数(Cumulative Distribution Function (CDF))If X is any random variable, then its CDF is defined for any real number x byP X x(2)概率密度函数(Probability Density Function (PDF))The probability density function (PDF) f(x) of a continuous distribution is defined as the derivative of the (cumulative) distribution function F(x),ddso we havedt2. 正态分布(normal distribution ) (1)概率密度函数(PDF )|µ,σ1σ√2πeµ以上结果可表示为 ~ ,.标准正态分布(standard normal distribution )表示为N(0,1)x µ~N 0,1(2) 累积分布函数 (CDF)1σ√2πeµdt3. Chi-squared ( )分布如果Z1, Z2 ..., Z n是相互独立的随机变量,且都服从于N(0,1)分布,那么服从自由度(degree of freedom, df)为n的χ 分布,记为X~χ n . (1)PDF of χ(2)CDF of χ4. t-分布(student's t-distribution)设)n (~Y )1,0(N ~X 2χ和,且X 和Y 相互独立,则称随机变量n Y X T /=服从df. 为n 的t-分布,记为T ~ t(n)。
(1)PDF of t-distribution(2)CDF of t-distribution5. F-分布X和Y是相互独立的χ 分布随机变量,d.f分别为m和n,则称随机变量n/ Y m/XF=服从df.为 (m, n)的F-分布,且通常写为F~F(m,n)。
常用统计分布
X5
X6
~
N (0,4), 则
X3
X4
X5 4
X6
~
N (0,1)
且 X1 X 2 与 X3 X 4 X5 X6 相互独立
2
4
所以( X1 X 2 )2 ( X 3 X 4 X 5 X 6 )2 ~ 2 (2)
2
4
则C1 1 2 ,C2 1 4 .
F0.05 (30,14) 2.31 . 附表5-2
F分布的上分位点具有如下性质 :
证明
F1
( n1 ,
n2 )
F
1 (n2 ,
. n1 )
因为F ~ F (n1, n2 ),
所以 1 P{F F1 (n1 , n2 )}
P
1 F
F1
1 ( n1 ,
则1 F
~
F (n2 , n1 ).
(2)
E(F ) n2 , n2 2
(n2 2),
演示
D(F
)
2n22(n1 n2 2) n1(n2 2)2(n2 4)
,
(n2 4)
(3) 设F ~ F (n1, n2 ),则 当n2 4时, 对 任 意x有
F E(F )
设 X 服从标准正态分布N (0,1), N (0,1) 的上
分位点 u 满足 P{ X u }
1
x2
e 2 dx
2π u
1 P{ X u } 1 (u )
即
(u ) 1 给定 ,由附表2可查得u的值.
u0.05 1.645,
概率论与数理统计几种重要的分布
二、二项分布
例1、一批产品的合格率为0.9,重复抽取三次, 每次一件, 连续3次,求3次中取到的合格品件数 X的分布.
如果在一次试验中,事件A成功的概率为 p(0 p 1), 则在n重贝努里试验中事件 A成功的次数 X的分布为 :
P(X
k)
C
k n
pkqnk .
1、定义 X ~ B(n, p)
P(X
k)
C
k 3
C 4 17
k
C
4 20
(k 0,1,2,3)
1、定义 X ~ H (n, M , N )
设N个元素分为两类,
其中N
1个属于第一类,
N
个属于
2
第二类, 从中不放回抽取n个, 令X表示这n个中第一类
元素的个数,则称X的分布为超几何分布 :
P(X
m)
C C m nm N1 N N1
若X的分布为P( X
k)
C
k n
pkqnk , k
0,1,, n
其中0 p 1, q 1 p,则称X ~ B(n, p)。
2、数字特征
EX
n
kC
k n
k 0
pkqnk
n
k
k0
n! k!(n k)!
pk q nk
n
n (n 1)!
p p q k 1 (n1)(k 1)
k1 (k 1)! (n 1) (k 1) !
kkekxpk01只有两个互逆结果的n次独立重复试验n1pmin10nmllkccckxpnnknnmkm10211kppkxpk无穷次伯努利试验中a首次发生的试验次数对含有两类元素的有限总体进行不放回抽样时某类元素个数的概率分布在一定时间内出现在给定区域的随机质点的个数一均匀分布1定义
概率论与数理统计常用的统计分布
概率论与数理统计
2 X ~ N ( , ) , X1 , X 2 ,... X n 是 定理 2 设总体
取自 X 的一个样本, X 与 S 为该样本的样 本均值与样本方差,则有
2 2 S 2 2 ( X i X )2 ~ 2 (n 1) (1) i 1
概率论与数理统计
设总体 X 的均值和方差 2 E( X ) , D( X ) 都存在. X1 , X 2 , , Xn 是来自总体 X 的样本,则 2 E ( X ) , D( X ) n , E ( S 2 ) 2
n n 1 1 E( X ) E( n X i ) n E( X i ) i 1 n i 1 n
n
X (2) T S / n ~ t (n 1)
概率论与数理统计
设 X1 , X 2 , , Xn 是总体 X ~ N ( , 2 ) 的样本, X , S 2分别为样本均值和样本方差,则有 X ~ t (n 1) S/ n 由定理一、定理二有 2 ( n 1) S X 2 Y ~ N ( 0 , 1) , 2 ~ (n 1) 2 / n 2 且 Y 与 独立,由 t 分布的定义有 X X / n Y ~ t (n 1) S/ n (n 1) S 2 / 2 S 2/n n 1
3 0.1 P3 |X | 99.7%. P | X | X | 0.03} 99.7%. P{| n 100
概率论与数理统计
例3 在设计导弹发射装置时, 重要事情之 一是研究弹着点偏离目标中心的距离的方 差.对于一类导弹发射装置, 弹着点偏离目标 中心的距离服从正态分布N(μ,100), 现在进 行了25次发射试验, 用S2记这25次试验中弹 着点偏离目标中心的距离的样本方差. 试求 S2超过50的概率.
6.2数理统计中几种常用的分布
1.标准正态分布
2. 2分布
3. t分布 4. F分布
1. 标准正态分布
定义:设X~N(0,1),对任给的 , 0<<1,称满
足条件
P{X z } z ( x)dx
的点z为标准正态分布的上分位点 (x)
o z x
例1 求z0.05
F F1 (m, n)
P{
1 F
1 }
F1 (m, n)
1 F1 (m, n)
F (n, m)
(3) 若 X ~ t (n), 则 X 2 ~ F(1, n);
例5 设 F ~ F(24, 15) , 求 F1, F2, F3, 使其分别满足
P(F > F1 )= 0. 025 , P(F < F2 )= 0. 025 , P(F > F3 )= 0. 95 .
解 (1) 由 m =24, n=15, = 0. 025 , 查 P342 附表7 知
F1 = F0.025 (24 , 15)= 2.70 ;
(2) 无法直接查表获得,
但
P
(F
F2
)
P(
1 F
由 F 分布性质知 1/F ~ F(15, 24), 查附表7 知
1 F2
)
0.
025
,
1 F2
F0.025(15,
2(m
, 2),
n)
则
40
~ E若XYi4 221分布,x4则e当x22 dxn 充= 3分大时,
Y n 近似服从 N(0,1). 2n
应用中心极限定理可得
6
2分布的上分位点:
概率论及数理统计概率分布-资料
下X 限 1 .9 S 6 为 7 .8 2 1 .9 : 3 6 .8 6 .3 ( 5 g / 5 L )
上X 限 1 .9 S 6 为 7 .8 2 1 .9 : 3 6 .8 8 .2 ( 0 g / 5 L )
2019/11/13
38
例:某地调查120名健康成年男性的第一秒肺通气
2019/11/13
25
解:本例由于是大样本,可用样本均数和样本
标准差作为总体、的估计值,即将该地正常
成年女子的血清总蛋白数近似看作服从 N(72.8,3.82)的正态分布。作如下标准化变换:
Z166.03.872.81.79
75.072.8 Z2 3.8 0.58
2019/11/13
48- 56- 64- 72- 80体重(kg)
图1 体重频率密度图
若将各直条顶端的中点顺次连接起来,得 到一条折线。当样本量n越来越大时,组段越 分越细,此时直方渐进直条,这条折线就越来 越接近于一条光滑的曲线(见图1、2),我们 把这条呈中间高,两边低,左右基本对称的 “钟型”曲线称为正态分布曲线,近似于数学 上的正态分布(高斯分布; Gauss)。
参考值范围(reference range)是指所谓“正 常人”的解剖、生理、生化等指标的波动范围。 制定参考值范围时,首先要确定一批样本含量足 够大的“正常人”。所谓“正常人”不是指“健 康人”,而是指排除了影响所研究指标的疾病和 有关因素的同质人群。其次需根据指标的实际用 途确定单侧或双侧界值,根据研究目的和使用要 求选定适当的百分界值,常用95%。
图3 正态分布的概率密度函数
2019/11/13
12
于是,利用概率密度函数 F (x) 可以计算正态 分布变量取值在任意区间(a,b)的概率为
概率与数理统计常见分布
离散型1. 二项分布 Binomial distribution :binom二项分布指的是 N 重伯努利实验,记为 X ~ b(n,p) ,E(x)=np,Var(x)=np(1-p)pbinom(q,size,prob) , q 是特定取值, 比如 pbinom(8,20,0.2) 指第 8 次伯努利 实验的累计概率。
size 指总的实验次数, prob 指每次实验成功发生的概率dbinom(x,size,prob), x 同上面的 q 同含义。
dfunction() 对于离散分布来说结 果是特定值的概率,对连续变量来说是密度( Density )rbinom(n, size, prob) ,产生 n 个 b(size,prob) 的二项分布随机数qbinom(p, size, prob),quantile function 分位数函数。
分位数:若概率0<p<1,随机变量X 或它的概率分布的分位数Za 。
是指满足条件 p(X>Za)= a 的实数。
女口 t 分布的分位数表,自由度f=20和a =0.05时的分位数 为1.7247。
--这个定义指的是上侧a 分位数a 分位数:实数 a 满足 0 < a <1 时, a 分位数是使 P{X< x a }=F(x a )=a 的数 x a双侧a 分位数是使P{X<入1}=F(入1)=0.5 a 的数入1、使P{X> 入 2}=1-F(入 2)=0.5 a 的数 入 2。
qbinom 是上侧分位数,如 qbinom(0.95,100,0.2)=27, 指 27 之后P(x>=27)>=0.95 。
即对于 b(100,0.2) 为了达到 0.95 的概率至少需要 27 次重复 实验。
2. 负二项分布 negative binomial distribution 掷骰子,掷到一即视为成功。
则每次掷骰的成功率是 1/6 。
概率统计分布表(常用)
标准正态表标准文案标准文案标准文案标准文案标准文案标准文案标准文案T分布标准文案标准文案标准文案标准文案标准文案标准文案标准文案F分布P= 0.90标准文案标准文案P= 0.99标准文案标准文案标准文案标准文案标准文案标准文案标准文案Excel公式1.正态分布函数Excel计算正态分布时,使用NORMDIST函数,其格式如下:NORMDIST(a,μ,σ,累积)其中,“累积”:若为TRUE,则输出分布函数值,即P{X≤a};若为FALSE,则为概率密度函数值.示例:已知X服从正态分布,μ=600,σ=100,求P{X≤500}.输入公式NORMDIST(500, 600, 100, TRUE)得到的结果为0.158655,即P{X≤500}=0.158655.2、正态分布函数的反函数标准文案Excel计算正态分布函数的反函数使用NORMINV函数,格式如下:NORMINV(p,μ ,σ ),此公式计算a,使P{X ≤a}=p 3标准正态分布反函数=NORMSINV(0.975)3、t分布Excel计算t分布的值,采用TDIST函数,格式如下:TDIST(a,自由度,侧数)其中,“侧数”:指明分布为单侧或双侧:若为1,为单侧;此命令输出P{ T >a }若为2,为双侧.此命令输出P{ |T| >a}示例:设T服从自由度为24的t分布,求P(T>1.711).已知t=1.711,df=24,采用单侧,则T分布的值:TDIST(1.711,24,1)得到0.05,即P(T > 1.711)=0.05.4. t分布的反函数标准文案Excel使用TINV函数得到t分布的反函数,格式如下:TINV(α,自由度)输出T 分布的α / 2 分位点:t_α/2_(n)若求临界值tα(n),则使用公式=TINV(2*α, n)函数FDIST 的计算公式为FDIST=P( F>x ),5.F分布的反函数FINV(probability,deg_freedom1,deg_freedom2) 已知probability=P( F>x ),求x标准文案。