统计学 三大分布-经典案例全集讲解学习
合集下载
几种重要的分布课件
几种重要的分布课件
contents
目录
• 正态分布 • 泊松分布 • 二项分布 • 指数分布 • 均匀分布
01
正态分布
定义与特性
定义
正态分布是一种连续概率分布,其概 率密度函数呈钟形,即“钟形曲线” 。
特性
正态分布具有对称性、单峰性和有限 性。它的期望值和方差决定了分布的 形状,而期望值和方差相等的特性被 称为“高斯”或“正态”分布。
计算步骤
首先确定泊松分布的参数λ,然后 使用上述公式计算随机事件发生 的概率。
应用场景
泊松分布在统计学、概率论、保险学、金融等领域有广泛应 用。例如,在保险行业中,泊松分布常用于计算一定时间段 内发生特定事件的概率,如车辆事故次数、保险索赔次数等 。
在生物学和医学领域,泊松分布也常用于描述某些离散事件 的发生概率,如遗传学中的基因突变次数、医学诊断中的失 误次数等。
应用场景
寿命分析
金融领域
在寿命分析中,指数分布常用于描述 电子元件、机器零件等寿命的分布。
在金融领域,指数分布也常用于描述 资产收益率、股票价格等随机变量的 概率分布。
等待时间
在排队论中,指数分布用于描述顾客 等待时间、电话呼叫等待时间等随机 变量的概率分布。
05
均匀分布
定义与特性
定义
均匀分布是一种概率分布,表示随机变 量在一定区间内取值的可能性是相等的 。
特性
指数分布具有无记忆性、无后效性等 特性,常用于描述寿命、等待时间等 随机变量的概率分布。
计算方法
概率密度函数
$f(x) = lambda e^{-lambda x}$,其中 $lambda$是分布的参数。
期望值
$E(X) = frac{1}{lambda}$。
contents
目录
• 正态分布 • 泊松分布 • 二项分布 • 指数分布 • 均匀分布
01
正态分布
定义与特性
定义
正态分布是一种连续概率分布,其概 率密度函数呈钟形,即“钟形曲线” 。
特性
正态分布具有对称性、单峰性和有限 性。它的期望值和方差决定了分布的 形状,而期望值和方差相等的特性被 称为“高斯”或“正态”分布。
计算步骤
首先确定泊松分布的参数λ,然后 使用上述公式计算随机事件发生 的概率。
应用场景
泊松分布在统计学、概率论、保险学、金融等领域有广泛应 用。例如,在保险行业中,泊松分布常用于计算一定时间段 内发生特定事件的概率,如车辆事故次数、保险索赔次数等 。
在生物学和医学领域,泊松分布也常用于描述某些离散事件 的发生概率,如遗传学中的基因突变次数、医学诊断中的失 误次数等。
应用场景
寿命分析
金融领域
在寿命分析中,指数分布常用于描述 电子元件、机器零件等寿命的分布。
在金融领域,指数分布也常用于描述 资产收益率、股票价格等随机变量的 概率分布。
等待时间
在排队论中,指数分布用于描述顾客 等待时间、电话呼叫等待时间等随机 变量的概率分布。
05
均匀分布
定义与特性
定义
均匀分布是一种概率分布,表示随机变 量在一定区间内取值的可能性是相等的 。
特性
指数分布具有无记忆性、无后效性等 特性,常用于描述寿命、等待时间等 随机变量的概率分布。
计算方法
概率密度函数
$f(x) = lambda e^{-lambda x}$,其中 $lambda$是分布的参数。
期望值
$E(X) = frac{1}{lambda}$。
三大抽样分布课件
在方差分析中,t分布用于检验 各个组之间的均值是否存在显著
差异。
04
CATALOGUE
卡方分布
卡方分布的定义
定义
卡方分布是一种连续概率分布,描述 了随机变量的取值与自由度的平方之 间的比例关系。
公式
若随机变量X符合卡方分布,则X的概 率密度函数为f(x)=x^(n/2-1)e^(x/2)/2^(n/2)Γ(n/2),其中n为自由度 ,Γ为伽玛函数。
正态分布
正态分布的定义
01
正态分布是一种连续概率分布, 其概率密度函数呈钟形,对称轴 为均值所在直线,形状由标准差 决定。
02
正态分布是自然界中最常见的分 布形态,许多随机变量都服从或 近似服从正态分布。
正态分布的性质
01
02
03
集中性
正态分布曲线以均值为中 心,两侧分布对称。
均匀性
正态分布曲线是关于标准 差对称的,形状由标准差 决定。
t分布
t分布的定义
定义
t分布(也称为学生t分布)是一种 连续概率分布,其形状由自由度 参数决定。
描述
当数据来自正态分布的总体,且样 本量较小(通常n<30)时,t分布 近似于正态分布。
公式
t分布的密度函数和分布函数可以用 一系列复杂的数学公式来描述。
t分布的性质
形状
峰度
随着自由度的增加,t分布的形状逐渐 接近正态分布。
t分布的峰度大于正态分布的峰度,且 随着自由度的增加而减小。
偏度
t分布通常是偏态的,其偏度随着自由 度的增加而减小。
t分布在统计学中的应用
假设检验
在样本量较小时,t分布在假设 检验中常用作正态分布的替代,
用于检验统计假设。
差异。
04
CATALOGUE
卡方分布
卡方分布的定义
定义
卡方分布是一种连续概率分布,描述 了随机变量的取值与自由度的平方之 间的比例关系。
公式
若随机变量X符合卡方分布,则X的概 率密度函数为f(x)=x^(n/2-1)e^(x/2)/2^(n/2)Γ(n/2),其中n为自由度 ,Γ为伽玛函数。
正态分布
正态分布的定义
01
正态分布是一种连续概率分布, 其概率密度函数呈钟形,对称轴 为均值所在直线,形状由标准差 决定。
02
正态分布是自然界中最常见的分 布形态,许多随机变量都服从或 近似服从正态分布。
正态分布的性质
01
02
03
集中性
正态分布曲线以均值为中 心,两侧分布对称。
均匀性
正态分布曲线是关于标准 差对称的,形状由标准差 决定。
t分布
t分布的定义
定义
t分布(也称为学生t分布)是一种 连续概率分布,其形状由自由度 参数决定。
描述
当数据来自正态分布的总体,且样 本量较小(通常n<30)时,t分布 近似于正态分布。
公式
t分布的密度函数和分布函数可以用 一系列复杂的数学公式来描述。
t分布的性质
形状
峰度
随着自由度的增加,t分布的形状逐渐 接近正态分布。
t分布的峰度大于正态分布的峰度,且 随着自由度的增加而减小。
偏度
t分布通常是偏态的,其偏度随着自由 度的增加而减小。
t分布在统计学中的应用
假设检验
在样本量较小时,t分布在假设 检验中常用作正态分布的替代,
用于检验统计假设。
《几种常见的分布》课件
几种常见的分布
在统计学中,有几种常见的分布模型,包括均匀分布、正态分布、伯努利分 布、泊松分布和指数分布。本课件将详细介绍这些分布的定义、概率密度函 数、特点和示例。
均匀分布
定义
所有取值可能都有相同的概率。
特点
平均数和中位数相等。
概率密度函数
在取值范围内的每个值都有相等的概率。
示例
投掷均匀骰子,每个面的点数是等概率的。
2
布。
表示事件发生等待时间的概率分布。
3
特点
等待时间越长,概率越小。
参数含义
4
参数表示平均等待时间的倒数。5示例连续时间的电话呼叫间隔时间。结语
1 小结
不同的分布模型适用于不同的情况和问题。
2 相关资源
进一步学习更多关于概率分布的知识。
3 Q&A
回答观众的问题,进一步讨论。
正态分布
定义
连续型分布模型,以钟形曲线表示。
标准正态分布
均值为0,标准差为1的正态分布。
Z 分数
用于表示正态分布中的相对位置。
示例
人类身高和智力分布近似于正态分布。
伯努利分布
1
定义
二元分布,仅有两个可能结果。
概率密度函数
2
取值为0或1,表示事件发生成功或失败
的概率。
3
参数含义
概率函数中的参数表示事件成功的概率。
示例
4
抛硬币的结果为正或反。
泊松分布
定义
用于描述单位时间(或单位空间)上某个事件 发生次数的概率模型。
参数含义
参数表示在单位时间(或单位空间)内发生事 件的平均次数。
概率密度函数
描述事件发生次数的概率分布。
在统计学中,有几种常见的分布模型,包括均匀分布、正态分布、伯努利分 布、泊松分布和指数分布。本课件将详细介绍这些分布的定义、概率密度函 数、特点和示例。
均匀分布
定义
所有取值可能都有相同的概率。
特点
平均数和中位数相等。
概率密度函数
在取值范围内的每个值都有相等的概率。
示例
投掷均匀骰子,每个面的点数是等概率的。
2
布。
表示事件发生等待时间的概率分布。
3
特点
等待时间越长,概率越小。
参数含义
4
参数表示平均等待时间的倒数。5示例连续时间的电话呼叫间隔时间。结语
1 小结
不同的分布模型适用于不同的情况和问题。
2 相关资源
进一步学习更多关于概率分布的知识。
3 Q&A
回答观众的问题,进一步讨论。
正态分布
定义
连续型分布模型,以钟形曲线表示。
标准正态分布
均值为0,标准差为1的正态分布。
Z 分数
用于表示正态分布中的相对位置。
示例
人类身高和智力分布近似于正态分布。
伯努利分布
1
定义
二元分布,仅有两个可能结果。
概率密度函数
2
取值为0或1,表示事件发生成功或失败
的概率。
3
参数含义
概率函数中的参数表示事件成功的概率。
示例
4
抛硬币的结果为正或反。
泊松分布
定义
用于描述单位时间(或单位空间)上某个事件 发生次数的概率模型。
参数含义
参数表示在单位时间(或单位空间)内发生事 件的平均次数。
概率密度函数
描述事件发生次数的概率分布。
3个重要分布和抽样定理
7
0.989
1.690 9.803 12.017 14.067 16.013 16.622 18.475 20.278 22.601 24.322
8
1.344
2.180 11.030 13.362 15.507 17.535 18.168 20.090 21.955 24.352 26.124
9
1.735
则称随机变量
t
X
Y /n
服 从 自 由 度 为n 的 t 分 布,
记为 t ~ t(n).
自由度为n的t分布概率密度
f (x)
n 2
n
1
n
1
x2 n
n1 2
2
x
其中 ( ) x 1e x dx 0
是Gamma函数
不同自由度下的t分布密度曲线
0
t 分布密度曲线特点
服从自由度为n 的²分布,记
2 ~ 2 (n)
独立的随机变量的个数n: 自由度
.
²n分布的概率密度
f (x) 2n
1 2 (n
n 1
x -
x2 e 2,
2)
x
0,
0,
x 0.
其中 ( ) x 1e x dx 0
是Gamma函数
²n分布密度曲线
不同自由度下的2 n分布
f(x)
设X服从N(0, 1) 设f(x)是N (0, 1)的密度函数
则
E
X4
x4
f
x
dx
x3
xf
xdx
x 3d
f x
x 3
f x
f
x
d
x3
3
x
(完整版)三大分布及其分位数
研究生概率统计讲义
§1.5 常用的分布及其分位数
卡平方分布、t分布及F分布都是由正态分布所 导出的分布,它们与正态分布一起,是试验统计 中常用的分布。
1. 卡方分布
当X1、X2、…、Xn相互独立且都服从N(0,1)时,Z XFra bibliotek2 i
的分布称为自由度等于n的x2(n)分布, 记作 Z~ x2(n)(n).它的分布密度
3. F分布
若X与Y相互独立,且X~x2 (n),Y~x2 (m),则
ZX Y nm
的分布称为第一自由度等于n、第二自由度等于m的 F分布,记作Z~F (n, m),它的分布密度
2020/8/9
4
研究生概率统计讲义
p(
z
)
n
n
2m
m 2
n 2
nm 2
m 2
•
n 1
z2
nm
(mnz) 2
10
研究生概率统计讲义 5)F分布的α分位数记作Fα(n , m) Fα(n , m)>0,当X~F (n , m)时,P{X<Fα(n , m)}=α
2020/8/9
11
2020/8/9
7
研究生概率统计讲义
2020/8/9
8
研究生概率统计讲义 3)卡平方分布的α分位数记作x2α(n)。
P{X< x2α(n)}=α
2020/8/9
9
研究生概率统计讲义 4)t 分布的α分位数记作tα(n)
当X~t (n)时,P{X<t α(n)}=α,且与标准正态分布 相类似。
2020/8/9
2020/8/9
6
研究生概率统计讲义
因为1-F(λ)=α,F(λ)=1-α,所以上侧α分位数λ就 是1-α分位数 x 1-α;
§1.5 常用的分布及其分位数
卡平方分布、t分布及F分布都是由正态分布所 导出的分布,它们与正态分布一起,是试验统计 中常用的分布。
1. 卡方分布
当X1、X2、…、Xn相互独立且都服从N(0,1)时,Z XFra bibliotek2 i
的分布称为自由度等于n的x2(n)分布, 记作 Z~ x2(n)(n).它的分布密度
3. F分布
若X与Y相互独立,且X~x2 (n),Y~x2 (m),则
ZX Y nm
的分布称为第一自由度等于n、第二自由度等于m的 F分布,记作Z~F (n, m),它的分布密度
2020/8/9
4
研究生概率统计讲义
p(
z
)
n
n
2m
m 2
n 2
nm 2
m 2
•
n 1
z2
nm
(mnz) 2
10
研究生概率统计讲义 5)F分布的α分位数记作Fα(n , m) Fα(n , m)>0,当X~F (n , m)时,P{X<Fα(n , m)}=α
2020/8/9
11
2020/8/9
7
研究生概率统计讲义
2020/8/9
8
研究生概率统计讲义 3)卡平方分布的α分位数记作x2α(n)。
P{X< x2α(n)}=α
2020/8/9
9
研究生概率统计讲义 4)t 分布的α分位数记作tα(n)
当X~t (n)时,P{X<t α(n)}=α,且与标准正态分布 相类似。
2020/8/9
2020/8/9
6
研究生概率统计讲义
因为1-F(λ)=α,F(λ)=1-α,所以上侧α分位数λ就 是1-α分位数 x 1-α;
统计学 三大分布-经典案例全集
结论:当n<<N(n<=0.05N)超几何分布→二项分布
0.6
0.5
0.4
0.3
0.2
0.1
0
1
2
3
4
0.5
0.45
0.4
0.35
0.3
超几何分布 0.25 二项分布 0.2
0.15
0.1
0.05
0
1
2
3
4
超几何分布 二项分布
10=3次+7正,任取3件, 有放回 无放回
100=30次+70正,任取3件, 有放回 无放回
例220 某商店根据过去的销售记录知道某种商品每月的 销售量可以用参数为10的泊松分布来描述 为了以95%以 上的概率保证不脱销 问商店在月底应存多少件该种商品(设 只在月底进货)?大卖场的顾客数n很大,买商品概率P很少/多
解 设该商店每月销售该 商品的件数为X 月底存货为a 则当Xa时就不会脱销 据题 意 要求a使得
泊松分布
0.06
二项正态
0.04
二项泊松分离
0.02
二项正态重合
0
1 4 7 10 13 16 19 22 25 28 31
二项分布→泊松分布/正态分布 n=100,p=0.2,np=20
0.12
0.1
N=2000产品
次品NA=400
0.08 二项分布
0.06
泊松分布
二项正态 0.04
二项泊松分离
理论基础
数据:N=总体个数,N1=总体中A的个数, n=样本个数,k=样本中A的个数;
逼近关系:
N件产品,其中N1件次品 n<=0.05NN件产品,次品率N1/N
统计三大分布
根据独立随机变量商的密度公式(3-32),
可以证明(过程从略):(6-13)中的
Tn
概率密度函数为
根据独立随机变量商的密度公式(3-32),可
以证明(过程从略):(6-13)中 Tn 的概率
密度函数为
, x . fn(x)
Γ(
n1 2
)
n
Γ(
n 2
)
1
x2 n
n1 2
(6-14)
另外,t -分布具有以下性质:
变量不小于该数的概率为 . 比如,若记 2-
变量
2 n
的
-上侧分位数为,则满足(见图
6.2).
fn (x)
2 (n)
x
图 6.2
对不太大的n,如
n
60,可用附表3查
2
(n)
的
值,而对较大的n,则可用(6-11)近似计
算
2 (n) n 2n U , (6-12)
其中U 是标准正态分布N(0,1)的 -上侧分位
数,可通过附表2查出.
二、t -分布
定则 自义称由6.2度T为设n nX的Y~XtN/ -n(0分,1)布,Y,(6~记-123作()n)所,Tn 服X~ t与从(n)Y的.独t分-立分布,布是
也称为学生分布,是英国统计学家戈塞特 (Goset,1876-1937)在1908年“Student”
的笔名首次发表的,这个分布在数理统计 中也占有重要的地位.
,则
顺便指出,自由度为1的t -分布也称为柯西
(Cauchy)分布,它以其数学期望和方差
均不存在而闻名(见例4.3).
记t -分布t(n) 的 -上侧分位数为t (n),附表4
给出了不同n和 所对应的t (n) 数值. 另外,
概率统计6.3三大分布
X Y
,
n
服从自由度为 n 的 t分布,记为 t ~ t(n).
(2)t 分布性质:①ht 的图形关于 t 0对称;
②由 t分布的下分位点的定义及ht图形的对称性知t n t1 n
3、(1)F 分布定义
设U ~ (2 n1),V ~ (2 n2) ,且U,V
独立,则称随机变量 F U / n1 V / n2
何值时,2 a X1 X2 2 b X3 2 服从自由度为多少的 2 分布?
2、设随机变量t ~ t(n) ,其概率密度为 ft(n)(x)
,若 ,则 P t t0.9(n) 0.2
t0.1 (n)
ft(n) (x)dx
有为多少?
3、设总体X ~ N(0, 2), X1, X2,.
0,
其他.
(y)的图形如下图所示:
对于给定的
,0
1, 称满足条件 PF
F (n1, n2 )
F (n ,n ) 1 2 x dx
F n1,n2 为 F n1,n2 分布的下α 分位点.
F 分布性质:
①F
(n1, n2 )
②当 n 充分大时其图形类似于标准正态变量概率密度的图形.但对
于较小 n,t 的分布与N 0,1分布相差很大.
③由 t分布的上 分位点的定义及ht 图形的对称性知 t1 n t n.
例2 设总体 X和 Y 相互独立且都服从N 0,32 分布,而样本 X1,..., X9 和 Y1,..., Y9分别
t2 U2
U2 1
~ F (1, n)
Vn Vn
VV
nn
4.三大统计分布
> X a2 (n) )
的概率为α 的概率为
• 不同自由度的卡方分布 的概率密度曲线图形如 图所示. 图所示.
不同容量样本的抽样分布
n=1 n=4 n=10 n=20
χ2
• 查卡方表
•
设随机变量x, 相互独立 相互独立, 设随机变量 ,y相互独立, X~N(0,1), , , 记 Y~
则随机变量T服从自由度为 的 分布 分布. 则随机变量 服从自由度为n的t分布. 服从自由度为
据此可以讨论有关两个样本方差、 据此可以讨论有关两个样本方差、总体方 两个样本方差 差关系的问题。 差关系的问题。
• 定理:
据此可以讨论有关两个样本方差、 据此可以讨论有关两个样本方差、总体方 两个样本方差 差关系的问题。 差关系的问题。
据此可以讨论有关两个样本均值、总体均 据此可以讨论有关两个样本均值、 两个样本均值 值关系的问题。 值关系的问题。
课堂练习: 课堂练习: • 设X~N(µ,4)问至少应抽取多大容量的样本, 问至少应抽取多大容量的样本, 问至少应抽取多大容量的样本 才能使样本均值与总体数学期望的误差小于 才能使样本均值与总体数学期望的误差小于 样本均值 0.4的概率为 %? 的概率为95% 的概率为
课堂练习: 课堂练习: • 设X~N(µ,4)问至少应抽取多大容量的样本, 问至少应抽取多大容量的样本, 问至少应抽取多大容量的样本 才能使样本均值与总体数学期望的误差小于 才能使样本均值与总体数学期望的误差小于 样本均值 0.4的概率为 %? 的概率为95% 的概率为
变换为: 变换为:
− 0 .4 X − µ 0 .4 P{ < < } = 95 %
σ
n
σ
n
σ
§5.4常用的三大统计量分布ppt
2
DX2 EX4 (EX2 )2 3 12 2
D
2
=D
n
X2
n
DX2 2n
2.
12 ,
2 2
独立,
i=1 i=1
且 12 : 2 (n),
2 2
:
2 (m)
则 12 22 : 2 (n m) 证明:12 的特征函数 1(t) (1
22 的特征函数 2 (t
it
)
n 2
7、独立的卡方随机变量具有可加性。
8、 Tn : t(n) L N(0,1)
9、
2 n
:
2(n)
2 n
n
2n
L N(0,1)
五、推出一些重要结果
设(X1
,
X2
,
.......Xm
)来自总体N(
1,
2 1
),(Y1,
Y2
,
......Yn
)来自N(
2
,
2 2
)。
Xi 1 : N(0,1) 1
1
2 1
1 n
2 2 j1
(Yi Y)2 :
2 (n-1)
设
S12
1 m
m i1
(Xi
X)2
S22
1 n
n
(Yi
i1
Y)2
1 m
2 1 i1
(Xi X)2 : 2 (m-1)
mS12
12
:
2 (m-1)
作比值等于F
1 n
2 2 j1
(Yi Y)2 : 2 (n-1)
nS22
2 2
) (1
it
)m
2
12
数理统计的三大分布
(1,10) (,10)
(10,10) (5,10)
O
x
F分布概率密度函数
F 分布的性质:
性质1 若X ~ F(m, n),则1 / X ~ F(n, m); 性质2 若X ~ t(n),则 X 2 ~ F(1,n);
性质3 E(F) n (n 2), n 2
D(F) 2n2 (m n 2) , m(n 2)2 (n 4)
(2) 当n充分大(n 40即可),有
2 (n)
1 2
(u
2n 1)2 .
(3)
1 F (m,n) F1 (n, m) .
学习了三大分布后,我们就可以去研究常用统计 量的分布。下一讲,我们将学习在正态分布的条件下, 常用统计量的分布——抽样分布.
则随机变量
t X Y /n
所服从的分布称为自由度为n的t分布,记为t(n).
其密度函数为
ft ( x;n)
[(n 1) 2] (1
(n 2) n
x2 n
n1
)2
,
x .
ft (x)
n , N(0,1) n 6
n 2
O
x
t分布的密度函数: 低峰、厚尾
t分布的性质:
性质1 密度函数f ( x, n)是偶函数,且
lim f ( x, n)
1
x2
e 2 (x).
n
2
即t分布的极限分布是标准正态分布.
性质2 设T t(n),则
当n 1时, E(T )不存在,t(1)是标准柯西分布, 当n 2时, E(T ) 0, 当n 3时, D(T ) n .
n 2
三 F分布
设随机变量X ~ 2 (m),Y ~ 2 (n),且X与Y独立,
概率论与数理统计几种重要的分布
解:X表示20次中抽到废品的 次数,服从二项分布,n=20, p=0.03。利用二项分布公式 计算
P X 0.1 P( X 2) 0.0988. 20
01
02
3、二项分布的最可能值
定义 : 使概率P( X k)取最大值的k, 记作k0 , 称k0为二项分布 的最可能值.
设k k0时, P( X k0 )最大,则有下面不等式 :
2
X ~ P(4). 解:设随机P变( X量X表3示) 一1年内P因数(交X。通由事题2故)意死,亡的人数。要求泊松分布的参
1 P( X 0) P( X 1) P( X 2)
4名学生去参观展览,被选到的女学生数X是一个随机变
量,求
P(X
X的k分) 布C。3kCC241047
k
(k 0,1,2,3)
X ~ H(n, M , N )
设N个元素分为两类,
其中N
1个属于第一类,
N
个属于
2
第二类, 从中不放回抽取n个, 令X表示这n个中第一类
元定素义的个数 , 则称X的分布为超几何数分字布特:征
X ~ P()
若X的4.分3 布Po为issoPn( X(泊松)k分) 布 k e , k 0,1,2,, 其中 0, k!
则称X ~ P().
, EX
k
k0
k k!
e
e定义
k 1
(
k 1 k 1)
!
mk数1 字e特征
m0
m
m!
EX
2
k0
k2
k k!
e
k0
k(k
1)
kk!e
EX
2
,
DX EX 2 (EX )2 .
概率论中三个重要分布
χ2统计量
• χ2统计量也可表示成
n
2
(xi X )2
i 1
2
(n
1) s 2
2
χ2分布的概率密度函数
• χ2(n)分布的概率密度为
f
( y)
2n
1 2 Γ(n
2)
n 1 y
y2 e 2,
• 其中Γ( ·)为伽玛函0,数
y0 其他
Γ (s) x e s1 xdx 0
χ2分布的统计特性
例题分析
1. n=12, α=0.05, 求 2. n=12, α=0.95, 求 3. n=18, α=0.95, 求
2 0.05
(12
)
02和.95 (12)
2 0.95
(18
)
使得
2 0.05
(18
)
4.
n=50,
α=P0(.0502.,95求(18)
2
2 0.05
(18
))
0.9
2 0.05
n3
t分布的统计特性(续)
• t(n-1)分布的形状类似标准正态分布,但由 于t(n-1)的方差大于1(当n>3时,(n-1)/(n3)>1),所以t(n-1)分布比标准正态分布更 分散。即t(n-1)的概率密度函数是中央部分 较标准正态分布低,而两尾部分则较标准 正态分布高
t分布的统计特性(续)
P(t0.975(18)≤t≤ t0.025(18))=0.95 4. n=50, α=0.05,求t0.05(50)
F分布
• χ2分布的变量值始终为正 • χ2(n)分布的形状取决于其自由度n的大小
,通常为不对称的右偏分布,但随着自由 度的增大逐渐趋于对称 • χ2分布的期望为:E(χ2(n))=n,方差为: D(χ2(n))=2n • χ2分布具有可加性。若U~χ2(n1), V~χ2(n2) ,则U+V~χ2(n1+n2)
统计学-三种常用分布
频数分布图:直方图(频数-频率)
.25 .2 .15 .1 .05
F ra ctio n
164.1
185.4 x
频率图(纵坐标为频率)
正态分布的定义及其函数表达式
若某变量的频率曲线对应于数学上的正态曲 线,则称该变量服从正态分布
正态曲线的函数表达式
f (x) 1 e(x22)2
P99
例:估计某地110名健康成年男子第一秒肺通气量
的95%参考值范围,已知 x =4.2L,s=0.7L
二项分布
概述 例1 观察一种致毒物对白鼠的致毒作用。取三 只实验白鼠,服用相同剂量的致毒物,假设他 们死亡的概率均为π。定义实验后3只白鼠中 死亡的例数为X,求X=0,1,2,3的概率。
x 第一只白鼠 第二只白鼠 第三只白鼠 发生的概率
前面各观察单位上x的取值无关 普通性:观察单位可以小到只有1个事件
发生,发生概率不变
Poisson分布的性质
Poisson分布的图形
单参数离散型分布
形状只取决于μ,μ很小时分布很偏,当μ增加时, 逐渐趋于对称,μ≥20时,分布接近正态分布。
在
和
处达到峰值,且有
x x 1
二项分布的均数与方差
服从二项分布的变量X的均数和标准差
μx=nπ σx2= nπ(1-π)
样本率p的总体均数和方差
μp=π,称为率的标准误
对应的样本标准误为 Sp
p(1 p) n
例3 根据以往经验,新生儿染色体异常率为 0.01,某研究者随机抽查当地400名新生儿, 问出现1名新生儿染色体异常的概率是多少? 计算X的均数和方差,样本率的均数和标准差
计算x的均数和方差样本率的均数和标准差poisson分布描述某罕见事件发生次数的概率分布罕见事件每个格子的大小恰好容纳一个细菌1l水细分格子数有限格子中有细菌服从poisson分布的罕见事件举例均匀液体或空气中的细菌分布放射性物质单位时间内的放射次数粉尘在单位容积内计数的分布非传染性罕见疾病在人群中的分布如遗传缺陷癌症等24小时内发生早博的次数poisson分布的概率可记为poisson分布的条件与二项分布相似平稳性随机分布性
三大分布-PPT精选文档
2 (n)
0.4 0.3 0.2 0.1
n = 15
20 25
( x ) t e dt 0 在x > 0时收敛,称为 函数,具有性质
5 10 15
x 1 t
( x 1 ) x ( x ), ( 1 ) 1 , ( 1 / 2 ) ( n 1 ) n !( n N )
F(n,m)
例 证明 证
1 F ( n ,m ) 1 F ( m ,n )
1 P ( F F ( n , m )) 1
2 0 . 05
0)
~ N ( 0 , 1 ) ,Y ~ ( n ), 定义 设 X X ,Y相互独立,
2
t
X Y
则称 t 服从自由度为 n 的t 分布.记为 t ~ t(n) 其密度函数为
1 n n 1 Γ 2 2 t 2 f( t) 1 n n n Γ 2 t
t (n)
f (x)dx
的点 t (n)为 t(n)分布的上 分位点(数)
t(n ) 分布的上 分位数有表可查
t分布的分位点的性质
0.35 0.3 0.25 0.2 0.15 0.1 0.05
P T t ( n )
t ( n ) t ( n ) 1
2 2 2
(n)
f (x)dx
的点 (n)为 2 (n)分布的上 分位点(数)
( n) 分 布 的 上
2
0.1 0.08
分 位 数 有 表 可 查 0.06
0.04
n = 10
5 10 15 20(10) 20.05
0.4 0.3 0.2 0.1
n = 15
20 25
( x ) t e dt 0 在x > 0时收敛,称为 函数,具有性质
5 10 15
x 1 t
( x 1 ) x ( x ), ( 1 ) 1 , ( 1 / 2 ) ( n 1 ) n !( n N )
F(n,m)
例 证明 证
1 F ( n ,m ) 1 F ( m ,n )
1 P ( F F ( n , m )) 1
2 0 . 05
0)
~ N ( 0 , 1 ) ,Y ~ ( n ), 定义 设 X X ,Y相互独立,
2
t
X Y
则称 t 服从自由度为 n 的t 分布.记为 t ~ t(n) 其密度函数为
1 n n 1 Γ 2 2 t 2 f( t) 1 n n n Γ 2 t
t (n)
f (x)dx
的点 t (n)为 t(n)分布的上 分位点(数)
t(n ) 分布的上 分位数有表可查
t分布的分位点的性质
0.35 0.3 0.25 0.2 0.15 0.1 0.05
P T t ( n )
t ( n ) t ( n ) 1
2 2 2
(n)
f (x)dx
的点 (n)为 2 (n)分布的上 分位点(数)
( n) 分 布 的 上
2
0.1 0.08
分 位 数 有 表 可 查 0.06
0.04
n = 10
5 10 15 20(10) 20.05
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0e−/0!, 1e − /1!,2e − /2 … ke−/k! … ne−/n!
超几何分布→二项分布→泊松分布/正态分布
0.2 0.15
0.1 0.05
5
10
15
20
一、超几何分布→二项分布:案例分析
案例:10产品,3-7+;100件,30-70+,任取3
无放回:X= 0
12Biblioteka 3P(X=)=C73/C103 C31C72/C103 C32C71/C103 C33/C103
不放回抽n,其中次品k件
放回抽n,其中次品k件 n<<N
超几何分布
二项分布
Ex.案例:已知一麻袋种子,(共有100万颗,其中90万颗) 发育正常90%,今从其中任取10粒,求播种后(1)恰有8粒 (2)至少有8粒发芽的概率?(3)取1万颗,>8000发芽概率
案例:二项分布适用范围
1.所有卖场销售数据:每天进场人数n不详,每天购买概率 P未知,但是每天销售数据nP已知,如何求解销售数据的 概率分布? 好又多家乐福沃尔马/苏宁国美/DELL/本田/万科 2.电子商务销售数据:已知点击人数n,购买率P,购买人数 np,求解分布-阿里巴巴/当当购物 3.网络邮箱/网络硬盘使用率:点击使用藤讯人数n,邮箱或 硬盘使用率P,使用人数nP, 藤讯QQ/网易/163/Hotmail/MSN/yahoo…. 4.饭店/酒店食物定购:真功夫/麦当劳/肯德基 5.自己开店:花店/电脑城/……如何进货销售曲线 注解:案例1+5属于n,p未知,案例2+3+4属于n,p已知
1 1 k e 5 1 0 . 0 9 0 0 . 9 5
k 0 k ! 于是 这家商店只要在月底
保证存货不低于15件就能以
95%以上的概率保证下个月
该种商品不会脱销
销售数据
实际销售数据概率
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
销售累计概率=不脱销率 4.53999E-05 0.000453999 0.002269996 0.007566655 0.018916637 0.037833275 0.063055458 0.090079226 0.112599032 0.125110036 0.125110036 0.113736396 0.09478033 0.072907946 0.052077104 0.03471807 0.021698794 0.012763996
X P
X= 0
三大分布的概率计算对比
x1 p1
x2 p2
xk pk
P (Xxk)pk,k1,2,
1
2 …K
…. M
C
0 N
1C
n N
2
C
n N
C
1 N
1C
n 1 N2
C
n N
C
2 N
1C
n2 N2
C
n N
C C k n k
… N1 N 2
C
n N
…
C
n N
1C
0 N
2
C
n N
Cn0P0qn , Cn1P1qn-1, Cn2P2qn-2 … CnkPkqn-k… CnnPnq0
0.2917 0.525 0.175
0.0083
C703/C1003,C301C702/C1003,C302C701/C1003,C303/C1003
0.339
0.448 0.188
0.025
有放回=C300.73 C310.310.72 C320.320.71 C330.33
0.343
0.441 0.189 0.027
P{Xa}095 由于已知X服从参数为10的 泊松分布 上式即为 X=0, 1, 2,…14, 15, 16…a,…
P0P1P3… P14 P15 P16…Pa…
a 1 k e 1 0 0 . 9 0 5
k 0 k !
1 1 k e 4 1 0 . 0 9 0 0 . 9 1
k 0 k !
4.53999E-05 0.000499399 0.002769396 0.010336051 0.029252688 0.067085963 0.130141421 0.220220647 0.332819679 0.457929714 0.58303975 0.696776146 0.791556476 0.864464423 0.916541527 0.951259597 0.97295839 0.985722386
0.15
0.1
0.05
0
1
2
3
4
超几何分布 二项分布
10=3次+7正,任取3件, 有放回 无放回
100=30次+70正,任取3件, 有放回 无放回
理论基础
数据:N=总体个数,N1=总体中A的个数, n=样本个数,k=样本中A的个数;
逼近关系:
N件产品,其中N1件次品 n<=0.05NN件产品,次品率N1/N
显然:当N→+∞,H(n,N1,N2,N)→b(n,P)
图形分析:1,产品总量N越大,n/N越小,则越接近!
2,两者图形向两边延伸 ,得到正态模型!
结论:当n<<N(n<=0.05N)超几何分布→二项分布
0.6
0.5
0.4
0.3
0.2
0.1
0
1
2
3
4
0.5
0.45
0.4
0.35
0.3
超几何分布 0.25 二项分布 0.2
统计学 三大分布-经典案例全集
离散分布之一:超几何分布vs二项分布
1,超几何分布:基本意义/期望方差/与二项 分布的关系 2,二项分布:基本意义/期望方差/与超几何 分布的关系 有放回抽样模型=重复抽样模型=二项分布 B(n,P),EXCEL:BINOMDIST(k,n,P,逻辑值) 不放回抽样模型=不重复抽样=超几何分布 H(n,N1,N), EXCEL:HYPGEOMDIST(k,n,N1,N)
例220 某商店根据过去的销售记录知道某种商品每月的 销售量可以用参数为10的泊松分布来描述 为了以95%以 上的概率保证不脱销 问商店在月底应存多少件该种商品(设 只在月底进货)?大卖场的顾客数n很大,买商品概率P很少/多
解 设该商店每月销售该 商品的件数为X 月底存货为a 则当Xa时就不会脱销 据题 意 要求a使得
图示:实际销售数据概率/不脱销率的变化规律
销售数据概率
0.14 0.12 0.1 0.08 0.06 0.04 0.02
0 1 3 5 7 9 11 13 15 17 19 21
销售数据概率
销售累计概率=不脱销率
1.2 1