统计学 三大分布-经典案例全集
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课件分布规律与上课指南:
1.离散分布之一:超几何与二项 2.离散分布之二:二项与泊松 小结:超几何转二项,二项转泊松正态 3.离散分布之三:四大分布数字特征 4.附录 注意1:附录三有各种分布的EXCEL求解公式 注意2:上课可以先将几个不重要的分布,在附录 1-退化/两点/0-1/均匀分布先简介30分钟,再用90 分钟讲解四大分布及其关系
理论被炸区数 实际区数
结论:无论从单点概率分布和累计概率分布,都能看出: 德国人对任何地区的轰炸都是一种随机行为,每一个地区
被轰炸的概率近似相等,英军情报没有泄密!!!!
X P X= 0
三大分布的概率计算对比
x1 p1
x2 xk p2 pk
P(X xk) pk, k 1,2,
1
2 …K
N=2000产品 次品NA=400
二项分布 泊松分布 二项正态
二项泊松分离 二项正态重合
0 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43
ห้องสมุดไป่ตู้
二项分布→泊松分布/正态分布 n=100,p=0.4,np=40
0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01
数据:N=总体个理数论,N基1=础总体中A的个数,
n=样本个数,k=样本中A的个数; 逼近关系:
N件产品,其中N1件次品 不放回抽n,其中次品k件
n<=0.05N n<<N
N件产品,次品率N1/N 放回抽n,其中次品k件
超几何分布
二项分布
Ex.案例:已知一麻袋种子,(共有100万颗,其中90万颗) 发育正常90%,今从其中任取10粒,求播种后(1)恰有8粒 (2)至少有8粒发芽的概率?(3)取1万颗,>8000发芽概率
0 1 6 11 16 21 26 31 36 41 46 51 56 61 66
0.14 0.12 0.1 0.08 0.06 0.04 0.02
0 1 4 7 10 13 16 19 22 25 28 31
N=2000产品 次品NA=200
二项分布 泊松分布 二项正态
二项泊松分离 二项正态重合
二项分布→泊松分布/正态分布 n=100,p=0.2,np=20
0.12 0.1 0.08 0.06 0.04 0.02
4.53999E-05 0.000499399 0.002769396 0.010336051 0.029252688 0.067085963 0.130141421 0.220220647 0.332819679 0.457929714 0.58303975 0.696776146 0.791556476 0.864464423 0.916541527 0.951259597 0.97295839 0.985722386
X= 0 1 2 3 4 5 6 7 … 频数 229 221 93 35 7 1 0 0… EX=0.93次=λ=nP但是德军空袭次数n未知,理论被炸区数 P(λ)=231.2 215 100 31 7.2 1.34 0.2 0.02 结论:德军的空袭对任何地区发生的概率均等,且每次空袭袭 击任何地区的概率都是P,试验属于n重独立试验 类似案例:公司销售数据概率分布的获得,如eg2.20 X= 0, 1, 2,….,10, 11, 12,…, k,…mean=EX=λ 频率f=f0 f1 f2 … f10 f11 f12… Pk…实际概率f P(X)= P0 P1 P2 … P10 P11 P12… Pk…理论概率P If Σ|fi-Pi|<a(阈值) then概率分布为P(X),否则,非P(X)
0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02
0 1 4 7 10 13 16 19 22 25 28 31
N=2000产品 次品NA=120
二项分布 泊松分布 二项正态
二项泊松重合 二项正态重合
二项分布→泊松分布/正态分布 n=100,p=0.1,np=10
离散分布之一:超几何分布vs二项分 1,超几何分布:基本布意义/期望方差/与二项
分布的关系 2,二项分布:基本意义/期望方差/与超几何 分布的关系 有放回抽样模型=重复抽样模型=二项分布 B(n,P),EXCEL:BINOMDIST(k,n,P,逻辑值) 不放回抽样模型=不重复抽样=超几何分布
H(n,N1,N),
藤讯QQ/网易/163/Hotmail/MSN/yahoo….
4.饭店/酒店食物定购:真功夫/麦当劳/肯德基
5.自己开店:花店/电脑城/……如何进货销售曲线
注解:案例1+5属于n,p未知,案例2+3+4属于n,p已知
例220 某商店根据过去的销售记录知道某种商品每月的销售量可以用参数为 10的泊松分布来描述 为了以95%以上的概率保证不脱销 问商店在月底应存多少件 该种商品(设只在月底进货)?大卖场的顾客数n很大,买商品概率P很少/多
k0 k!
15 10k e10 0.95130.95
k0 k!
于是 这家商店只要在月底保证存货不低 于15件就能以95%以上的概率保证下个 月该种商品不会脱销
销售数据
实际销售数据概率
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
销售累计概率=不脱销率 4.53999E-05 0.000453999 0.002269996 0.007566655 0.018916637 0.037833275 0.063055458 0.090079226 0.112599032 0.125110036 0.125110036 0.113736396 0.09478033 0.072907946 0.052077104 0.03471807 0.021698794 0.012763996
…. M
C
C 0 n
N1 N
2
CNn
C
1N1C
n1 N2
C
n N
CN2 1C
n2 N2
C
n N
C C k nk
… N1 N 2
…
C
n N
Cn0P0qn , Cn1P1qn-1, Cn2P2qn-2 … CnkPkqn-k… CnnPnq0
CNn 1C
0 N
2
CNn
0e−/0!, 1e − /1!,2e − /2 … ke−/k! … ne−/n!
EXCEL:HYPGEOMDIST(k,n,N1,N)
X P X= 0
三大分布的概率计算对比
x1 p1
x2 xk p2 pk
P(X xk) pk, k 1,2,
1
2 …K
…. M
C
C 0 n
N1 N
2
CNn
C
1N1C
n1 N2
C
n N
CN2 1C
n2 N2
C
n N
C C k nk
… N1 N 2
0.339
0.448 0.188 0.025
有放回=C300.73 C310.310.72 C320.320.71 C330.33
0.343
0.441 0.189 0.027 显然
:当N→+∞,H(n,N1,N2,N)→b(n,P)
图形分析:1,产品总量N越大,n/N越小,则越接近!
2,两者图形向两边延伸 ,得到正态模型!
二项分布→泊松分布/正态分布 n=100,p=0.02,np=2
0.3 0.25 0.2 0.15 0.1 0.05
0 1 2 3 4 5 6 7 8 9 10 11 12 13
N=2000产品 次品NA=40
二项分布概率 泊松分布概率 正态分布概率
二项泊松重合 二项正态靠近
二项分布→泊松分布/正态分布 n=100,p=0.06,np=6
*√第一/二部分小结2:三大分布分
理论上 N→+∞,n<<N
布律的样相本实数践互n中≤关0.05系N或N未知
H(n,N1,N)→b(n,N1/N)=b(n,P)
证明略
n→+∞,nP→
n→+∞,且nP或nq≤10(5)
b(n,P)→b(∞,P)→Poisson(nP)=Poisson() 证明
n→+∞,P→0(1)×
结论:当n<<N(n<=0.05N)超几何分布→二项分布
0.6
0.5
0.4
0.3
0.2
0.1
0
1
2
3
4
0.5
0.45
0.4
0.35
0.3
超几何分布 0.25 二项分布 0.2
0.15
0.1
0.05
0
1
2
3
4
超几何分布 二项分布
10=3次+7正,任取3件, 有放回 无放回
100=30次+70正,任取3件, 有放回 无放回
销售累计概率=不 脱销率
补充实践应用案例举例1:伦敦情报战 伦敦上空的鹰究竟是有目的的轰炸行为还是随机的行为? 二次世界大战期间,德军飞机对英伦三岛进行了无数次的轰炸 空袭行动,为了了解英军情报是否泄密,英国密码是否被破译 ,英国情报机构对英国各被轰炸地区进行一项统计调查,他们 对伦敦划分成586区,统计每个地区实际被轰炸次数如下:
…
C
n N
Cn0P0qn , Cn1P1qn-1, Cn2P2qn-2 … CnkPkqn-k… CnnPnq0
CNn 1C
0 N
2
CNn
0e−/0!, 1e − /1!,2e − /2 … ke−/k! … ne−/n!
超几何分布→二项分布→泊松分布/正态分布
0.2 0.15
0.1 0.05
5
10
解 设该商店每月销售该商品的件数 为X 月底存货为a 则当Xa时就不会脱销 据题意 要求a使得
P{Xa}095 由于已知X服从参数为10的泊松分布 上 式即为
X=0, 1, 2,…14, 15, 16…a,… P0P1P3… P14 P15 P16…Pa…
a
10k
e10
0.95
k0 k!
14 10k e10 0.91660.95
理论与实践的对比:伦敦空袭统 计
0.45 0.4
0.35 0.3
0.25 0.2
0.15 0.1
0.05 0
1 2 3 4 5 6 7 8 9 10 11
实际被炸次数所对 应的区的概率
理论上被炸次数所 对应的区的概率
250 200 150 100
50 0 1 2 3 4 5 6 7 8 9 10 11
15
20
一、超几何分布→二项分布:案 无案放例回::1X0=产0品,3-71+;例10分0件析,302-70+,任取33
P(X=)=C73/C103 C31C72/C103 C32C71/C103 C33/C103
0.2917 0.525 0.175
0.0083
C703/C1003,C301C702/C1003,C302C701/C1003,C303/C1003
二项分布→泊松分布/正态分布 n=100, p=0.01 ,np=1
0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05
0 1 2 3 4 5 6 7 8 9 10 11 12 13
N=2000产品 次品NA=20
二项分布概率 泊松分布概率 正态分布概率
二项泊松重合 正态分布远离
§23 常用的离散型分布: 超几何分布→二项分布→泊松分布/正态分布
*六、超几何分布 * √四、二项分布
* √七、泊松(Poisson)分布
一、退化分布 二、两点分布 三、离散均匀分布 注解:凡是带有×可以不讲,√都是重点,*都是难点
*√本节重点难点:超几何分布的极限分布是二项分布,二项分布的极限分布是 Poisson 分布
n→+∞,且nP与nq>10(5)
b(n,P)→N(nP,nPq)=N(u,σ2)
棣莫弗-拉普拉斯中心极限定理—Page111
证明略
实践计算中:超几何→二项分布→泊松分布/正态分布
问题案例:某生物高科技集团,新研制出一批转基因种 子,发芽率为0.7, 准备试种1000颗,问其中有500颗 以上发芽的概率?二项b(1000,0.7)?P(700)?P(300)
图示:实际销售数据概率/不脱销
率的变化规律
销售数据概率
销售累计概率=不脱销率
0.14 0.12 0.1 0.08 0.06 0.04 0.02
0 1 3 5 7 9 11 13 15 17 19 21
销售数据概率
1.2 1
0.8 0.6 0.4 0.2
0 1 3 5 7 9 11 13 15 17 19 21
1.所有案卖场例销售:数二据:项每天分进布场人适数n用不详范,围每天购买概率
P未知,但是每天销售数据nP已知,如何求解销售数据的概 率分布?
好又多家乐福沃尔马/苏宁国美/DELL/本田/万科
2.电子商务销售数据:已知点击人数n,购买率P,购买人数 np,求解分布-阿里巴巴/当当购物
3.网络邮箱/网络硬盘使用率:点击使用藤讯人数n,邮箱或 硬盘使用率P,使用人数nP,