统计学Poisson分布
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
24.9 61.9 77.1 64.0 39.8 19.8 8.2 4.2 300.00
Poisson分布例2
2002年韩日世界杯64场比赛中,各队进球数有 多有少。大部分是0,1,2个进球,个别队是5 个以上进球,最多的是8个进球,平均是 1.2578 个 / 场 / 队。虽然强队大都能进球、赢球 ( 如巴西队 ) ,弱队大都不能进球 ( 如中国队 ) 。 但宏观上来说,各队进球数服从 Poisson 分布!
Poisson分布的定义
历史上,泊松分布是 作为二项分布的近似, 于 1837 年由法国数学 家泊松 (S.D Poisson 1781-1840) 引入的 。
Siméon Denis Poisson 1781~1840
1837年 ,《概率论及其重要应用》。在这 本书的数学推演中, Poisson 从二项分布 的极限得到了日后以他为名的概率分布。 Poisson虽然得到这样的概率分布,但书中 他并没有继续讨论这种分布的性质,在往 后的研究中,Poisson似乎也把它忘掉了。
主要内容
Poisson分布的定义 Poisson分布的性质 Poisson分布的应用
平均计数的区间估计 两个平均计数的比较 样本平均计数与总体平均计数的比较 应用条件
3.1 平均计数的可信区间估计
=?
X/n
X X , sX n
X n
X n2
总计数X较大时, 可用正态近似法:
1 360 1.96 360, 3 1 (322.8, 397.2) 3
360 1.96 360
总计数X较大时, 可用正态近似法:
例4.6 (page41) 用计数器两次测得某放射性 物质 5 分钟内发出的脉冲数分别为 42 和 48 个。 假设单位时间内脉冲数的发放符合Poisson分布, 试估计该放射性物质每 5 分钟平均脉冲数的 95%可信区间。
总计数X较小时, 查表法(根据分布直接计算)
n个单位的总计数 X ≤ 50时:
例 n=1(一个标准单位), X=8。 (3.4, 15.8)
例 n=3 (3个标准单位), X1=8, X2=10, X3=6。
X=24。 先查X=24。得95%CI: (15.4,35.6), 再除以3, 得: (5.13, 11.87)。
在实际中,许多随机现象服从或近似服从泊松分 布.
二十世纪初罗瑟福和盖克两位科学家在观察 与分析放射性物质放出的 粒子个数的情况时, 他们做了2608 次观察(每次时间为7.5 秒)发现 放射性物质在规定的一段时间内, 其放射的粒子 数X 服从泊松分布.
在生物学、医学、工业统计、保险科学及
公用事业的排队等问题中 , 泊松分布是常见的. 例如地震、火山爆发、特大洪水、交换台的电
3.2 两平均计数的比较( X 较大 时)(page83)
例 某车间在改革生产工艺前,测取三次粉尘 浓度,每升空气中分别有38、39、36颗粉尘; 改革生产工艺后,测取两次,分别有25、18颗 粉尘。问工艺改革前后粉尘颗粒有无差别?
3.2
两平均计数的比较( X 较大时)
n1=3, X1=38+29+36=103;
总计数X较大时, 可用正态近似法:
先计算 2 个单位时间 (10 分钟 ) 内平均脉冲数的 95%可信区间。
X=42+48=90
(901.96 90 ,901.96 90 )=(71.4,108.6)
则平均每单位时间(5分钟)该放射性物质平均发 出 脉 冲 数 为 45.0 个 /5 分 钟 , 其 95%CI 为 : 35.7~54.3个/5分钟。
Bortkiewicz(1868~1931年)
直 到 十 九 世 纪 末 , Bortkiewicz( 博 尔 特 科 威 茨 ) 才注意到 Poisson 分布 与某些类型的数据之间也 有关系。 Ladislaus von Bortkiewicz (1868~1931年)是出生 在俄国圣彼得堡的波兰人。
例2进球数资料的均数和方差: 均数=1.2578, 方差=1.2247
2.2 Poisson分布的图形
=3
0.2 P(X) =5 =10 =20
0.1
0.0 0 4 8 0 4 8 12 4 8 12 16 20 X 8 12 16 20 24 28 32
2.3 Poisson分布中均数的 抽样分布及其性质
每年每军团死亡人数 观察数 理论数
0 1 2 3 4 ≥5 合计
144 91 32 11 2 0 280
139.0 97.3 34.1 8.0 1.4 0.2 280
Number of deaths by horse kicking in Prussian army
Poisson分布的定义
近数十年来,泊松分布(poisson distribution)日益 显示其重要性,成为概率论中最重要的几个分布之 一。
他研究了在骑兵时代里普鲁士士兵被马踢死 的人数的数据。
从 1875 到 1894 年的 20 年间,德国的 14 个军团 都有士兵被马踢伤因而致死的人数记录。
Number of deaths by horse kicking in Prussian army
表 平均计数为0.7的Poisson分布
Poisson分布例1
单位容积内细菌数服从Poisson分布。=2.49。
2.490 2.49 2.491 2.49 P (0) e 0.082910, P (1) e 0.206446 0! 1! 2.492 2.49 2.493 2.49 P (2) e 0.257025, P (3) e 0.213331 2! 3! 2.494 2.49 2.495 2.49 P (4) e 0.132798, P (5) e 0.066134 4! 5! 2.496 2.49 P (6) e 0.027445 6! P ( X 7) 1 P (0) P (1) P (6) 0.013911
特点:罕见事件发生数的分布规律
1 Poisson分布的概率
如果一个随机变量X的取值为0,1,2,…,且:
P( X k)
X
X!
e
则称X服从参数为 的Poisson分布。 记为 X ~ Poisson()。
累计概率
P(X≤k) = P(X=0)+P(X=1)+…+P(X=k)
P(X≥k) = P(X=k)+P(X=k+1)+… P(X≥k) = 1- P(X< k)
主要内容
Poisson分布的定义 Poisson分布的性质 Poisson分布的应用
平均计数的区间估计 两个平均计数的比较 样本平均计数与总体平均计数的比较 应用条件
3.2 两平均计数的比较( X较大时)
两样本均数X1 和X2均>=20 两个样本观察单位相同时:
X1 X 2 X1 X 2
Poisson分布及其应用
Poisson distribution and its application
南京医科大学
陈涛
主要内容
Poisson分布的定义 Poisson分布的性质 Poisson分布的应用
平均计数的区间估计 两个平均计数的比较 样本平均计数与总体平均计数的比较 应用条件
n个单位,一个样本计数,且 X > 50时:
X1
=?
X2
1 ( X 1.96 X , X 1.96 X ) n
X
( X 1.96 X , X 1.96 X )
例
n=3个单位时间(一个单位时间=10分钟), X=360。 则: 10分钟该放射物质的平均脉冲数的95%CI:
两个样本观察单位不同时:
X1 X 2 X1 X 2 u s X1 X 2 X1 X 2 2 2 n1 n2
3.2 两平均计数的比较(X较大时)
例为研究两个水源被污染的情况是否相同,在 每个水源各取10ml水坐细菌培养,结果甲水源 样品中测得菌落 890 个,乙水源样品测得菌落 785个。请问两个水源的污染情况是否不同?
H0: 1 = 2; H1: 1≠ 2 , =0.05
例
n2=2, X2=25+18=43;
X1 X 2 X1 X 2 u s X1 X 2 X1 X 2 2 2 n1 n2
在足够大时,Poisson分布的平均计数近似 正态分布。
平均计数的标准误
s
n
n=1时(1个分布的可加性
如果X1服从Poisson(1),
X2服从Poisson(2),
则X1+X2服从Poisson(1+ 2)。
即,Poisson分布具有可加性。
First application By Bortkiewicz, 1898
他不但在理论方面推演了Poisson分布的许多 性质,并且在介绍了它的应用; Poisson分布虽然出於Poisson之手,但真正使 它为人重视,并成为统计学一部分的可要算 是Bortkievicz了。
Number of deaths by horse kicking in Prussian army
=(322.8, 397.2)
总计数X较大时, 可用正态近似法:
n个单位,一个样本计数,且 X > 50时: 先求和,合计成一个样本以后计算 95%CI,再 除以样本数,得到平均每个单位内的计数的 95%CI。 平均计数的 95%CI:
1 ( X 1.96 X , X 1.96 X ) n
话呼唤次数等, 都服从泊松分布. 地震 火山爆发 特大洪水
Poisson分布的定义
商场接待的顾客数 电话呼唤次数 交通事故次数
可能发生这些事件的观察例数n常常很大 ,但实际上发生 类似事件的数目却很小很小。
Poisson分布的定义
每升水中大肠菌群数的分布 粉尘在单位容积内计数的分布 放射性物质在单位时间内放射出质点数的分布 单位空间中某些野生动物或昆虫数的分布 天空中的流星数 基因突变的数目
单位容积内细菌数的分布
X 0 1 2 3 4 5 6 7~ 合计
=2.49
观察数
26 51 84 70 42 15 9 3 300
概率
0.082910 0.206446 0.257025 0.213331 0.132798 0.066134 0.027445 0.013911 1.000000
理论频数
平均计数的区间估计 两个平均计数的比较 样本平均计数与总体平均计数的比较 应用条件
2.1 Poisson分布的均数和方差
如果X~Poisson(),则:
X的均数:
X的方差: X的标准差:
X
2 X
X
Poisson分布的两个实例的均数和标准差
例1细菌数资料的均数和方差: 均数=2.490, 方差=2.257
平均计数为1.2578的Poisson分布
每场各队进球数 0 1 2 3 4 5 ≥6 场次 37 47 27 13 2 1 1 理论数 36.39 45.77 28.78 12.07 3.79 0.95 0.25
128
128.00
主要内容
Poisson分布的定义 Poisson分布的性质 Poisson分布的应用
3.2
两平均计数的比较( X 较大时)
X1=890; X2=785;
H0: 1 = 2; H1: 1≠ 2 , =0.05
例
X1 X 2 890-785 = =2.566 X1 X 2 890+785
因为u0.05=1.96,故按0.05水准,拒绝H0, 接受H1 ,可以认为两个水源的污染情况不同。
一个样本计数,且 X > 50时: 平均计数的 95%CI:
( X 1.96 X , X 1.96 X )
=?
X
例
30分钟该放射物质的脉冲数为360。
n=一个单位时间(30分钟),X=360。
30分钟该放射物质的平均脉冲数的95%CI: (360-1.96×sqrt(360), 360-1.96×sqrt(360))
Poisson分布例2
2002年韩日世界杯64场比赛中,各队进球数有 多有少。大部分是0,1,2个进球,个别队是5 个以上进球,最多的是8个进球,平均是 1.2578 个 / 场 / 队。虽然强队大都能进球、赢球 ( 如巴西队 ) ,弱队大都不能进球 ( 如中国队 ) 。 但宏观上来说,各队进球数服从 Poisson 分布!
Poisson分布的定义
历史上,泊松分布是 作为二项分布的近似, 于 1837 年由法国数学 家泊松 (S.D Poisson 1781-1840) 引入的 。
Siméon Denis Poisson 1781~1840
1837年 ,《概率论及其重要应用》。在这 本书的数学推演中, Poisson 从二项分布 的极限得到了日后以他为名的概率分布。 Poisson虽然得到这样的概率分布,但书中 他并没有继续讨论这种分布的性质,在往 后的研究中,Poisson似乎也把它忘掉了。
主要内容
Poisson分布的定义 Poisson分布的性质 Poisson分布的应用
平均计数的区间估计 两个平均计数的比较 样本平均计数与总体平均计数的比较 应用条件
3.1 平均计数的可信区间估计
=?
X/n
X X , sX n
X n
X n2
总计数X较大时, 可用正态近似法:
1 360 1.96 360, 3 1 (322.8, 397.2) 3
360 1.96 360
总计数X较大时, 可用正态近似法:
例4.6 (page41) 用计数器两次测得某放射性 物质 5 分钟内发出的脉冲数分别为 42 和 48 个。 假设单位时间内脉冲数的发放符合Poisson分布, 试估计该放射性物质每 5 分钟平均脉冲数的 95%可信区间。
总计数X较小时, 查表法(根据分布直接计算)
n个单位的总计数 X ≤ 50时:
例 n=1(一个标准单位), X=8。 (3.4, 15.8)
例 n=3 (3个标准单位), X1=8, X2=10, X3=6。
X=24。 先查X=24。得95%CI: (15.4,35.6), 再除以3, 得: (5.13, 11.87)。
在实际中,许多随机现象服从或近似服从泊松分 布.
二十世纪初罗瑟福和盖克两位科学家在观察 与分析放射性物质放出的 粒子个数的情况时, 他们做了2608 次观察(每次时间为7.5 秒)发现 放射性物质在规定的一段时间内, 其放射的粒子 数X 服从泊松分布.
在生物学、医学、工业统计、保险科学及
公用事业的排队等问题中 , 泊松分布是常见的. 例如地震、火山爆发、特大洪水、交换台的电
3.2 两平均计数的比较( X 较大 时)(page83)
例 某车间在改革生产工艺前,测取三次粉尘 浓度,每升空气中分别有38、39、36颗粉尘; 改革生产工艺后,测取两次,分别有25、18颗 粉尘。问工艺改革前后粉尘颗粒有无差别?
3.2
两平均计数的比较( X 较大时)
n1=3, X1=38+29+36=103;
总计数X较大时, 可用正态近似法:
先计算 2 个单位时间 (10 分钟 ) 内平均脉冲数的 95%可信区间。
X=42+48=90
(901.96 90 ,901.96 90 )=(71.4,108.6)
则平均每单位时间(5分钟)该放射性物质平均发 出 脉 冲 数 为 45.0 个 /5 分 钟 , 其 95%CI 为 : 35.7~54.3个/5分钟。
Bortkiewicz(1868~1931年)
直 到 十 九 世 纪 末 , Bortkiewicz( 博 尔 特 科 威 茨 ) 才注意到 Poisson 分布 与某些类型的数据之间也 有关系。 Ladislaus von Bortkiewicz (1868~1931年)是出生 在俄国圣彼得堡的波兰人。
例2进球数资料的均数和方差: 均数=1.2578, 方差=1.2247
2.2 Poisson分布的图形
=3
0.2 P(X) =5 =10 =20
0.1
0.0 0 4 8 0 4 8 12 4 8 12 16 20 X 8 12 16 20 24 28 32
2.3 Poisson分布中均数的 抽样分布及其性质
每年每军团死亡人数 观察数 理论数
0 1 2 3 4 ≥5 合计
144 91 32 11 2 0 280
139.0 97.3 34.1 8.0 1.4 0.2 280
Number of deaths by horse kicking in Prussian army
Poisson分布的定义
近数十年来,泊松分布(poisson distribution)日益 显示其重要性,成为概率论中最重要的几个分布之 一。
他研究了在骑兵时代里普鲁士士兵被马踢死 的人数的数据。
从 1875 到 1894 年的 20 年间,德国的 14 个军团 都有士兵被马踢伤因而致死的人数记录。
Number of deaths by horse kicking in Prussian army
表 平均计数为0.7的Poisson分布
Poisson分布例1
单位容积内细菌数服从Poisson分布。=2.49。
2.490 2.49 2.491 2.49 P (0) e 0.082910, P (1) e 0.206446 0! 1! 2.492 2.49 2.493 2.49 P (2) e 0.257025, P (3) e 0.213331 2! 3! 2.494 2.49 2.495 2.49 P (4) e 0.132798, P (5) e 0.066134 4! 5! 2.496 2.49 P (6) e 0.027445 6! P ( X 7) 1 P (0) P (1) P (6) 0.013911
特点:罕见事件发生数的分布规律
1 Poisson分布的概率
如果一个随机变量X的取值为0,1,2,…,且:
P( X k)
X
X!
e
则称X服从参数为 的Poisson分布。 记为 X ~ Poisson()。
累计概率
P(X≤k) = P(X=0)+P(X=1)+…+P(X=k)
P(X≥k) = P(X=k)+P(X=k+1)+… P(X≥k) = 1- P(X< k)
主要内容
Poisson分布的定义 Poisson分布的性质 Poisson分布的应用
平均计数的区间估计 两个平均计数的比较 样本平均计数与总体平均计数的比较 应用条件
3.2 两平均计数的比较( X较大时)
两样本均数X1 和X2均>=20 两个样本观察单位相同时:
X1 X 2 X1 X 2
Poisson分布及其应用
Poisson distribution and its application
南京医科大学
陈涛
主要内容
Poisson分布的定义 Poisson分布的性质 Poisson分布的应用
平均计数的区间估计 两个平均计数的比较 样本平均计数与总体平均计数的比较 应用条件
n个单位,一个样本计数,且 X > 50时:
X1
=?
X2
1 ( X 1.96 X , X 1.96 X ) n
X
( X 1.96 X , X 1.96 X )
例
n=3个单位时间(一个单位时间=10分钟), X=360。 则: 10分钟该放射物质的平均脉冲数的95%CI:
两个样本观察单位不同时:
X1 X 2 X1 X 2 u s X1 X 2 X1 X 2 2 2 n1 n2
3.2 两平均计数的比较(X较大时)
例为研究两个水源被污染的情况是否相同,在 每个水源各取10ml水坐细菌培养,结果甲水源 样品中测得菌落 890 个,乙水源样品测得菌落 785个。请问两个水源的污染情况是否不同?
H0: 1 = 2; H1: 1≠ 2 , =0.05
例
n2=2, X2=25+18=43;
X1 X 2 X1 X 2 u s X1 X 2 X1 X 2 2 2 n1 n2
在足够大时,Poisson分布的平均计数近似 正态分布。
平均计数的标准误
s
n
n=1时(1个分布的可加性
如果X1服从Poisson(1),
X2服从Poisson(2),
则X1+X2服从Poisson(1+ 2)。
即,Poisson分布具有可加性。
First application By Bortkiewicz, 1898
他不但在理论方面推演了Poisson分布的许多 性质,并且在介绍了它的应用; Poisson分布虽然出於Poisson之手,但真正使 它为人重视,并成为统计学一部分的可要算 是Bortkievicz了。
Number of deaths by horse kicking in Prussian army
=(322.8, 397.2)
总计数X较大时, 可用正态近似法:
n个单位,一个样本计数,且 X > 50时: 先求和,合计成一个样本以后计算 95%CI,再 除以样本数,得到平均每个单位内的计数的 95%CI。 平均计数的 95%CI:
1 ( X 1.96 X , X 1.96 X ) n
话呼唤次数等, 都服从泊松分布. 地震 火山爆发 特大洪水
Poisson分布的定义
商场接待的顾客数 电话呼唤次数 交通事故次数
可能发生这些事件的观察例数n常常很大 ,但实际上发生 类似事件的数目却很小很小。
Poisson分布的定义
每升水中大肠菌群数的分布 粉尘在单位容积内计数的分布 放射性物质在单位时间内放射出质点数的分布 单位空间中某些野生动物或昆虫数的分布 天空中的流星数 基因突变的数目
单位容积内细菌数的分布
X 0 1 2 3 4 5 6 7~ 合计
=2.49
观察数
26 51 84 70 42 15 9 3 300
概率
0.082910 0.206446 0.257025 0.213331 0.132798 0.066134 0.027445 0.013911 1.000000
理论频数
平均计数的区间估计 两个平均计数的比较 样本平均计数与总体平均计数的比较 应用条件
2.1 Poisson分布的均数和方差
如果X~Poisson(),则:
X的均数:
X的方差: X的标准差:
X
2 X
X
Poisson分布的两个实例的均数和标准差
例1细菌数资料的均数和方差: 均数=2.490, 方差=2.257
平均计数为1.2578的Poisson分布
每场各队进球数 0 1 2 3 4 5 ≥6 场次 37 47 27 13 2 1 1 理论数 36.39 45.77 28.78 12.07 3.79 0.95 0.25
128
128.00
主要内容
Poisson分布的定义 Poisson分布的性质 Poisson分布的应用
3.2
两平均计数的比较( X 较大时)
X1=890; X2=785;
H0: 1 = 2; H1: 1≠ 2 , =0.05
例
X1 X 2 890-785 = =2.566 X1 X 2 890+785
因为u0.05=1.96,故按0.05水准,拒绝H0, 接受H1 ,可以认为两个水源的污染情况不同。
一个样本计数,且 X > 50时: 平均计数的 95%CI:
( X 1.96 X , X 1.96 X )
=?
X
例
30分钟该放射物质的脉冲数为360。
n=一个单位时间(30分钟),X=360。
30分钟该放射物质的平均脉冲数的95%CI: (360-1.96×sqrt(360), 360-1.96×sqrt(360))