第六章 几种离散型变量的分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假定符合一定条件的病人可视为相同的个体。若某药治愈概 率为60%,现用该药治疗10例病人,求治愈病人数的概率分布
X
Pi
样本率P=x/n
0
1
0.0001
0.0016
0.00%
10.00%
2
3 4 5 6 7 8 9 10
0.0106
0.0425 0.1115 0.2007 0.2508 0.2150 0.1209 0.0403 0.0060
20.00%
30.00% 40.00% 50.00% 60.00% 70.00% 80.00% 90.00% 100.00%
xi 求样本率P 的均数 n xi p P i 0.6 n 2 求样本率P的方差 p
2 p
(1 )
n
xi 2 ( p ) pi 0.024 n
•Poisson
•负二项分布
一、二项分布(binomial distribution)
二项分布是一种重要的离散型概率分布,由 J. Bernoulli(1713年)提出,在医学中常用于率 (阳性率、治愈率、有效率等)的研究。
1、何为二项分布
Bernoulli试验:只有两种可能结果的试验称 Bernoulli trial。如动物死亡、存活;化验结 果阳性、阴性;居民发病与不发病等等。 n次Bernoulli试验:对某一Bernoulli试验独立 重复地进行n次,则称这种独立重复的试验系 列为 n次Bernoulli试验。
问题: poisson 分布的参数λ 的含义? 怎样的变量会服从Poisson分布?
新法总体率的95%可信区间:58.03%--71.97%
两样本率的比较(自看) 研究非遗传性疾病的家族集聚性 (见卡方检验)
群检验: 当需了解一大批标本的阳性率时,对所有 标本一一作阳性认定往往需要大量的人力 和物力,使用所谓的群检验技术有利于这 一问题的解决。
记每个标本阳性率为 则每个标本为阴性的概 率为Q 1 将N个标本分成n群每群m个标本( N n m) 对于某群一旦检验出阳 性标本就停止剩余标本 的检验(阳性群) 只有对阴性群才需检验 群中所有的m个标本 显然阴性群的概率为 Qm 1 Q m为阳性群的概率 若受检的n个群中有X个阳性群 X / n可作为群为阳性群的概 率估计 有1 Q m X / n Q m 1 X n X n
B(3,0.6)概率函数图
二项分布变量的概率函数图特点: 当π接近0.5时,图形是对称的; π离0.5愈远,对称性愈差,但随着n的增 大,分布趋于对称。
3、二项随机变量X的总体均数和总体标准差 X的均数:
n
X的标准差:
n (1 )
二项分布变量 X / n 的均数和标准差:
4.2 7.3
11.5 13.5 27.1 24.0 12.5 100.0
P0 P1
P2 P3 P4 P5 P6 —
离散型随机变量的可能取值与取这些值的概率间的 一种对应关系,称离散型随机变量的概率分布。
离散型随机变量X的分布列 X P x1 P1 x2 P2 … … xi Pi … …
Pi称为离散型变量X的概率函数
二项随机变量:
B(10,0.6)和B(10,0.5)的样本率分布
X 0 1 2
P=x/n 0.0% 10.0% 20.0%
P(X) 0.6 0.0001 0.0016 0.0106
P(x) 0.5 .0010 .0098 .0439
0.6
P( P 0.2) 0.8989
3
4 5 6 7 8 9
P117 例6-2
正态近似法:利用二项分布的正态近似,当n足够大时, 二项分布变量近似服从正态分布,同理,样本率也近似 服从正态分布。
p ~ N( ,
(1 - )
n
)
p Z ~ N(0,1) (1 ) n
P( p Z / 2 p p Z / 2 p ) 1 S p 估计 p P ( p Z / 2 S p p Z / 2 S p ) 1
Poisson分布
Poisson分布是一种离散型分布,用以描述 罕见事件发生次数的概率分布。 医学人群中的多胞胎、染色体异常,水中细 菌数,空气中的粉尘数,放射性物质在一定 时间内放射出质点数等都是罕见事件。
Poisson分布随机变量:
若某一随机变量X的概率函数为:
P( X k )
e
k
青蛙死亡只数X的概率分布 X P 0 0.16 1 0.48 2 0.36
上述结果实际可用如下关系式表示:
P( X k ) C (1 )
k n k
n k
0<π<1, K=0,1,2,……, n
二项分布:若随机变量X的概率函数为:
P( X k ) C (1 )
Ho : 0.55 H 1 : 0.55
0.05
P( x 9) P( x 9) P( x 10) 0.023257 按 0.05水准拒绝Hห้องสมุดไป่ตู้0接受H 1
正态近似法:当n较大时,利用样本率P(x/n) 的分布近似正态分布的原理,可作样本率与 总体率的比较。公式如下:
例6-3 在观察一种药物对某种非传染性疾 病的治疗效果时,用该药治疗了此种非传 染性疾病患者100人,发现55人有效,试据 此估计该药物治疗有效率的95%可信区 间(45.26%,64.74%)
样本率与总体率的比较
直接法:利用二项分布直接计算有关概率,对样 本率与总体率的差异进行有无统计学意义的比较。 例:据报道,对输卵管结扎了的育龄妇女实施壶腹 部吻合术后,受孕率为0.55。今对10名输卵管结 扎了的育龄妇女实施峡部-崃部吻合术,结果有9 人受孕。问实施峡部-峡部吻合术妇女的受孕率是 否高于壶腹部-壶腹部吻合术?
30.0%
40.0% 50.0% 60.0% 70.0% 80.0% 90.0%
0.0425
0.1115 0.2007 0.2508 0.2150 0.1209 0.0403
.1172
.2051 .2461 .2051 .1172 .0439 .0098
0.5
P( P 0.2) 0.8906
ˆ 1 m 1 则标本阳性概率 的估计值
例 某学者对某一地区的蚊子感染登革热病毒 的流行病学研究中,收集了蚊子标本8000 只,将其分为800个群,每群10只。经检验, 在这800群中发现有12个群是阳性群,问该 地区蚊子登革热病毒感染率是多少?
12 ˆ 1 10 1 1 0.9985 0.0015 800
p
p (1 )
n
式 p
(1 )
n
为频率P(X / n)
的标准差,它反映频率 P 的变异大小;常称 频率P的标准误,它可反映抽样研究中频率的 抽样误差大小。
当π未知时,可用下式得样本率标准误的近似值。
P(1 P) Sp n
S P与 P的关系如何?
k!
λ >0 , K=0,1,2,……
则称X服从参数 为λ 的Poisson分布,记为 X~ Π( λ )
例:已知纯净水中的大肠杆菌数服从Poisson 分布。若某品牌纯净水平均每毫升水含有 大肠杆菌4个,现随机抽查该纯净水样1mL 培养,求培养出1个大肠杆菌的概率? 例:有研究表明,在一般人群中,平均每1万 新生儿中有先天性心脏病者15人。若某地 某年共出生新生儿1.5万,求该地该年有先 天性心脏病的新生儿数为20的概率?设新 生儿中先天性心脏病患者数服从Poisson分 布。
10
100.0%
0.0060
.0010
问题: 1)标准差与标准误有何异同点? 2)何为抽样误差?何为频率的抽样误差?
总体概率的可信区间
A、查表法 B、正态近似法
查表法(精确概率法)
例:某医院对39名前列腺癌患者实施开放手术 治疗,术后有合并症者2人,试估计该手术合 并症发生概率的95%置信区间。 查附表6:百分率的可信区间表
k n k
n k
0<π<1, K=0,1,2,……, n 则称随机变量X服从参数为n, π的二项分布, 记为X ~ B (n, π )或B(X; n, π )
例:临床用针灸治疗某型头痛,有效的概率 为60%,现以该法治疗3例,其中两例有效 的概率是多少?
例:据报道,有10%的人对某药有胃肠道反 应。为考察某厂的产品质量,现任选5人服 用此药。求:2个人有胃肠道反应的概率; 不多于2个人有胃肠道反应的概率。
u
p 0 0 (1 0 )
n
例 一般而言,对某疾病采用常规治疗,其治愈率约为45%。 现改用新的治疗方法,并随机抽取180名该疾病患者进行 了新疗法的治疗,治愈117人。问新治疗方法是否比常规 疗法的效果好?
H 0 : 0.45 H 1 : 0.45 0.05 117 0.45 180 u 5.394 0.45(1 0.45) 180 P 0.0005 按 0.05水准, 拒绝H 0授受H 1
2、二项分布的特征
1)二项分布的图形特征 例4-2 :临床用针灸治疗某型头痛,有效的概 率为60%,现以该法治疗3例,其中两例有效 的概率是多少?
有效人数概率分布 人数 概率 0 0.064 1 0.288 2 0.432 3 0.216
 0.5 Å Ê ¸
0.4 0.3 0.2 0.1 0 0 1 Ð Ð Ó §À ý Ê ý 2 3
累积概率函数:
P( X k )
k x n x
P( X
X 0 n x
k
k)
C (1 )
x 0
由上可知: n次Bernoulli试验中,事件A发生的次数K服从二项 分布。 n次Bernoulli试验有如下特点: A、各次试验结果相互独立; B、每次试验只有二种可能的结果; C、每次试验事件A发生的概率是固定的。
显然,概率函数Pi有如下两个特点:
P ,2,...) i 0(i 1
P
i 1 i
1
问题: 1)对表2-1 :1998年某地96名妇女产前检 查次数这一资料,我们该如何来求其概率函 数Pi呢? 2)给青蛙按每单位体重注射一定剂量的洋 地黄。由以往实验获知,致死的概率为0.6, 存活的概率为0.4。今给2只青蛙注射,求死 亡只数的概率函数。
已知某一 Bernoulli试验中A事件的发生概率为 π ,则在独立重复n次这一Bernoulli试验中, 事件A发生k次的概率为多少。
举例: 给青蛙按每单位体重注射一定剂量的洋地 黄。由以往实验获知,致死的概率为0.6, 存活的概率为0.4。今给2只青蛙注射,求死 亡只数的概率函数。
P(X=0)= 0.4 * 0.4 =0.16 P(X=1)= 0.4 * 0.6 + 0.6 * 0.4 =0.48 P(X=2)= 0.6 * 0.6 =0.36
P(X=0)= 0.4 * 0.4 =0.16 P(X=1)= 0.4 * 0.6 + 0.6 * 0.4 =0.48 P(X=2)= 0.6 * 0.6 =0.36
青蛙死亡只数X的概率分布 X P 0 0.16 1 0.48 2 0.36
此问题的解决,实际可利用二项分布的概率模型。
本章介绍了三种常用的离散型 概率分布模型: •二项分布
>5 合计
12 96
12.5 100.0
96 ——
100.0 ——
对此资料我们可均数、标准差等数值特征指标来概括 资料的特点,均数、标准差可利用原始资料计算。
但更进一步的了解,需知道每一事件所对应的发生概率。
检查次数 频数 频率(%) 概率
0 1
2 3 4 5 >5 合计
4 7
11 13 26 23 12 96
第六章 几种离散型变量的分布及其应用
表2-1 1998年某地96名妇女产前检查次数频数分布
检查次数 0 1 2 3 4 5 频数 4 7 11 13 26 23 频率(%) 4.2 7.3 11.5 13.5 27.1 24.0 累计人数 4 11 22 35 61 84 累计频率(%) 4.2 11.5 22.9 36.5 63.5 87.5