4.1 二项分布的概念和特征

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章 常用概率分布

一、二项分布的概念和特征

概念

分布:随机变量的取值规律 分布函数:描述分布的规律

变量类型

连续型变量

离散型变量 如:正态分布

如:二项分布,泊松分布

思考

例1.假设有5只实验小白鼠,要求它们同种属、同性别、体重 相近,且给小白鼠注射一定剂量的毒物时,他们有相同的死 亡率80%,存活率为20%。那么这5只小白鼠实验后全部死亡 的概率是多少?有一只白小鼠存活的概率是多少?2只小白 鼠存活的概率是多少?

例1.假设有5只实验小白鼠,要求它们同种属、同性别、体重相近, 且给小白鼠注射一定剂量的毒物时,他们有相同的死亡率80%, 存活率为20%。那么这5只小白鼠实验后全部死亡的概率是多少? 有一只白小鼠存活的概率是多少?2只小白鼠存活的概率是多少? P 死

=0.8 P 活

=0.2 P 1

=0.8×0.8×0.8×0.8×0.8 P 2 = P 3 = 1 5

C 2 5

C 0.2×0.8 4 =0.082 0.2 2 ×0.8 3 =0.020 =0.8 5 =0.328

该实验有三个特点:

1.各次实验是彼此独立的;

2.每次实验只有二种可能的结果,或死亡或生存;

3.每次实验小白鼠死亡和生存的概率是固定的。

具备以上三点,即从阳性率为π的总体中随机抽取大小为n的样本, 则出现“阳性”数为X的概率分布即呈现二项分布,记作B(n,p)。

概率分布函数

二项分布的概率函数P (X )可用公式

X n X X

n

C X P - - = ) 1 ( ) ( p p 其中 )!

( ! ! X n X n C X

n - = 对于任何二项分布,总有 ( ) 1

= å = n

X X P

例2.临床上用针灸治疗某型头疼,有效的概率为60%,现以 该疗法治疗3例,其中2例有效的概率是多大?

分析:治疗结果为有限和无效两类,每个患者是否有效不受其他病例的影响,有 效概率均为0.6,符合二项分布的条件。

X n X X

n

C X P - - = ) 1 ( ) ( p p ( ) ( ) 432 . 0 6 . 0 ­ 1 6 . 0 !

2 ­

3 ! 2 ! 3 ) 1 ( 2 ­ 3 2 2 3 2 2

3 ) 2 ( = = - - = p p C P 因此,2例有效的概率是0.432。

二项分布的特征

B (n,p)

n = 3,π = 0.5 n = 10,π = 0.5

π = 0.3时,不同 n 值对应的二项分布

二项分布的特征

1. n,π是二项分布的两个参数,所以二项分布的形状取决于n,π。

2. 当π=0.5时分布对称,近似对称分布。

3. 当π ≠0.5时,分布呈偏态,特别是 n 较小时,π 偏离0.5越远,分 布的对称性越差,但只要不接近1和0时,随着 n 的增大,分布逐 渐逼近正态。

4. 当 π 或 1­ π 不太小,而 n 足够大,通常 nπ 和 n(1­ π) 均大于或 等于5,我们常用正态近似的原理来处理二项分布的问题。

例3.临床上用针灸治疗某型头痛,有效的概率为60%,现以该疗法治疗3例,求有效人 数的均数和方差。

二项分布的均数和标准差

分析:n = 3,p =0.6

0 1 2 3

0.064 0.288 0.432 0.216 根据总体均数(又称数学期望)和方差的定义,有效人数的均数为: ( ) 80 . 1 216 . 0 3 432 . 0 2 288 . 0 1 064 . 0 0 ) ( = ´ + ´ + ´ + ´ = å = X XP X E 方差为: [ ] [ ] 22 222 ()()()()

(0 1.80)0.064(1 1.80)0.288...(3 1.80)0.216 0.72

V a r X E X E X X E X P X =-=- =-´+-´++-´ = å

对于任何一个二项分布B(n,π),如果每次试验出现“阳性” 结果的概率均为π,则在 n 次独立重复实验中,出现 X 次阳 性结果

总体均数为 标准差为

p

m n

=

( )

p

p

s-

= 1

n

二项分布的均数和标准差

如果以率表示,将阳性结果的频率记做为 则P 的总体均数

总体标准差为 式中

是频率P 的标准误,反映阳性频率的抽样误差的大小。 p m = P ( )

n

P p p s - = 1 P s n

X P =

例4. 已知某地钩虫感染率为6.7%,如果随机抽查150人,记 样本钩虫感染率为 P ,求 P 的标准误 。

本例 ,n =150,P =6.7%

% 0 . 2 020 . 0 150

) 067 . 0 1 ( 067 . 0 = = - = P s

小结:

1. 二项分布的条件:

1)每次实验结果,只能是两个互斥的结果之一。

2)相同的实验条件下,每次实验中事件A的发生具有相同的概率π。

3)各次实验独立,各次的实验结果互不影响。

2. 二项分布的分布特征:

1)二项分布的形状取决于n,π。

2)当π =0.5时分布对称,近似对称分布。

3)当π ≠0.5时,分布呈偏态,特别是 n 较小时,π 偏离0.5越远,分布的 对称性越差,但只要不接近1和0时,随着 n 的增大,分布逐渐逼近正态。

相关文档
最新文档