概率论基础第2章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
全概率公式与Bayes 公式的意义
全概率公式 若干原因 Bayes 公式 Bayes 公式在决策理论中有重要应用: 不断根据新得到的信息来修正原来的观点。 结果
例2.1.4 产品元件由三个工厂提供, 数据如下表: 厂家 甲厂 乙厂 丙厂 次品率 0.02 0.01 0.03 所占份额 0.15 0.80 0.05
例2.1.3 (Pólya 模型) 盒中装有b 个黑球与 r 个红球,每次随机取出一 个小球,在放回原球的同时加入 c 个同色球,计算 前 n1次取到黑球、后n2=n-n1次取到红球的概率。 解. 以Ak 表示第 k 次取球时取到黑球,即需要 计算交事件的概率 P(A1…An1An1+1…An); b b+c P(A1) = ⎯⎯ , P(A2|A1) = ⎯⎯⎯ b+r b+r+c b+ (n1-1)c … , P(An1|A1…An1-1) = ⎯⎯⎯⎯⎯ b+r+(n1-1)c
2. 条件概率定义的理解
假定样本空间中包含 N 个样本点,事件 A 包含 Na 个,其中交事件 AB 有Nab个样本点 , 现在已知 A 发生,即是 Na 个样本点中的 某个已发生 ( 究竟是哪个发生我们并不关心 ) ; 这时如果把样本空间缩小成 A 包含的样本点 (一共有 Na 个),其中显然将会有 Nab 个可能 导致随机事件 B 的发生 , 因此 A 发生条件下 B 的条件概率就理解为 Nab / N P(AB) Nab P(B|A) = ⎯⎯ = ⎯⎯⎯⎯ = ⎯⎯⎯ Na Na / N P(A)
A 与它的对立事件构成样本空间的划分, 根据题意, P(A) = 0.004, P(A) = 0.996, P(B|A)=0.95, P(B|A)= 1 - 0.98 = 0.02; 根据 Bayes 公式,检验结果是阳性的 条件下他确实是患者的概率 P(A|B) 0.004×0.95 = ⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯ = 0.160。 0.004×0.95 + 0.996×0.02 □
(1) 根据全概率公式, P(D) = P(A) P(D|A) + P(B) P(D|B) + P(C) P(D|C) = 0.15×0.02 + 0.8×0.01 + 0.05×0.03 = 0.0125 ; (2) 根据 Bayes 公式, P(A) P(D|A) 0.15×0.02 P(A|D) = ⎯⎯⎯⎯⎯ = ⎯⎯⎯⎯ = 0.24 , P(D) 0.0125 同理 P(B|D) = 0.64,P(C|D) = 0.12 。 即这个次品最有可能是乙厂的产品, 反而最不可能是丙厂产品。
Remark (1) A与B,A与B ,A与B,A与B 的相互独立 关系是等价的。即只要有一组成立,其余的 三组也具有相互独立性; (2) 必然事件Ω 、不可能事件φ 与任意 随机事件都相互独立; (3) 如果 P(A) > 0,P(B) > 0,那么 A、B 独立与 A、B 互不相容不能同时成立; (4) 利用“迷信”正确理解事件的独立。
(计算随机事件交事件概率的公式 ) 如果 P(A) > 0,则 P(AB) = P(A) P(B|A) 一般的乘法公式 A1,A2,…,An 是任意 n 个随机事件, 并且 P(A1 A2 … An ) >0 ,则有: P(A1 A2 … An ) = P(A1)×P(A2|A1)×P(A3|A1 A2)×…× P(An-1|A1 A2…An-2)×P(An|A1 A2 … An-1)
□
2.2.2 若干随机事件的相互独立
n 个事件 A1, A2,…, An 称为相互独立, 如果对任意的 2 ≤ k ≤ n ,都有 P(Ai1Ai2…Aik) = P(Ai1)×P(Ai2)×…×P(Aik) 即它们交事件的概率都等于概率的乘积 如果只满足 P(AiAj) = P(Ai)×P(Aj) 则称为它们两两独立。
为什么?
关键原因在于人群中感染比例非常低 假定一共有1000个人,感染率0.004即平均只有 4个感染者,由于P(阳性|感染者)= 0.95 所以阳性 反应的人中真正的患者只有0.95×4 = 3.8个, 另一方面, P(阴性|健康者)= 0.98 说明健康人 中将会有0.02×996 = 19.92个被误诊呈阳性; 在23.72个阳性的人中只有3.8个是真正的患者。
3. 注意区别“条件概率” 与“交事件概率”
条件概率中的“条件”是已经发生的随机事件。 如果没有这个信息,就必须作为交事件处理。 不能把逻辑上的条件误解成条件概率中的条件 思考 盒子里有彩票5张,只有 1 张能中奖,甲、 乙两人顺序各拿走1 张。问有奖彩票被乙取到 的概率是多少?
2.1.2 乘法公式
习题 2.1
1-5. 教材 111 页 第 4 、8、9、11、13 题 。
2.2 事件的独立性
2.2.1 两个事件的独立(Independent)
A、B 是两个随机事件,如果满足: P(AB) = P(A) P(B) 则称随机事件 A 与 B 相互独立。 事件独立的另一种理解: P(B|A) = P(B)
□
“缩小样本空间”计算条件概率 例2.1.1的简单解法: 既然第一次已经取走一个黑球,而第二次是 从剩下的 4 个小球里随机取一个,有 2 个黑球 和 2 个白球,所求条件概率就是 2/4 = 0.5 。 练习2.1.2 假定随机选取出一个有 3 个小孩的家庭, 已知有 1 个女孩,问这个家庭至少有一个 男孩的概率。
②
P(A) 有两种不同的解法,依赖于如何 去构造样本空间 Ω 。
解法一: 以两次抽样的结果来构造样本空间 (需要考虑顺序),样本空间中的样本点总数 是 P52 = 20 ;根据乘法原理,“第一次取出 的是黑球”包含的样本点个数有 3×4 = 12 , 因此 P(A) = 12/20 = 0.6 ; 解法二:以第一次抽样的结果来构造样本空间, 从 5 个小球(包含 3 个黑球) 中随机取出一个, 因此 P(A) = 3/5 = 0.6 。 所以 P(B|A) = 0.3/0.6 = 0.5 。
例2.2.3 (Bernstein 反例) 盒中有4 个小球,其中三个小球分别标上数字 1,2,3,另一个小球同时标上这三个数字。 记 Ak = { 随机取出的一个小球上有数字 k }。 解. 显然有 P(A1) = P(A2) = P(A3) = 0.5; P(A1A2) = P(A2A3) = P(A1A3) = 0.25; 但是 P(A1A2A3) = 0.25,即这三个事件 两两独立但是并不相互独立。
r P(An1+1|A1…An1) = ⎯⎯⎯⎯ , b+r+n1c r+c P(An1+2|A1… An1An1+1) = ⎯⎯⎯⎯⎯ , b+r+(n1+1)c r+ (n2-1) c P(An|A1… An1An1+1… An-1) = ⎯⎯⎯⎯⎯ ; b+r+(n-1)c 所求概率为
k =0 k =0 p = ⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯ n −1
设事件列{Ak}是样本空间的一个划分, 则对于任意事件 B,
2. 全概率公式
P( B ) = ∑ P( Ak )P( B | Ak )
k =1 ∞
3. Bayes公式
对任意的 m ≥ 1, P(Am|B) = ⎯⎯⎯⎯⎯⎯⎯ ∞
P(Am) P(B|Am)
k
∑ P( A )P( B | A )
k =1 k
例2.2.1 在3个黑球、2个白球中取两次、每次取 一个小球,以A、B 表示第一次、第二次取到 的是黑球。 在例题2.1.1中讨论了无放回取球的情况: P(A) = P(B) = 0.6, P(AB) = 0.3, 即无放回取小球时A、B不独立。 如果有放回取球,仍有P(A) = P(B) = 0.6, 根据随机抽样模型的结论或者直接以可重复 排列构造样本空间,都可以计算出 P(AB) = 3×3/52 = 0.36, 即有放回取小球时A、B是独立的。 □
例2.1.1 盒中装有 3 个黑球和 2 个白球,无放回 接连取两个小球,已知第一次取出的是黑球, 问第二次也取出黑球的概率是多少? 解. 分别用 A、B 表示两个随机事件: A = {第一次取出的是黑球}, B = {第二次取出的是黑球}; 问题转化为计算条件概率 P(B|A) , 根据定义,需要求出 P(AB) 与 P(A) 。 ① 交事件AB 含义是“ 从 3 个黑球和 2 个白球 的 5 个小球中无放回地接连取出两个,取到 的都是黑球”,因此根据随机抽样的模型, P(AB) = C32×C20/C52 = 0.3 ;
□
利用独立性计算和事件的概率 A1 ,… ,An 是 n 个相互独立的随机事件, 则有:P{A1∪A2 ∪…∪An }
∏ (b + kc ) × ∏ (r + kc )
∏ (b + r + kc )
k =0
n1 −1
n2 −1
□
百度文库
2.1.3 全概率公式与Bayes公式
1. 样本空间的划分
如果一列随机事件A1,A2,… 满足: (1) Ai∩Aj = φ , 对所有的 i ≠ j , (2) A1+A2+… = Ω ; 则称 A1,A2,…是样本空间Ω 的一个划分。 例如 A - B、B - A、AB、A∪B 构成样本空间Ω 的一个划分。
例2.2.2 抛掷均匀硬币三次,A ={第一次出现 正面 } 与B={前两次结果相同 } 是否独立? 解. 根据古典概率模型,显然有 P(A) = 0.5, P(B) = 0.5; 交事件AB 的含义是前两次都抛出正面, 因此 P(AB) = 0.25,所以抛掷硬币三次, 前两次抛掷的结果是否相同与第一次抛掷 时究竟出现正面还是反面没有关系。
(1) 随机从仓库取一件,求取到次品的概率; (2) 如果取到次品,最可能是来自哪个工厂 的产品?最不可能的又是哪个工厂的?
解. 以 A、B、C 分别表示取到的这个元件 来自工厂甲、乙、丙,D 表示这个元件是 次品。显然A、B、C 构成样本空间的划分。 把题目给出的有关数据转化成符号: P(A) = 0.15, P(B) = 0.8, P(C) = 0.05 ; P(D|A) = 0.02, P(D|B) = 0.01,P(D|C) = 0.03 . 需要计算 P(D),以及比较三个条件概率: P(A|D),P(B|D),P(C|D) 的大小。
第2章 条件概率与统计独立
2.1 2.2 2.3 2.4 条件概率与三个公式 事件的独立性 Bernoulli 概率模型 二项分布与Poisson分布
东北大学数学系
2.1 条件概率与三个公式
2.1.1 条件概率
已知一个事件发生而另一个事件的概率 A、B 是两个随机事件,如果 P(A) > 0 , 则定义: P(AB) P(B|A) = ⎯⎯⎯ P(A) 是随机事件 A 发生的条件下 随机事件 B 发生的条件概率。
1. 条件概率的性质
它满足概率的所有性质与计算公式, 只需要把条件添加在相应的公式后即可。 例如, 0 ≤ P(B|A) ≤ 1 ; P(B∪C|A) = P(B|A) + P(C|A) - P(BC|A) ; P(B|A) = 1 - P (B|A) 等等。 事实上,无条件概率可以看成是 条件概率的特例: P(B) = P(B|Ω )
□
“先验概率” 与 “后验概率” 厂家 甲厂 乙厂 丙厂 次品率 0.02 0.01 0.03 所占份额 0.15 0.80 0.05 条件概率 0.24 0.64 0.12 后验概率:有 新信息以后对 过去认识的修正
先验概率:过去 的经验或知识
例2.1.5 假定一种病毒在某地人群中的感染率 是 0.004 。检查时由于技术及操作过程可能 失误等原因,使得感染者未必有阳性反应而 健康者也可能呈现出阳性。如果有一种检验 方法的效果是: P(阳性|感染者)= 0.95,P(阴性|健康者)= 0.98; 现在对这一地区进行随机抽查,某人的检查 结果是阳性,问他的确就是病毒感染者的概率 是多少? 解. 以 A 记这个人的确是感染者,B 表示 检查结果呈阳性;需要计算 P(A|B)。