(完整word版)贝叶斯决策的经典例题练习

合集下载

贝叶斯决策例题(精选.)

贝叶斯决策例题(精选.)

例:某工程项目按合同应在三个月内完工,其施工费用与工程完工期有关。

假定天气是影响能否按期完工的决定因素,如果天气好,工程能按时完工,获利5万元;如果天气不好,不能按时完工,施工单位将被罚款1万元;若不施工就要付出窝工费2千元。

根据过去的经验,在计划实施工期天气好的可能性为30%。

为了更好地掌握天气情况,可以申请气象中心进行天气预报,并提供同一时期天气预报资料,但需要支付资料费800元。

从提供的资料中可知,气象中心对好天气预报准确性为80%,对坏天气预报准确性为90%。

问如何进行决策。

解:采用贝叶斯决策方法。

(1)先验分析根据已有资料做出决策损益表。

根据期望值准则选择施工方案有利,相应最大期望收益值EMV*(先)=0.8(2)预验分析完全信息的最大期望收益值:EPPI=0.3×5+0.7×(-0.2)=1.36(万元)完全信息价值: EVPI=EPPI- EMV*(先)=1.36-0.8=0.56(万元)即,完全信息价值大于信息成本,请气象中心进行预报是合算的。

(3)后验分析①补充信息:气象中心将提供预报此时期内两种天气状态x 1(好天气)、x 2(坏天气)将会出现哪一种状态。

从气象中心提供的同期天气资料可得知条件概率: 天气好且预报天气也好的概率 P (x 1/θ1)=0.8 天气好而预报天气不好的概率 P (x 2/θ1)=0.2 天气坏而预报天气好的概率 P (x 1/θ2)=0.1 天气坏且预报天气也坏的概率 P (x 2/θ2)=0.9②计算后验概率分布:根据全概率公式和贝叶斯公式,计算后验概率。

预报天气好的概率1111212()()(/)()(/)P x P P x P P x θθθθ=+=0.31预报天气坏的概率2121222()()(/)()(/)P x P P x P P x θθθθ=+=0.69 预报天气好且天气实际也好的概率:111111()(/)(/)()P P x P x P x θθθ⋅==0.3×0.8/0.31=0.77预报天气好而天气坏的概率:212211()(/)(/)()P P x P x P x θθθ⋅==0.7×0.1/0.31=0.23预报天气坏而实际天气好的概率:121122()(/)(/)()P P x P x P x θθθ⋅==0.3×0.2/0.69=0.09预报天气坏且实际天气也坏的概率: 222222()(/)(/)()P P x P x P x θθθ⋅==0.7×0.9/0.69=0.91上述计算可以用表格表示:③ 后验决策:若气象中心预报天气好(x1),则每个方案的最大期望收益值 E(d1/x1)=0.77×5+0.23×(-1)=3.62 E(d2/x1)=0.77×(-0.2)+0.23×(-0.2)=-0.2选择d1即施工的方案,相应在预报x1时的最大期望收益值E (X1)=3.62若气象中心预报天气不好(x2),各方案的最大期望收益值 E(d1/x2)=0.09×5+0.91×(-1)=-0.46 E(d2/x2)=0.09×(-0.2)+0.91×(-0.2)=-0.2选择d2即不施工的方案,相应在预报x2时的最大期望收益值E (X2)=-0.2④ 计算补充信息的价值:得到天气预报的情况下,后验决策的最大期望收益值:1122*()()()()()EMV P x E x P x E x =⋅+⋅后=0.31×3.62+0.69×(-0.2)=0.9842则补充的信息价值为:EMV*(后)-EMV*(先)=0.9842-0.8=0.1842补充信息价值大于信息费(800元),即这种费用是合算的。

贝叶斯公式典型例题

贝叶斯公式典型例题

贝叶斯公式典型例题
贝叶斯公式是一种计算条件概率的公式,常用于根据已知条件更新某个事件发生的概率。

下面是一个贝叶斯公式的典型例题:
例:假设有两种类型的围棋棋手,分别是专业棋手和业余棋手。

专业棋手在比赛中获胜的概率为0.9,而业余棋手获胜的概率为0.3。

已知在所有棋手中,专业棋手占70%,业余棋手占30%。

现在有一场比赛,我们只知道其中一位棋手获胜了,那么这位棋手是专业棋手的概率是多少?
解:首先,我们定义以下事件:
•A:棋手是专业的
•B:棋手获胜
根据题意,我们知道:
•P(A) = 0.7(专业棋手占比)
•P(¬A) = 0.3(业余棋手占比)
•P(B|A) = 0.9(专业棋手获胜的概率)
•P(B|¬A) = 0.3(业余棋手获胜的概率)
我们要找的是P(A|B),即在已知棋手获胜的条件下,棋手是专业的概率。

根据贝叶斯公式,我们有:
P(A|B) = \frac{P(A) \times P(B|A)}{P(A) \times P(B|A) + P(¬A) \times P(B|¬A)}将已知的概率值代入公式中,我们得到:
P(A|B) = \frac{0.7 \times 0.9}{0.7 \times 0.9 + 0.3 \times 0.3} = \frac{0.63}{0.63
+ 0.09} = \frac{0.63}{0.72} = 0.875
所以,在已知棋手获胜的条件下,这位棋手是专业棋手的概率为0.875。

这个例题展示了贝叶斯公式在更新条件概率方面的应用。

通过已知的概率值和贝叶斯公式,我们可以计算出在给定条件下的未知概率。

第五章贝叶斯估计例题

第五章贝叶斯估计例题

第五章贝叶斯估计例题
第五章贝叶斯估计例题:
这是一个关于抽样分析的贝叶斯估计问题。

考虑总体N及其未知
的总体参数θ,设定如下模型:
在集合A中,X~Binomial(n,θ),θ~Beta(α,β) , α>0, β>0
在本题中,要求求出θ的贝叶斯估计量。

首先,设定一个合理的先验分布,记作π(θ),π(θ)~beta(α,β),∵α>0, β>0,所以可知α=1, β=1.
之后再计算条件概率分布P(A|θ),即根据已知条件求得θ的后
验分布,此时
P(θ|A)=P(A|θ)π(θ)/P(A)=P(A|θ)π(θ)
由此可知
P(θ|A)=P(A|θ)π(θ)=[θ^x(1-θ)^(n-x)]*[Beta(θ;
α,β)]/P(A)
最后再根据后验分布的表示式,计算后验期望值E(θ|A), 即为贝
叶斯估计量
E(θ|A)=∫θ·P(θ|A)dθ
由此计算,考虑到先验分布π(θ)的特殊形式,可知
E(θ|A)=(x+α)/(n+α+β)
因此,求得θ的贝叶斯估计量为:(x+α)/(n+α+β)。

贝叶斯决策方法课后习题

贝叶斯决策方法课后习题

1.什么叫贝叶斯决策?如何进行贝叶斯决策?风险型决策方法是根据预测各种事件可能发生的先验概率,然后再采用期望值标准或最大可能性标准来选择最佳决策方案。

这样的决策具有一定的风险性,因为先验概率是根据历史资料或主观判断所确定的概率,未经试验证实,为了减少这种风险,需要较准确的掌握和估计这些先验概率。

这就要通过科学实验,调查,统计分析等方法获得较为准确的情报信息,以修正先验概率,并据以确定各方案的期望损益值,拟订可供选择的决策方案,协助决策者做出正确的决策。

一般来说,利用贝叶斯定理要求得后验概率,据以进行决策的方法称为贝叶斯决策方法。

贝叶斯决策方法步骤:(1)进行预后验分析,决定是否值得搜集补充资料以及从补充资料中可能得到的结果和如何决定最优对策。

(2)收集补充资料,取得条件概率,包括历史概率和逻辑概率,对历史概率要加以检验,辨明其是否适合计算后验概率。

(3)用概率的乘法定理计算联合概率,用概率的加法定理计算边际概率,用贝叶斯定理计算后验概率。

(4)用后验概率进行决策分析。

2.如何进行预后验分析和后验分析?预后验分析是后验概率决策分析的一种特殊形式的演算,这里的特殊形式是指用一套概率对多种行动策略组合进行多次计算,从中择优。

预后验分析有两种形式,一是扩大型,预后验分析,这实际上是一种反推决策树分析,二是常规型预后验分析,这实际上是一种正向分析,用表格形式进行。

扩大型分析要解决的问题是搜集追加信息对决策者有多大的价值,如果试验应采取什么行动策略,常规型分析要解决的问题是,如果试验应采取什么行动策略,但是这两种分析方法所得出的结论是一致的。

根据预后验分析,如果认为采集信息和进行调查研究是值得的,那么就应该决定去做这项工作。

一旦取得了新的信息,决策者就结合这些新信息进行分析,计算各种方案的期望损益值,选择最佳的行动方案,结合运用这些信息并修正先验概率,称为后验分析,这正是发挥贝叶斯决策理论威力的地方。

3.什么是先验分析?先验分析就是决策者要详细列出各种自然状态及其概率,各种备选行动方案与自然状态的损益值,并根据这些信息对备选方案作出抉择的决策过程,当时间,人力和财力不允许搜集更完备的信息时,决策者往往用这类方法进行决策,在贝叶斯决策中,先验分析是进行更深入分析的必要条件。

(完整word版)习题与解答2条件概率+全概率贝叶斯概率

(完整word版)习题与解答2条件概率+全概率贝叶斯概率

习题2:条件概率与全概率、贝叶斯概率一、 条件概率与乘法公式 P20:A3,4;B5;1.据统计,某市发行A ,B ,C ,3种报纸,订阅情况为:()0.6,(|)0.5,(|)0.3(|)0.5,P C P B C P A BC P A C ====, 求订阅A 和C 报但不订阅B 报的概率. 解:()()(|)0.3,()()1(|)0.3P AC P C P A C P BC P C P B C ⎡⎤===-=⎣⎦()()(|)0.30.50.15.P ABC P BC P A BC ==⨯=()()()0.30.150.15.P ABC P AC P ABC =-=-=2. 已知()1/4,(|)1/3,(|)1/2,P A P B A P A B ===求(|)P A A B U .解:1()1()()(|).().12(|)6P AB P AB P A P B A P B P A B ====1()()34(|)111()()()()44612P A P A P A A B P A B P A P B P AB ====+-+-U U 二、 全概率P23:A5,6;4. 某人去外地参加会议,乘火车,汽车,飞机的概率分别为0.3,0.2,0.5 . 若乘飞机,不会迟到,若乘火车和汽车,则迟到的概率分别为0.1和0.2,求最终不迟到的概率.解:设A 1=“乘火车”,A 2=“乘汽车”,A 3=“乘飞机”,B=“不迟到”,123123()0.3,()0.2,()0.5,(|)0.9,(|)0.8,(|)1.P A P A P A P B A P B A P B A ======31()()(|)0.30.90.20.80.510.93.i i i P B P A P B A ===⨯+⨯+⨯=∑5. 将两信息分别编码为A 和B 传递出去,接收站收到时,A 被误收为 B 的概率为 0.02,B 被误收为A 的概率为0.01,信息 A 与 B 传递的频繁程度比为3:2. 求接收站收到的信息为B 的概率为多少?解:设A=“发送信息A ”,B=“接收信息B ”,()0.6,(|)0.02,(|)0.01,P A P B A P B A ===()()(|)()(|)0.60.020.40.990.408.P B P A P B A P A P B A =+=⨯+⨯=三、 贝叶斯概率P26:A2, 3,5;6. 一批零件,合格品占92%,一检验员随机地取一件进行检验,合格品误检为不合格品的概率是0.05,而不合格品误检为合格的概率是0.1,求当产品检为合格时,实际取的是不合格品的概率.解:设A=“取到合格品”,B=“检验为合格品”,()0.92,(|)0.05,(|)0.1,P A P B A P B A ===()(|)0.080.1(|)0.009.0.920.950.080.1()(|)()(|)P A P B A P A B P A P B A P A P B A ⨯===⨯+⨯+ 7. 某公司从四家厂购入同一产品,数量之比为9:3:2:1,已知四家厂次品率分别为1%,2%,3%,1%,现随机取到一件次品,问该次品是哪家的责任最大?解:设A i =“第i 家厂的产品”,B=“次品”,123412349321(),(),(),(),15151515(|)0.01,(|)0.02,(|)0.03,(|)0.01.P A P A P A P A P B A P B A P B A P B A ========41932122()()(|)0.010.020.030.01.151515151500i i i P B P A P B A ===⨯+⨯+⨯+⨯=∑ 111234()(|)9661(|),(|),(|),(|).()22222222P A P B A P A B P A B P A B P A B P B ===== 答:由四个贝叶斯概率可知第一家责任最大。

贝叶斯博弈例题及答案

贝叶斯博弈例题及答案

贝叶斯博弈例题及答案在游戏理论中,贝叶斯博弈是一个重要的概念,它是游戏理论在实际应用中使用博弈模型考虑比较复杂系统中的市场行为。

在贝叶斯博弈中,每位参与者都有一定的概率估计其未知变量的状态。

在这种情况下,每个参与者都将利用这些估计的概率,以某种程度上有利于其自身的方式玩游戏。

贝叶斯博弈也可以用于分析多个玩家或者博弈者之间的交互行为,并评估玩家的决策是否是最优的,以及如果有必要的话,改善玩家的行为。

下面我们将介绍一些典型例题,以便大家来学习和理解贝叶斯博弈。

例题一:假设Alice和Bob正在玩一个回合制的博弈游戏,其中Alice有攻击和防守两种行为,Bob有反击和缩减两种行为,他们同时选择行为时,Alice的最终的分数等于Alice的行为加上Bob的反击和Bob 的缩减。

答案:一般情况下,Alice和Bob之间的贝叶斯博弈是一个多阶段博弈模型,Alice首先选择行为,随后Bob选择反击和缩减,之后Alice计算最终得分(Alice的行为加上Bob的反击和缩减)。

Alice 在决定行动时,可以根据Bob的行为应用贝叶斯博弈模型来估计Bob 会怎么反应,从而决定自己使用什么样的行动。

同样,Bob也可以应用贝叶斯博弈模型,估计Alice的行为来决定自己的行动。

例题二:现在Alice和Bob正在玩一个抢夺食物的游戏,游戏中Alice和Bob可以选择攻击或逃跑,如果Alice攻击了Bob,而Bob却逃跑了,Alice将获得所有的食物;如果Alice逃跑了,而Bob攻击了Alice,那么Bob将获得所有的食物;如果两者都攻击,则每人都获得一半的食物。

答案:在这种情况下,Alice和Bob可以用贝叶斯博弈模型推断彼此的行为,来决定自己的行动。

Alice可以根据Bob的行动准确预测Bob会选择什么样的行动,来决定自己是攻击还是逃跑;Bob也可以根据Alice的行动准确预测Alice会选择什么样的行动,来决定自己是攻击还是逃跑。

贝叶斯博弈例题

贝叶斯博弈例题

贝叶斯博弈例题
贝叶斯博弈是一种非常具有挑战性的统计学原理,它主要关注一对对手之间的策略比较和定量比较,以挖掘优势和弊端,最终实现更优的博弈结果。

在游戏研究中,贝叶斯博弈是解决博弈结果的有效策略,它不仅可以挖掘双方的策略优势,还能提出强势的策略以实现获胜的可能性。

本文以一个实际的贝叶斯博弈例题为基础,分析其应用的原理及方法,力求指导解决类似例题的步骤及技巧。

例题:一位男子有一次机会抽取一样物品,可供抽取的物品有A、B、C,男子假设其中有一个物品比较珍贵,价值最高,请用贝叶斯博弈确定他要抽取哪一样?
- 1 -。

贝叶斯纳什均衡例题

贝叶斯纳什均衡例题

贝叶斯纳什均衡例题
贝叶斯纳什均衡 (Bayesian Nash Equilibrium) 是一种非合作的博弈理论。

在贝叶斯纳什均衡中,每个参与者根据其他参与者的策略和历史数据,计算出自己在给定其他参与者的策略下的最大收益,并采取最优策略。

以下是一个贝叶斯纳什均衡的例题。

假设有三个人,分别是 A、B、C,他们玩一个猜拳游戏。

游戏规则如下:
1. A 和 B 随机猜拳,胜负概率均为 50%。

2. 如果 A 和 B 获胜,则 C 获胜的概率为 25%。

3. 如果 A 和 B 失败,则 C 获胜的概率为 75%。

现在问,谁是游戏的胜者,如果 A 和 B 采取随机策略,而 C 采取最优策略。

根据贝叶斯纳什均衡的定义,我们需要计算出每个参与者在给定其他参与者策略下的最优策略。

首先,对于 A 和 B,由于他们是随机的,所以可以采取任何策略,因此他们的最优策略是随机。

其次,对于 C,他需要计算出自己在 A 和 B 随机策略下的最大收益。

根据游戏规则,如果 A 和 B 随机,则 C 的最大收益为 25%。

因此,C 的最优策略是采取赢的概率为 25% 的拳法。

最后,由于 C 已经采取了最优策略,A 和 B 将不得不采取随机策略。

因此,游戏的胜者是 C。

需要注意的是,贝叶斯纳什均衡只适用于非合作的博弈理论。

在合作博弈中,参与者之间的策略选择需要基于信任和相互利益。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、贝叶斯决策(Bayes decision theory)
【例】某企业设计出一种新产品,有两种方案可供选择:—是进行批量生产,二是出售专利。

这种新产品投放市场,估计有3种可能:畅销、中等、滞销,这3种情况发生的可能性依次估计为:0.2,0.5和0.3。

方案在各种情况下的利润及期望利润如下表。

企业可以以1000元的成本委托专业市场调查机构调查该产品销售前景。

若实际市场状况为畅销,则调查结果为畅销、中等和滞销的概率分别为0.9、0.06和0.04;若实际市场状况为中等,则调查结果为畅销、中等和滞销的概率分别为0.05、0.9和0.05;若实际市场状况为滞销,则调查结果为畅销、中等和滞销的概率分别为0.04、0.06和0.9。

问:企业是否委托专业市场调查机构进行调查?
解:
1.验前分析:
记方案d1为批量生产,方案d2为出售专利
E(d1)=0.2*80+0.5*20+0.3*(-5)=24.5(万元)
E(d2)=40*0.2+7*0.5+1*0.3=11.8(万元)
记验前分析的最大期望收益为E1,则E1=max{E(d1),E(d2)}=24.5(万元)
因此验前分析后的决策为:批量生产
E1不作市场调查的期望收益
2.预验分析:
(1)设调查机构调查的结果畅销、中等、滞销分别用H1、H2、H3表示
由全概率公式
P(H1)=0.9*0.2+0.06*0.5+0.04*0.3=0.232
P(H2)=0.05*0.2+0.9*0.5+0.05*0.3=0.475
P(H3)=0.04*0.2+0.06*0.5+0.9*0.3=0.308
(2)由贝叶斯公式有
P(Ɵ1|H1)=0.9*0.2/0.232=0.776
P(Ɵ2|H1)=0.06*0.5/0.232=0.129
P(Ɵ3|H1)=0.04*0.3/0.232=0.052
P(Ɵ1|H2)=0.05*0.2/0.475=0.021
P(Ɵ2|H2)=0.9*0.5/0.475=0.947
P(Ɵ3|H2)=0.05*0.3/0.475=0.032
P(Ɵ1|H3)=0.04*0.2/0.308=0.026
P(Ɵ2|H3)=0.06*0.5/0.308=0.097
P(Ɵ3|H3)=0.9*0.3/0.308=0.877
(3)用后验分布代替先验分布,计算各方案的期望收益值
a)当市场调查结果为畅销时
E(d1|H1)=80* P(Ɵ1|H1)+20* P(Ɵ2|H1)+(-5)* P(Ɵ3|H1)
=80*0.776+20*0.129+(-5)*0.052=64.4(万元)
E(d2|H1)=40* P(Ɵ1|H1)+7* P(Ɵ2|H1)+1* P(Ɵ3|H1)
=40*0.776+7*0.129+1*0.052=31.995(万元)
因此,当市场调查畅销时,最优方案是d1,即批量生产
b)当市场调查结果为中等时
E(d1|H2)=80* P(Ɵ1|H2)+20* P(Ɵ2|H2)+(-5)* P(Ɵ3|H2)=20.46(万元)
E(d2|H2)=40* P(Ɵ1|H2)+7* P(Ɵ2|H2)+1* P(Ɵ3|H2)
=40*0.021+7*0.947+1*0.032=7.501(万元)
所以市场调查为中等时,最优方案是:d1,即批量生产
c)当市场调查结果为滞销时
E(d1|H3)=80* P(Ɵ1|H3)+20* P(Ɵ2|H3)+(-5)* P(Ɵ3|H3)
=80*0.026+20*0.097+(-5)*0.877=-0.365(万元)
E(d2|H3)=40* P(Ɵ1|H3)+7* P(Ɵ2|H3)+1* P(Ɵ3|H3)
=40*0.026+7*0.097+1*0.877=2.596(万元)
因此市场调查为滞销时,最优方案是:d2,即出售专利
(4)通过调查,该企业可获得的收益期望值为
E2= E(d1|H1)* P(H1)+ E(d1|H2)* P(H2)+ E(d2|H3)* P(H3)
=64.4*0.232+20.46*0.475+2.596*0.308=25.46(万元)通过调查,该企业收益期望值能增加
E2-E1=25.46-24.5=0.96(万元)
因此,在调查费用不超过0.96万元的情况下,应进行市场调查
3.验后分析
(1)本题中调查费用1000<9600,所以应该进行市场调查
(2)当市场调查结果为畅销时,选择方案1,即批量生产
(3)当市场调查结果为中等时时,选择方案1,即批量生产
(4)当市场调查结果为滞销时,选择方案2,即出售专利。

相关文档
最新文档