博弈游戏简介.ppt
博弈
奶酪,自己跳进吊桶下到井里去吃奶酪,一 只狼从井口经过,狐狸骗狼下到井里,狼有 许多做法,你认为什么做法最好呢?狼可以 识破狐狸的骗术对它置之不理,或者将另一 只吊桶放上石头救出狐狸;狼没能识破狐狸 的骗术,它可以跳下井直接吃奶酪,或者进 到另一只吊桶里下井吃奶酪。狐狸没骗到狼 和骗到狼都有可能获救和等死。
很快这件事在部队传开了,从此再也没有哨
兵睡觉的事情发生了。这正是拿破仑的高明 之处,他没有急着喊醒哨兵,更没有摆出领 导者的架子破口大骂,大声训斥。假如他当 面责备士兵后果只能是增加士兵的反抗意识, 降低他本人在士兵中的威信,削弱军队的战 斗力。攻人之恶勿太严,应思其堪受。不要 因为一点轻微的过错而去责难别人,如果不 是原则问题不妨小而化之。倘若一再地求全 责备而不肯宽容别人,这样的人注定没有朋 友。
成功没有任何秘诀,而取决于你对成功的态
度,只要你对成功抱有希望,你任何时候都 可能成功。世界上的事往往都是这样的,当 你眼看山穷水尽,认为自己已经没有希望的 时候,常常会峰回路转,柳暗花明,所谓否 极泰来就是这个道理。
公平不是平均
公平的分配指的不是平均性分配,也不是双
方都满意的分配,而是合理分配。譬如:两 个人分一块蛋糕,用什么样的方法最公平, 两个人都能接受这种分法?
社会不会等待你成长,学会与社会和解
在社会中要想与社会和解,你必须
做到: 1、要有居安思危的心态 2、培养知足常乐的心态 3、训练宽容待人的心态 4、养成换位思考的心态
以上是我个人的一点体会,现拿出有一个智者
知道成功的秘密。于是他就去找智者,经过漫 长而艰苦的跋涉后,年轻人终于找到了智者。 “大师,我请求你教我如何成功的秘诀吧!” 年轻人说。“你想获得成功就跟我来吧!”智 者答道。智者并没有理睬年轻人的反应,自己 先走到了海边,年轻人立即跟随智者。智者继 续往前走,直到走进大海。突然智者将年轻人 的头按在了水里,年轻人拼命地挣扎,最后跑 回了岸边,大口地喘着气。“蠢货,你想淹死 我吗?”年轻人愤怒地嚷道。“如果你希望获 得成功的愿望像是要呼吸到空气这样强烈,你 早就已经找到成功的秘密了”
博弈模型简介26页PPT文档
在位者想保持自己的垄断地位,所以就要阻 挠进入者进入。
这个博弈中,进入者有两种策略选择:进入 或不进入;在位者也有两种策略:默许或斗 争。
模型5
市场进入阻挠博弈
进 入 进入 者 不进入
在位者 合作 (40,50) (0,300)
什么是博弈论(2)
另一方面,在游戏参加者的初始条件基本相 同的游戏中,如棋类游戏,策略选择的好坏 则更是决定游戏胜负的惟一因素。
综上所述,由于身体素质等固有条件早已存 在或不可改变,而运气又非游戏参与者可以 控制,因此游戏中真正值得研究的是其中的 策略(计谋)问题!
什么是博弈论(3)
许多游戏都有如下共同的特征: (1)都有一定的规则; (2)都有一个结果; (3)策略至关重要; (4)策略有相互依存性。
公共产品的供给
模型2
智猪博弈(boxed pigs game)
猪圈里圈着两头猪,一头大猪,一头小猪。
猪圈的一头有一个猪食槽,另一头安装着一 个按钮,控制着猪食的供应。按一下按钮,8 个单位的猪食进槽,但需要支出2个单位的成 本。
若大猪先到,大猪吃到7个单位,小猪只能吃 到1个单位;若小猪先到,大猪和小猪各吃到 4个单位;若两猪同时到,大猪吃到5个单位, 小猪吃到3个单位。
因此,在均衡状态,一定存在鹰派和鸽派这 两种类型的某个混合比例。
鹰-鸽博弈的求解(2)
假设种群中鹰派的比例是p,则一个鹰派遇见 另一个鹰派的概率是p,而遇见一个鸽派的概 率是1-p。
基于此,鹰派的期望收益是: H=-2p+4(1-p) 而鸽派的期望收益为 D=2(1-p)
博弈论PPT课件
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
组合博弈入门ppt课件-文档资料
蔡尚真 Tel:609787
什么是组合游戏——
(1) 有两个玩家; (2) 游戏的操作状态是一个有限的集合(比如: 限定大小的棋盘); (3) 游戏双方轮流操作; (4) 双方的每次操作必须符合游戏规定; (5) 当一方不能将游戏继续进行的时候,游戏 结束,同时,对方为获胜方; (6) 无论如何操作,游戏总能在有限次操作后 结束;
必败(必胜)点属性
(1) 所有终结点是必败点(P点); (2) 从任何必胜点(N点)操作,至少有 一种方法可以进入必败点(P点); (3)无论如何操作, 从必败点(P点)都 只能进入必胜点(N点).
练习:
能取的集合 S = {1, 3, 4}
x : 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14… Pos: P N P N N N N P N P N N N N P…
多堆或多子游戏
SG+尼姆博奕
各堆各自用SG,再用尼姆博弈 hdu1848
//使用求解SG来求解 #include <iostream> using namespace std; int aaa[1000000]; const int MAX=1010; int a[21],SG[MAX]; void get2() { int i; a[0]=1; a[1]=2; for(i=2;i<20;i++) { a[i]=a[i-1]+a[i-2]; } } int getSG(int n) { int i; int m; if (n==0) { return 0; } bool mex[MAX]={0}; for(i=0;;i++) { m=n-a[i]; if (m<0) { break; } if (SG[m]==-1) { SG[m]=getSG(m); } mex[SG[m]]=true; } for (i=0;;i++) { if (!mex[i]) { break;
组合博弈入门ppt课件
威佐夫博奕(Wythoff Game)
有两堆各若干个物品,两个人轮流从某 一堆或同时从两堆中取同样多的物品,规 定每次至少取一个,多者不限,最后取光 者得胜。
威佐夫博奕(Wythoff Game)
这种情况下是颇为复杂的。我们用 (ak,bk)(ak ≤ bk ,k=0,1,2,…,n)表示 两堆物品的数量并称其为局势,如果甲面 对(0,0),那么甲已经输了,这种局势我 们称为奇异局势。前几个奇异局势是:(0, 0)、(1,2)、(3,5)、(4,7)、(6, 10)、(8,13)、(9,15)、(11,18)、 (12,20)。。可以看出,a0=b0=0,ak是未在 前面出现过的最小自然数,而 bk= ak + k
SG函数性质
所有的terminal position所对应的顶点, 也就是没有出边的顶点,其SG值为0,因为 它的后继集合是空集。然后对于一个g(x)=0 的顶点x,它的所有后继y都满足g(y)!=0。对 于一个g(x)!=0的顶点,必定存在一个后继y 满足g(y)=0。
那么当g(x)=0时的点其实就是必败点, 否则为必胜点。
威佐夫博奕(Wythoff Game)
假设面对的局势是(a,b),若 b = a,则同时 从两堆中取走 a 个物体,就变为了奇异局势(0, 0);如果a = ak ,b > bk,那么,取走b – bk个物 体,即变为奇异局势;如果 a = ak , b < bk ,则同 时从两堆中拿走 ak – a[b – ak])个物体,变为奇异 局势( a[b – ak] , a[b – ak]+ b – ak);如果a > ak , b= ak + k,则从第一堆中拿走多余的数量a – ak 即 可;如果a < ak ,b= ak + k,分两种情况,第一种, a=aj (j < k),从第二堆里面拿走 b – bj 即可;第 二种,a=bj (j < k),从第二堆里面拿走 b – aj 即 可。
素质拓展小游戏:博弈游戏
素质拓展小游戏:博弈游戏这个游戏用简单的形式再现了商业领域的竞争关系和定价略策,从而为学员提供了实战演习的机会。
这个游戏是典型的博弈论思想的体现,反映出在“背靠背”的情况下怎样应对和猜测对手的想法。
游戏规则和程序1.将学员分成5~6个组,每个组将分别代表一家航空公司在市场经营。
2.市场经营的规则就是:所有航空公司的利润率都维持在9%;如果有三家以下的公司采取降价策略,降价的公司由于薄利多销,利润率可达12%,而没有采取降价策略的公司利润率则为6%;如果有三家和三家以上的公司同时降价,则所有公司的利润都只有6%。
3.每个小组派代表到小房间里,培训师给他们交代上述游戏规则。
并告诉小组代表,他们之间需要通过协商初步达成一种协议。
初步协商之后小组代表回到小组,并将情况向小组汇报。
4.小组经过讨论5分钟之后,需要作出最终的决策:降还是不降?并将决定写在纸条上,同时交给讲师。
5.讲师公布结果。
相关讨论1.作为小组代表,在和别组代表讨论时,你的出发点是什么?2.回到自己的小组中,你们的决策是在什么基础上产生的?你们是否遵守了几个小组达成的共识?3.你们是否运用了博弈?总结1.本游戏看似简单,但结果往往出人意料但又在意料之中,因为大部分公司都会选择降价,结果降价会导致两败俱伤。
这个游戏可以用博弈论中的典型案例--囚徒两难来分析:尽管每家航空公司都不降价均可保持9%的利润率,但是受到降价后12%利润率的吸引,它们还是会选择降价。
在这种选择下,每家公司都降价导致的是行业利润率的集体下降,变成6%,但这种结果是无法避免的,因为每家公司都在追逐高利润。
2.这个游戏告诉我们两个道理:①不要假定竞争对手比你傻;②不要打价格战,因为价格战没有赢家。
经营行为还是应该按照行业规则和市场需求操作。
形式:4人一组时间:30分钟道具:幻灯片场地:教室应用:(1)创新能力(2)工作和经营方法同类文档:素质拓展游戏大全野外素质拓展游戏学生素质拓展游戏经典素质拓展游戏介绍心理素质拓展训练游戏最经典的素质拓展游戏大全。
精品课程《博弈论》PPT课件(全)
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
博弈论PPT资料整理
博弈论PPT资料整理第一章博弈是一场至繁至简的游戏1928年冯诺伊曼系统证明了博弈论的基本原理,并宣告了博弈论的诞生。
1994年,纳什,海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。
2005年,谢林和奥曼因把博弈论引入国家管理,获得诺贝尔经济学奖。
博弈论也称对策论,原来是数学的一个分支,但由于它比较好的解决了对竞争等问题的可操作性分析,从而发展成为经济学中的一个研究领域,并以其鲜明的特征改变了经济学的传统研究其实,博弈论就是一种关于决策和对策的博弈的理论,更多的用于人与人之间,但是,因为人的思维是随环境、心情等不断变化的。
于是对于每个人每个时间应对的策略都是变化,这就增加了博弈分析的深度和难度。
中国古代的《孙子兵法》就不仅是一部军事著作,也算是世界上最早的一部博弈论专著。
博弈是个人、团队或其他组织、面对一定的环境条件,在一定的约束条件下依靠自身掌握的信息,同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中取得相应的结果或收益的过程。
生活中的博弈:购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。
而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结,并帮助你完成优化效果的过程。
特别是在现代,可以说人们在日常生活中的一切行为均可以通过博弈论来解释,因为博弈的本质就是在进行一场生存的游戏。
由此可见,博弈论是适合所有人的科学。
在人际交往的过程中,博弈就是运用你的智慧和理性思维,在纷繁的事件中选择能够使你的利益最大达到最大化的科学。
博弈论能够起到重要的作用,由此,你可以看到博弈论在生活当中的广泛应用。
可以说作为一门关系学,它是人与人之间的行动互相影响的科学,是伴随你一生的科学。
从围棋定式谈纳什均衡过分的骗着与本手、缓手之间一般以本手应对着招过分不遇反击,则可能占到便宜,如遇反击则可能亏损如果势均力敌,则应考虑到对手的反击手段。
博弈游戏
博弈游戏一,分组:将学员分成8个组,名字已确定。
二,游戏介绍:每个组有两个选择,A和B,按规则选好后,将会根据下表得到相应的分值。
三,规则1,比赛时,双方将自己的决定写在纸上,然后交给场务人员,整个过程中各组人员之间没有允许不得交流,并试图告诉对方自己的决定。
2,最终以分数最高的一组获胜,如果有分数相同的以同一名次算或抽签决定名次,如果全部相同则没有赢家。
总共进行7轮四,具体活动开展1,由李兴怡介绍活动的相关内容,规则等,其他项目成员予以配合。
2,首先每个小组内部商量,决定该不该降价,然后投票。
3 .每个小组派一名代表进行沟通,然后表决。
结束后之间需要通过协商初步达成一种协议。
初步协商之后小组代表回到小组,并将情况向小组汇报,作出决定,小组经过讨论5分钟之后,需要作出最终的决策:降还是不降4,依次循环下去。
5,最终统计分数,公布分数。
第一名:300金币;第二名:200金币:第三名:100金币,第四名,50金币,第五名,30金币。
6,提问:1.作为小组代表,在和别组代表讨论时,你的出发点是什么?2.回到自己的小组中,你们的决策是在什么基础上产生的?你们是否遵守了几个小组达成的共识?3.你们是否运用了博弈?形式:X人一组主持人:李兴怡场务人员:袁先锋,李靖等时间:60分钟道具:幻灯片,纸片场地:教室应用:(1)创新能力(2)工作和经营方法参考资料:1,市场经营的规则:比如,有四家笔记本电脑公司,所有笔记本电脑公司的利润率都维持在9%;如果有三家以下的公司采取降价策略,降价的公司由于薄利多销,利润率可达12%,而没有采取降价策略的公司利润率则为6%;如果有两家和两家以上的公司同时降价,则所有公司的利润都只有6%。
2,囚徒困境:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
《博弈游戏》
博弈论是“研究主体的行为在直接相互作用时,人们如何进行决策、以及这种决策如何达到均衡的问题”。
处于一个博弈中的决策者称为参与者,而他们的选择称为行动。
一个博弈中的参与者的利益可能严格对立,一人所得永远等于另一人所失。
这样的博弈称为零和博弈。
给我所需要的,我就会给你所需要的,这是每一个交易建议的含义。
作为个人,试图挑战规则总是要付出代价的。
囚徒困境:甲、乙两个人一起携枪准备作案,被警察发现抓了起来。
警方怀疑,这两个人可能还犯有其他重罪,但没有证据。
于是分别进行审讯,为了分化瓦解对方,警方告诉他们,如果主动坦白,可以减轻处罚;顽抗到底,一旦同伙招供,你就要受到严惩。
当然,如果两人都坦白,那么所谓“主动交代”也就不那么值钱了,在这种情况下,两人还是要受到严惩,只不过比一人顽抗到底要轻一些。
如果两人都不坦白,警察会以非法携带枪支罪而将二人各判刑1年。
如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年。
如果两人都招供,则两人都会因罪名各判10年。
双方的策略选择往往是有迹可循的,并形成某种“定式”,即均衡。
寻找优势策略是每一个人的首要任务。
马太效应:凡是少的,连他仅有的也夺过来;凡是多的,就加给他,让他更多。
纳什均衡含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。
即双方在对方给定的策略下不愿意调整自己的策略。
有些博弈的纳什均衡点不止一个。
如“夫妻博弈”(或称性别之战)中有两个纳什均衡点。
纳什均衡是一最常见的均衡。
它的含义是:在对方策略确定的情况下,每个参与者的策略都是最好的,此时没有人愿意先改变自己的策略。
没有把真正的问题找出来就盲目采取行动,是最愚蠢的做法。
能够找出问题,已经可以说是把问题解决一半了。
解决问题的公式:1、找出问题发生的原因2、分辨情报的价值3、彻底推行解决方案4、观察事情进行得是否顺利在同时行动的博弈中,有三个行动法则:一是寻找和运用优势策略;二是寻找和避免劣势策略,同时假定你的对手也在这么做;三是寻找和运用均衡。
《博弈论入门》PPT课件
在不同博弈中可供博弈方选择的策略或行为的数量 很不相同,在同一个博弈中,不同博弈方的可选策 略或行为的内容或数量也常不同,有时只有有限的 几种,甚至只有一种,而有时又可能有许多种,甚 至无限多种可选策略或行为。
精选PPT
男人无所谓忠诚,忠诚是因为背叛的砝码太低; 女人无所谓忠贞,忠贞是因为受到的引诱不够.
某个综艺节目现场,女主持人气势咄咄的问一个男嘉宾,你 为什么那么在乎钱,男嘉宾说:“钱能买到一切!” 现场的观 众哗然了。
男嘉宾微笑的说:“我们做个测试吧。”
一个很简单的主题,你的一个仇人爱上了你的女友,现在
局中人所选择的策略构成的组合(招,招)被称为 博弈均衡。
精选PPT
21
参与人(Players)
即在所定义的博弈中究竟有哪几个独立决策、独立 承担结果的个人或组织。
对我们来说,只要在一个博弈中统一决策,统一行 动、统一承担结果,不管一个组织有多大,哪怕是 一个国家,甚至是由许多国有组成的联合国,都可 以作为博弈中的一个参加方。并且,在博弈的规则 确定之后,各参加方都是平等的,大家都必须严格 按照规则办事。
人,也许是在权衡什么。一半的男人沉默了,另一半
的男人怯生生的说:“我要爱情。”身边的女友也有点
呆住了,一个女孩子站起来说:“如果一个男人肯出
五百万,我想我没有理由拒绝他。”沉默..................
精选PPT
26
男人选择了金钱,500万可以买一套房子,一部车子,全家 过上好曰子,甚至可以开始自己的事业。一个男人说:“他是 我的仇人,我有了这个500万,我可以含辛茹苦,我可以报仇 ,我可以计划我所有的未来,当个真正主宰自己的男人。”一 些女人看着身边的男人,若有所思。
趣味博弈游戏.优秀精选PPT
在第一阶段,甲知道按照第三阶段自己所提的分割方案,乙在第 二阶段必定提出使得乙自己收益最大( 100 2s )的方案,要使交易 在 第 一 轮 就 成 功 , 甲 提 出 让 自 己 得 s1 的 分 割 方 案 , s1 必 须 满 足 100 s1 100 2s ,即 s1 100 100 2s( > 2 s )的分割方案。这样的 方 案 , 乙 必须 接 受 。此 时 双 方的 收 益 向量 为 (100-100 + 2s , 100 2s ),这就是该博弈的均衡解。
1如9果60你年选,择物“理只学取家2号威盒廉子·纽”科,姆神提预出测了到一这个一策点略,选神择在难2题号。盒里放了1 000 000 元,这样得到1 000 000 元。
分上析述:衣逆服推的归三不纳回法满合(讨“意价向还,前价展则问望题乙,描倒提述后如推出下理:另”)一个分割比例,此时轮到甲选择,若甲满意,则
校本课程《生活中的数学视角》
你准备怎样玩该长者设(计2的)这个讨游价戏?还价每多进行一个阶段,由于时间消耗的成本及利息
损失等,双方的收益都要打一个折扣,假设成本费用率为λ∈(0,1),
则δ=1-λ∈(0,1)称为折扣率,也称消耗系数,在讨价还价过程中,
还存在根据对方的报价,卖方提高自己的保留价,买方压低自己的保
二、斜坡上的均衡
“鹬蚌相急,渔翁得利” 寓意:在我们的竞争对手背后,可能隐藏着更大的共同的敌人
据说美国子鲁大学的教授们在课堂实验中,曾经跟毫无戒备之心的本 科学生们玩过类似的游戏,而且在首次玩这样的游戏(当然不会有第 2 次!)时赚了不少钱,游戏的相关规则如下:
你准备怎样玩该长者设计的这个游戏?
一位长者手中拿着一张 100 元的大钞走到一群赌徒前面,这批赌 徒个个嗜赌成性,而且身边带不少的钱,长者要大家以 10 元为底线, 10 元为一个叫价单位,拍卖他手中的 100 元大钞,但出价最高者与 次高者必须支付相于当出价数目的费用,出价最高者赢得这 100 元大 钞。
博弈游戏PPT课件
2021/1/23
2021
3
游戏三:100元怎么分?
➢ 你看见两个小孩在玩耍,出于好奇,你给他们100元, 让他们猜拳。猜赢者决定怎么分这100元,而输者如果 同意赢者的分配比例,那么他们将各有所得,如果不同 意,那么这100元,你将收回。
博弈游戏
游戏一:心灵感应
➢ 两个人一组,独立写出1至10之间的任意5个数。 ➢ 如果不重复则得奖;否则受罚。
2021/1/23
2021
2
游戏二:海盗逃生
➢ 有5个海盗,即将被处ቤተ መጻሕፍቲ ባይዱ刑。法官愿意给他们一个机会。 从100个黄豆中随意抓取,最多可以全抓,最少可以不 抓,可以和别人抓的一样多。
➢ 抓得最多的和最少的要被处死。如果你第一个抓,你 抓几个?
美国介入越南;
赌红了眼的赌徒;
连续买进下跌的股票
2021/1/23
2021
7
“协和谬误”
20世纪60年代,英国和法国政府联合投资开发大型 超音速客机,即协和飞机。该种飞机机身大、设计豪华 并且速度快。
英法政府发现:继续投资,花费会急剧增加,但能否 适应市场还不知道;而停止研制将使以前的投资付诸东 流。研制工作只好不断地深入。
➢每人各有2.50美元,而且都知道对方兜里有多少钱。 以10美分为叫价单位。均衡是什么?
➢联合起来,和平共处,是一个更好的解决方案。
2021/1/23
2021
6
“骑虎难下”的博弈
一旦进入骑虎难下的博弈,及早退出是明智之举, 然而当局者往往做不到,这就是所谓当局者迷。
这种骑虎难下的博弈经常出现在国家之间,也出现在 企业或组织之间,当然个人之间也经常会碰到的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
根本问题:个体对自身利益的追求会损害整体的利益。
8
囚犯的推理:
甲 乙
招认
不招
招认 不招
10年 150年
150年 11年
9
1-正品 2-假冒产品
游戏
理想净收入:$1.08 理想净收入:$1.58
规则:根据选1的人数,将收入平分给在座所有人。
•现实例证 –政治
主体的行为在发生直接的相互作用时,人们如 何进行决策以及这种决策如何达到均衡的问题。
2
受影响的决策
…
客户
父母
竞争 对手
决策
伴侣
同事
孩子
…
3
二、博弈策略
• 相继行动的博弈策略-向前展望,倒后推理
优势策略 • 同时行动的
博弈策略 劣势策略
策略组合
4
新闻大战与博弈策略
《时代》、《新闻周刊》
优势策略-封面问题:艾滋病特效新药、预算问题
– 善良的:首先合作,放弃占他人便宜的可能性。 – 清晰的:易于被理解,从而引出长期合作。 – 及时回报
• 报 复:对背叛的回报,使对方试着背叛一次后就不敢再背叛。 • 宽容的:对合作的回报,有助于重新恢复合作。
15
总是背叛 背叛 5 背叛 1 …
一报还一报 合作 0 背叛 1 …
遇到报复撤回背叛 背叛 5 背叛 1 合作 0 合作 3 …
预算问题
预算问题 30%*23/5=128%
艾滋新药 3700%%
艾滋新药
7300%%
7700%%**23//55==2482%%
7
坦白,警察会以非法携带枪支罪 而将二人各判1年;
• 如果其中一人招供而另一人不招,坦白者作为 证人将不会被起诉,另一人将会被重判15年;
17
总结
• 决策形成的五个步骤:
1. 列出所有可以采取的行动; 2. 尽可能列出每个行动的可见后果; 3. 尽量评估每种结果可能发生的机会; 4. 试着表达你对每种结果的渴望或恐惧程度; 5. 把列出来的所有因素全部放在一起考量,
做出合理的决策。
18
• 肯尼迪的边缘策略-古巴导弹 • 毫无用处的核武器? • 约会—理想恋人的概率 • 赌博—必输游戏,何时应“孤注一掷” • 股市—巴菲特为什么能赚钱? • 强盗分脏—游戏 • 民主—既不一定正确也不一定公平
博弈游戏
--白波
博弈论 博弈策略
策略困境 走出困境
1
一、博弈论
• 1944年冯.诺依曼和奥地利经济学家奥.摩根 斯坦合作《博弈论与经济行为》(Theory of games and economic behavior),该书的出 版,标志着博弈论的创立。
• 博弈-可以分出胜负的游戏。 • 博弈论(Game Theory,又称对策论)研究决策
19
20
13
一报还一报的伟大胜利
• “一报还一报”在整个生态模拟过程中一直保持领先,
到了第1000代,它是最成功的规则,并且比其他任何 规则都增长得快。
• “一报还一报”的稳定成功的原因是它综合了善良性、 报复性、宽容性和清晰性。
14
“一报还一报”成功分析
• 着眼于未来-赢得竞赛不是靠打击对方,而是靠引导对 方合作。
我们认为他们认 为我们认为…会
选…
5
艾滋病特效新药 预算问题 若相同
70% 30% 各50%
《新》 《时》 预算问题
艾滋新药
预算问题 151%5% 7300%%
艾滋新药 3700%% 35%
6
若两杂志采用同一个封面故事 《时代》3/5、《新闻周刊》2/5
艾滋病特效新药 70%
预算问题
30%
《新》 《时》
• 可能的结果及奖金:
1)合作,合作
2) 背叛,背叛
3
3
1
1
3)合作,背叛
0
5
12
参赛者提出了各种程序,大致可分为:
• 善良的-以合作为主,不首先背叛的规则 的规则
• 邪恶的-以占便宜为主的规则 • 随意的
竞赛结果:“以合作为主” 的善良策略大获全胜。而 善良的规则中“一报还一报”取得了最终的且惊人的胜 利!
一报还一报 合作 0 背叛 1 背叛 5 合作 3
…
伺机占便宜
一报还一报
合作 3
合作 3
…
…
背叛 5
合作 0
…
…
16
• 你不必每次都赢
–在一个有合作可能的博弈中,你没有必要非得比对 方做得更好。“一报还一报”从来没有一次在游戏 中比对方得更多的分!
• 未来影响现在
–走出囚徒困境取决于双方的策略为发展合作留出多 大的余地。从消极层面看,我们互不侵犯,是为了 避免没完没了、两败俱伤的循环报应。
–教育
10
四、走出困境 -促进合作与生态模拟竞赛的启示
–双方主动合作。
–分解,增大未来的影响; –改变收益值
• 管理的目的不是让每个人做到最好, 而是避免内耗过多;
11
生态模拟竞赛
• 为了验证面对“囚徒困境”时人们可选择的策略以及 这些策略的有效程度,美国的学者组织了一次以此为 主题的计算机竞赛。竞赛的游戏方法是:游戏双方都 在不知对方将如何选择的情况下,选择合作或背叛。