博弈案例

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5. 行动:局中人在特定条件下的行为
6. 支付 ( Pay-off ) :博弈结束时,各方得到的收
益。
7. 策略均衡:参与者之间稳定的、可预测的互动行 为模式,就是策略均衡。
32
纳什均衡
纳什均衡是指在对手策略既定的情况下, 各自对局者所选择的策略都是最好的。
给定你的策略,我所选择的是最好的;给定我的策 略,你所选择的是最好的。
44
君子和而不同,小人同而不和
《论语.子路第十三》
45
2 博弈的策略
如果一个博弈中每个博弈方的策略都是 有限的,则称为“有限博弈” 如果一个博弈方的策略是无限多个,则 称为“无限博弈”
46
3 博弈中的得益(支付)
得益即参加博弈的各个博弈方从博弈中所获得的利 益。 1)零和博弈: 即一方的得益必定是另一方的损失。 指的是所有博弈方的得益总和为零,各种赌博就属 于零和博弈。例如4个人参与一场赌博,其中3个人输 了总共1000元,那么另外一个人必然赢了1000元。期 货交易市场的参与者之间的关系也属于零和博弈。人 们平常所说的“损人利己”实际上也包含有零和博弈 的意思。 例如:石头、剪子、步
4
小偷甲的选择:招或不招 小偷乙的选择:招或不招
甲或乙可以作出的选择被称为“策略”, 如“招”或“不招”都是策略。
2 两小偷的最后选择是什么?
5
3 博弈的表达 表1 囚徒困境博弈 乙

招 不招
招 -8,-8
不招 0,-10
-10,0
-1,-1
(问题1:甲、乙如何选择?)
6
尽管甲不知乙是否招供,但他认为自己选
30
二、基本概念
1. 局中人或参与者(Players)
2. 规则(rules):规定博弈各方的行动顺序、
方式、以及最终的结果等。 3. 策略(Strategy):一整套的行动方案,规定 了各种情况下的行动。比如:敌进我退,敌 退我追,敌驻我扰,敌疲我打。
31
二、基本概念
4. 相机策略( contingent strategy ):仅在不确 定事件发生时才会采取的策略。如:人不犯我, 我不犯人;人若犯我,我必犯人。
8
甲和乙是参与博弈的人,称为“局中 人”或“参与人”。表1中每一个小方格 内的数字被称为局中人的支付或“得 益”,其中左边的数字代表甲的支付, 右边的是乙的支付。表1中的双变量矩阵 称为博弈支付矩阵或“得益”矩阵。
9
局中人所选择的策略构成的组合(招 , 招)被称为博弈均衡。这个组合中前后 两个策略分别表示甲和乙所选择的策略。
22
当时,国家有关部门还未出台相关的 反垄断法律,对于这种在发达国家明显 属于违法行为的所谓“自律联盟”,国 家在法律上暂时还是无能为力的。寡头 厂商在光天化日之下进行价格合谋,并 且还通过媒体大肆炒作,这在发达国家 是不可思议的。
23
但是,尽管政府当时无力制止这种事情, 公众也不必担心彩电价格会上涨。这是因为, “彩电厂商自律联盟”只不过是一种“囚徒困 境”,彩电价格不会上涨。在高峰会议之后不 到二周,国内彩电价格不是上涨而是一路下跌。 这是因为厂商们都有这样一种心态:无论其他 厂商是否降价,我自己降价是有利于自己的市 场份额扩 大的。
40
博弈方的个体理性和集体理性 以个体利益最大为目标被称为“个体理 性” 存在以集体(团体)利益为目标,追求 集体利益最大化称为“集体理性” 囚徒的困境揭示了个体理性和集体理性 之间的矛盾。
41
一般情况,集体利益最大化本身不是 博弈方的根本目标,人们在博弈中的行 为准则是个体理性而不是集体理性。 如果在博弈中存在“有约束力的协 议”,使得博弈方采取符合集体利益最 大化而不符合个体利益最大化的行为时, 能够得到有效的补偿,从而使博弈方按 照集体理性决策和行动成为可能。
其次,“纳什均衡”是一种非合作博弈均衡,在现实中 非合作的情况要比合作情况普遍。
所以“纳什均衡”是对冯· 诺依曼和摩根斯特恩的合作 博弈理论的重大发展,甚至可以说是一场革命。
35
一个博弈需要设定下列四个方面: 1 博弈的参加者:是博弈的决策主体。 是指博弈中独立决策、独立承担后果, 以自身利益最大化来选择行动的主体 (可以是个人,团体如厂家、政府、国 家)。局中人以实现自身利益的最大化 为目标。都可以作为博弈中的参加者。
33
一农户在杀鸡前的晚上喂鸡,不经意地说: 快吃吧,这是你最后一顿! 第二日,见鸡已躺倒并留遗书:爷已吃老鼠药, 你们别想吃爷了,爷也不是好惹的。 点评: 当对手知道了你的决定之后,就能做出对自己 最有利的决定——纳什均衡理论 所以保密、信息安全很重要
34
纳什均衡的意义
合作是有利的“利己策略”。但它必须符合以下黄金律: 按照你愿意别人对你的方式来对别人,但只有他们也按同 样方式行事才行。也就是中国人说的“己所不欲勿施于 人”。但前提是人所不欲勿施于我。
36
判断博弈参与者的根本标志是他是否是博 弈的利害关系者。只有在博弈中存在利害关系 的决策主体才被看作是博弈的参与者。 那些不作决策或虽做决策但不直接承担决策 后果的被动主体不是参与人,而只能当做环境 参数来处理。如指手划脚的看牌人、看棋人, 企业的顾问等。 天塌下来关我啥事
37
2 各博弈方各自可选择的全部策略或行 为的集合。 可以是有限的,也可以是无限的
47
2)常和博弈: 所谓常和博弈,又叫非零和博弈,是指各博弈方的得 益之和是一个非零的常数。它区别于零和博弈。 在这种状况时,自己的所得并不与他人的所失的大小 相等,连自己的幸福也未必建立在他人的痛苦之上, 即使伤害他人也可能“损人不利己”,所以博弈双方 存在“双赢”的可能,进而合作。 譬如,在恋爱中一方受伤的时候,对方并不是一定得 到满足。也有可能双方一起能得精神的满足。也有可 能双方一起受伤。通常,彼此精神的损益不是零和的。 目前的中美关系,就并非“非此即彼”,而是可以合 作双赢。
42
我门将允许存在有约 束力协议的博弈方称 为“合作博弈” 不允许存在有约束 力协议的博弈则称为 “非合作博弈”
43
合作的 基础 :
(1)存有共同的利益 (2)必要的信息交流,消 除各方的参与者的信息不对 称,才 能使参与者对 合作 有一个较为稳定的预期。 (3)自愿、平等和互利 (4)强制性的契约 所以,合作博弈论允许博 弈各方通过谈判与沟通来树 立合作意识
“招”最好,因而甲会选择“招”,乙也同样 会选择“招”,结果各判 8 年;但若两人都不
招,结果是两人只被判 1 年,但这种结果是不
会出现的。 我们可以运用“剔除劣策 略”的方法来获得这样的结果。
7
对甲来说 ,尽管他不知道乙是选择了 “招”还是“不招”,他发现他自己选择“招” 都是比选择“不招”为好的。因此,“不招” 是相对于“招”的劣战略,他不会选择劣战略。 所以,甲会选择“招”。 同样,根据对称性,乙也会选择“招”, 结果是甲乙两人都“招”。
27
例子:长途汽车上的劫匪众人抢劫,若 是众人一哄而上肯定能降伏劫匪,但是 问题就在于如何一哄而上,首先联合他 人或挺身而出或者是首先报警的人必然 受到劫匪的剧烈打击,这是他一个人所 承受不了的负担。结果就造成了没人愿 意第一个站出来。即人质困境。
28
问题:烟草商为何不反对禁止烟草广告
29
通过上面的例子,我们对博弈的概念重 新理解一下: 博弈即一些个人、团体或其他组织,面 对一定的环境条件,在一定的规则下, 同时或先后,一次或多次,从各自允许 选择的行为或策略中进行选择并加以实 施,各自取得相应结果的过程。
10
甲和乙都不会选择劣策略“不招”, 称为“剔除劣策略的占优策略均衡”。 其中“招”是占优于(优于)“不招”的占 优战略。
11
通过追求个人的自身利益,他常常会 比其实际想要做的那样更有效地初进了 社会利益 ——亚当· 斯密所著的《国富论》
12
13
14
囚徒的困境通常被看着个人理性和集体 理性的经典情形。 合作是有利的“利己策略”但它必须符 合以下的黄金律:按照你愿意别人对你 的方式来对别人,但只有他们也按同样 的方式来行事才行。 这就是“己所不欲施于人”,前提是 “人所不欲施于我”
16
17
18
19
20
我们可以利用这个道理来分析日常生活 中的许多不合作现象。 例子1 商家价格战 出售同类产品的商家之间本来可以通 过共同将价格维持在高位而获利,但实 际上却是相互杀价,结果都赚不到钱
21
当一些商家共谋将价格抬高,消费者实际上 不用着急,因为商家联合维持高价的垄断行为 一般不会持久,可以等待垄断的自身崩溃,价 格就会掉下来。 譬如,2000年我国几家生产彩电的大厂商合谋 将彩电价格维持高位,他们搞了一个“彩电厂 家价格自律联盟”,并在深圳举行了由多家彩 电厂商首脑参加的“彩电厂商自律联盟高峰会 议”。
15
“囚徒的困境”的内在根源是在个体之间存在 行为和利益相互制约的博弈结构中,以个体理 性和个体选择为基础的分散决策方式无法有效 地协调各方面的利益,并实现整体、个体利益 共同的最优。简单地说,“囚徒的困境”问题 都是个体理性与集体理性矛盾引起的。 现实中“囚徒的困境”类型的问题是很多的。 例如厂商之间的价格战、恶性的广告竞争,初 等、中等教育中的应试教育等,其实都是“囚 徒的困境”博弈的表现形式。
博弈经典案例
一、囚徒困境 二、智猪博弈
三、斗鸡博弈
1
一、囚徒困境
2
一、博弈论:从“囚徒困境”谈起
人类的自私天性,使他们陷入“囚徒 困境”难以自拔。社会生活和商业竞争 中的许多逻辑都与这一困境密切相关。 合作是可能的吗 下面看看“囚徒困境”的故事
3
1 问题: 两个小偷甲和乙联手作案,被警方逮住但 未获证据。警方将两人分别置于两间房间分开 审讯,政策是若一人招供但另一人未招,则招 者立即被释放,未招者判入狱10年;若二人都 招则两人各判刑 8年;若两人都不招则未获证据 但会以较轻的罪名各判1年。
48
3)变和博弈: 变和博弈也称非常和博弈,则是指随着博弈参 与者选择的策略不同,各方的得益总和也不同。 即所有博弈方的得益为不确定的变量,而非某 个确定的常数。 比如,同一个股票市场,面对同样的大盘走势, 伴随着投资者的投资策略不同,有可能大部分 人赚钱而小部分人亏钱,也有可能小部分人赚 而大部分人亏,甚至还有可能所有人都赚或都 亏。在这个博弈中,博弈各方的得益是不确定 的变量,无法用确定的常数表示出来。。
50
(2)动态博弈 动态博弈则是指博弈方的选择和行 动有先后之分,后行者可以根据先行者 的策略选择来决定自己的策略。 如A企业降价后,B企业也跟着降价; 足球比赛中,一方换上一名攻击性前卫 后,另一方针对性地换上一名后卫;如 此等等。
பைடு நூலகம்51
(3)重复博弈: 实际上就是同一个博弈反复进行所构成的博弈过程。 如果你去菜场买菜,当你对某种菜的质量、口味 等有疑虑时,卖菜的阿姨常会讲: “你放心,我一直在这儿卖呢!”这句朴实的话中其 实包含了华丽的“博弈论”思想:我卖与你们买是一 个次数无限的重复博弈,我今天骗了你,你们今后就 不会再来我这儿买了,所以我不会骗你的,菜的质量、 口味肯定没问题。而你在听了阿姨的上述一句话后, 常常也会打消疑虑,买菜回家。 地摊、车站、旅游点,这些流动性大的地方,不但 商品服务质量最差,而且假货横行,因为商家和顾客 之间没有明天。
49
4 博弈的过程
(1)静态博弈 博弈的参与者同时作出决策(或者虽然决 策有先后,但是没有人在决策之前看到了其他 参与者的决策行为),一旦决策做出之后,就 只能等待结果,对博弈的发展再也不能产生任 何影响,这种博弈叫做静态博弈。 譬如,在投标活动中,投标人投出标书一 般虽有先后,但因为所有投标人在开标前都不 知道其他投标人的标价,因此可看作同时选择 策略,采取行动。体育竞赛中,双方出场阵容 的选择也属于静态博弈。
24
25
26
人质困境:多个人的囚徒困境
老鼠们意识到,假如可以在猫脖子上系一 个铃铛,那么,他们的安全就会有保障。问题 在于,谁会愿意冒赔上小命的风险给猫系上铃 铛呢?老鼠所面临的这个问题同样摆在人类面 前:人们在直接面对威胁或损失时,也面临同 样的心理困境。 在一群人面对威胁或损失时,“第一个采 取行动”的决定是很难做出的,因为它意味着 将付出惨重代价。这个困境便就叫做人质困境。
38
谈到博弈策略问题,可以说在我国传统文 化中,包含有许多精妙的博弈策略。许多成语 及成语典故,就是对博弈策略的令人叫绝的运 用和归纳。如围魏救赵、背水一战、暗渡陈仓、 釜底抽薪、狡兔三窟、先发制人、借鸡生蛋等 等。 当然,博弈策略的成功运用须依赖一定的环 境、条件,在一定的博弈框架中进行。
39
3 进行博弈的次序 4 博弈方的得益或支付 对应于各个博弈方的每一组可能的决策 选择,都应有一个结果表示该策略组合 下各博弈方的所得或所失。 如:利润、损失、个人效用和社会福利、 经济福利等
相关文档
最新文档