博弈论(1)
博弈论公式(一)
博弈论公式(一)博弈论公式1. 最小最大定理(Minimax Theorem)最小最大定理是博弈论中的重要定理之一,用于描述两个参与者在零和博弈中的最佳策略选择。
公式:[minimax theorem formula](在公式中,a和b是参与者的策略选择,F(a, b)是参与者根据自己的策略选择所获得的收益。
例子:假设有两名囚犯A和B,他们被起诉犯有共同的罪行。
检察官为了尽可能追求公正,提供了以下交易:•如果A和B都选择保持沉默,则每人判刑1年。
•如果A和B都选择揭发对方,则每人判刑3年。
•如果A揭发B而B选择保持沉默,则A不被判刑而B被判刑6年。
•如果B揭发A而A选择保持沉默,则B不被判刑而A被判刑6年。
根据最小最大定理,囚犯A和B都会选择揭发对方,因为即使对方也选择揭发自己,判刑3年的收益仍然比判刑6年的收益更高。
2. 纳什均衡(Nash Equilibrium)纳什均衡是博弈论中的概念,用于描述参与者选择最优策略时的平衡状态。
公式:[nash equilibrium formula](在公式中,A是参与者的策略集合,a是参与者的策略选择,u是参与者的效用函数,i表示参与者的编号。
例子:考虑一个两人博弈,参与者A和B可以选择合作(C)或背叛(D),他们的效用函数如下:•A选择合作(C)且B选择合作(C):A的效用=3,B的效用=3。
•A选择合作(C)且B选择背叛(D):A的效用=0,B的效用=5。
•A选择背叛(D)且B选择合作(C):A的效用=5,B的效用=0。
•A选择背叛(D)且B选择背叛(D):A的效用=1,B的效用=1。
在这种情况下,合作(C)和背叛(D)是纳什均衡,因为任何一名参与者如果改变自己的策略选择,都无法获得更高的效用。
3. 马赛克文件公式(Blurred File Formula)马赛克文件公式是博弈论中用于保护数据隐私的方法之一,通过模糊化数据来限制敏感信息的泄露。
公式:[blurred file formula](在公式中,F是原始文件,K是用于模糊化的密钥,⊕表示按位异或运算。
博弈论习题[1]
习题 2
解: 令(L,M,R)是参与人 A 的 战 略 ;( U,M,D)是参与人 B 的战略。从表 1A.2 中可以看出,对 于参与人 B 而言,M 战略是严格劣于 R 战略,按照重复提出的占有均衡剔除 M 战略,则得出 如表(a)博弈。在表(a)博弈,参与人 A 的 M 和 D 战略严格劣于 U 战略,重复剔除 M 和 D 战略,得出表(b)博弈。该博弈为单人决策,则重复剔除的占优均衡为(U,L)。
r3 ( A, A, A) = r3 ( A, A, B) = r3 (A, A, C) = {A, B, C} r3 ( A, B, A) = r3 ( A, B, B) = r3 (A, B, C) = {A, C} r3 ( A, C, A) = r3 ( A, C, B) = r3 ( A, C, C) = {C} r3 (B, A, A) = r3 (B, A, B) = r3 (B, A, C) = {A, C} r3 (B, B, A) = r3 (B, B, B) = r3 (B, B, C) = {B, C} r3 (B, C, A) = r3 (B, C, B) = r3 (B, C, C) = {C} r3 (C, A, A) = r3 (C, A, B) = r3 (C, A, C) = {C} r3 (C, B, A) = r3 (C, B, B) = r3 (C, B, C) = {C} r3 (C, C, A) = r3 (C, C, B) = r3 (C, C, C) = {A, B, C}
(0,0)律师得到 100 (0,0)律师得到 100)
通过上面的支付矩阵,我们可以得出答案,只有 A 和 B 都做出选择得到 50 的时候,他
们才能得到钱,不多一分也不少分,如果有一方想多得,二者将一分也得不到,钱全部归律
《产业经济学》第五章--(博弈1)讲解
在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。
博弈论习题1
1、一逃犯从关押他的监狱中逃走,一看守奉命追捕。
如果逃
犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。
逃犯逃脱可少坐10年牢,但一旦被抓住则要
加刑10年;看守抓住逃犯能得1000元奖金。
请用得益矩阵表示该博弈。
2、你正在考虑是否投资100万元开设一家饭店。
假设情况是
这样的:你决定开,则0.35的概率你将收益300万元(包
括投资),而0.65的概率你将全部亏损掉;如果你不开,
则你能保住本钱但也不会有利润。
请你:
(1)用得益矩阵表示该博弈。
(2)如果你是风险中性者,你会怎样选择?
(3)如果你是风险规避者,且期望得益的折扣系数为0.9,你的策略选择是什么?
3、假设长虹和创维这两家彩电生产商都可以选择集中力量研
发生产低档产品或高档产品,但他们在选择时都不知道对方的选择。
假设他们在不同选择下的收益矩阵如下图所示。
请问:该博弈的均衡是什么?。
博弈论专题1:拍卖
四、拍卖分析 2.密封式二级价格拍卖 Sealed-bid Second Price Auction
华长生制作.2005.1
30
四、拍卖分析 2.密封式二级价格拍卖 Sealed-bid Second Price Auction
华长生制作.2005.1
31
四、拍卖分析 2.密封式二级价格拍卖 Sealed-bid Second Price Auction
华长生制作.2005.1
7
二、拍卖分类
3. 相关价值拍卖(Correlated Value Auction)
一种更为广泛的概念,相关价值拍卖是其 一种特殊情形。相关价值拍卖中,竞拍者之间 对拍卖品的估价是相关的,但拍卖品对各个竞 拍者的价值可能是不同的。 如竞拍者的喜好、素质等相似时,他们对 拍卖品的价值评估就具有相关性;竞拍者之间 的秘密勾结也会形成相关价值拍卖。
27
四、拍卖分析 1.密封式一级价格拍卖 Sealed-bid First Price Auction
对于竞拍者i:竞拍者越多,对竞拍者i越不利, 他的出价应该越高,但不能超过自己对拍卖品的估 价。
华长生制作.2005.1
28
四、拍卖分析 2.密封式二级价格拍卖 Sealed-bid Second Price Auction
华长生制作.2005.1
17
三、拍卖形式 4.密封式二级价格拍卖 Sealed-bid Second Price Auction
规则:每个竞拍者分别提交自己的出价,而且 他们不知道别人的出价。出价最高的竞拍者获 得拍卖品,并按所有的出价中仅低于最高出价 的次高价格付钱给拍卖者。 策略:竞拍者的策略是一个出价。这个出价是 拍卖品对竞拍者自己的价值,以及他对其他竞 拍者的估价的先验估计的函数。 支付:赢得拍卖的竞拍者的支付等于拍卖品对 华长生制作.2005.1 他的价值减去所有出价中的次高价格。
博弈及博弈论(1)
与其应用
100503116盛盼盼
从以下几个方面来学习:
• • • • • • • 定义 发展 类型 要素基本概念 应用及分析 意义 相关理论
定义:
• 博弈论(Game Theory),亦名“对策论”、 “赛局理论”,属应用数学的一个分支, 博弈论 已经成为经济学的标准分析工具之一。目前在生 物学、经济学、国际关系、计算机科学、政治学、 军事战略和其他很多学科都有广泛的应用。博弈 论主要研究公式化了的激励结构间的相互作用。 是研究具有斗争或竞争性质现象的数学理论和方 法。也是运筹学的一个重要学科。 博弈论考虑游 戏中的个体的预测行为和实际行为,并研究它们 的优化策略。生物学家使用博弈理论来理解和预 测进化论的某些结果。
博弈论的发展:
• 我国古代的《孙子兵法》就不仅是一部军 事著作,而且算是最早的一部博弈论专著。 博弈论最初主要研究象棋、桥牌、赌博中 的胜负问题,人们对博弈局势的把握只停 留在经验上,没有向理论化发展,正式发展 成一门学科则是在20世纪初。
• 对于博弈论的研究,开始于策墨洛 (Zermelo,1913)、波雷尔(Borel,1921)及冯· 诺伊曼 (von Neumann, 1928),后来由冯· 诺伊曼和奥斯 卡· 摩根斯坦(von Neumann and Morgenstern, 1944,1947)首次对其系统化和形式化(参照 Myerson, 1991)。随后约翰· 福布斯· 纳什(John Forbes Nash Jr., 1950, 1951)利用不动点定理证 明了均衡点的存在,为博弈论的一般化奠定了坚 实的基础。
• • •
•
A\B
坦白 ห้องสมุดไป่ตู้赖
坦白
8,8 10,0
博弈论初步(1)
【例题1.1.1】出硬币博弈———硬币配对游戏
解甲、乙两人各拿一枚1元硬币,背靠背各自将硬币正面(1元币值面)或反向(菊花图案面)朝上置于手掌心中握紧。
然后,转身面对面,同时展开手掌。
游戏规则是,如果两人掌上硬币都是正面朝上或都是反面朝上,那么甲就赢了乙1元钱,或者说乙输给了甲1元钱;如果两人掌上硬币是一正一反,那么乙就赢了甲1元钱,或者说甲输给了乙1元钱。
【例题1.1.2】价格竞争博弈
解企业A与企业B生产同一种商品在市场上形成双寡头垄断市场,它们对商品都可以选择三种价格(高价、中价或低价)投放市场。
市场规则:不管哪个企业开出较低价格,它就可以得整个市场;如果两个企业开价相同,它们将平分市场。
这里进一步给出企业A,B选择不同价格获得的收益情况:企业A选择“中价”,企业B选择“高价”,这时企业A独占市场收益10万元;企业A选择“低价”,而企业B选择“高价”或“中价”,这时企业A仍独占市场,但因定出“低价”,因此收益为8万元。
当企业B选择较低价格,情况类同。
当企业A,B同时都选择“高价”,这时它们平分市场,各自收益为6万元;同时都选择“中价”,各自收益为5万元;同时都选择“低价”,各自收益为4万元。
博弈论1:纯策略
如何制定规则来约束
• 世界上有两种符合集体利益的正义: 实质正义与规则正义。实质正义必须通过 规则正义来实现,否则将被虚置。因此规 则正义最重要。
• 分蛋糕或分粥故事: 20个人的小集体, 每天吃粥。如果所有人抡吃,导致纳什悖 论:每人早早来等粥,成本极高,对谁都 不利。
• 纳什均衡:在完全信息静态 博弈中各方都实现个利益最 大化的策略组合状态
• 纯策略:假定每个参加者每 次只选择一个策略进行博弈
• 混合策略:每个参加者每次 按照各种几率选择不同策略 进行博弈,如监督博弈
二、博弈案例1:占优策略与劣策略
(dominant strategy and dominated strategy) 课本上译为“支配性策略”与“被支配策略”
完全信息静态博弈游戏各方在完全知道博弈过程的三大要素的情况下同时选择策略完全信息动态博弈走象棋围棋游戏各方的完全知识博弈过程的三大要素的情况下相继作出策略选择不完全信息动态博弈国际市场竞争10矩阵的每个位置显示每个参加者的每个策略组合此位置即一博弈格局每个博弈格局上列出每个参加者的利益函数于是得到payoffmatrix例如
• Since then game theory has be taken as the Foundation for Understanding Complex Economic Issues
一、博弈论的基本理论框架
1/博弈论的理论意义与特征
▪ 古典经济学:根据资源稀缺性配置资源 的科学,价格是资源稀缺性的信号,由 此对经济行为进行成本收益分析,MR= MC实现利润最大化 忽视了他人决策对彼此经济利益的影响
• 制度经济学:
科斯:对人之间的交易过程的成本收益分析 诺斯:对交易过程的制度环境进行分析,包括 制度约束与制度变迁与交易过程的关系
博弈论知识点总结完整版
博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。
即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。
两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。
倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。
目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。
把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。
博弈论案例分析1
一、经济学中的“智猪博弈”(Pigs’payoffs)故事背景:猪圈里有一头大猪和一头小猪。
猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。
如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。
当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。
对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。
反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。
规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。
如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。
改变方案一:减量方案。
投食仅原来的一半分量。
结果是小猪大猪都不去踩踏板了。
小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。
谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。
改变方案二:增量方案。
投食为原来的一倍分量。
结果是小猪、大猪都会去踩踏板。
谁想吃,谁就会去踩踏板。
反正对方不会一次把食物吃完。
小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。
投食仅原来的一半分量,但同时将投食口移到踏板附近。
结果呢,小猪和大猪都在拼命地抢着踩踏板。
《博弈论》知识点总结
《博弈论》知识点总结博弈论作为一门交叉学科,涵盖了数学、经济学、政治学、心理学等多个学科领域。
其研究对象包括零和博弈、非零和博弈、合作博弈、序贯博弈等。
博弈论的应用领域也非常广泛,包括经济学、政治学、社会学、管理学等。
博弈论在求解决策问题、预测市场行为、推导策略和解释社会现象等方面有着广泛的应用。
博弈论的主要内容包括:1.博弈的定义博弈是指互相影响的参与者所进行的一种决策活动。
在博弈中,每个参与者都要做出一个选择,其结果受到其他参与者的选择的影响。
博弈的结果取决于所有参与者的选择。
2.博弈的基本元素博弈的基本元素包括参与者、策略和结果。
参与者是进行决策的主体,策略是参与者可以选择的行为方式,结果是参与者选择策略后所得到的收益或损失。
3.博弈的分类根据参与者的利益关系和决策方式,博弈可以分为零和博弈和非零和博弈。
零和博弈指参与者的利益完全相反,一方获利即意味着另一方损失,而非零和博弈则指参与者的利益可能存在重叠或者是共同合作的情况。
4.博弈的解博弈的解是指在博弈参与者做出决策选择之后,通过某种机制确定最终的结果。
常见的博弈解包括纳什均衡、霍夫达均衡、帕累托最优等。
5.博弈论的应用博弈论在经济学、政治学、社会学等领域有着广泛的应用。
在经济学中,博弈论可以用来解释市场行为、预测价格变动等。
在政治学中,博弈论可以用来分析政治决策、议事程序等。
在社会学中,博弈论可以用来解释群体行为、合作问题等。
博弈论是一门具有重要理论意义和广泛应用价值的学科,它不仅可以帮助人们更好地理解决策制定的规律和机制,还可以为人们提供更科学的决策指导。
在日常生活中,我们可以通过学习和应用博弈论的知识,更加理性地做出决策,并更好地理解他人的选择和行为。
希望未来博弈论能够继续在各个领域发挥作用,为人类社会的进步和发展做出更大的贡献。
博弈论经典案例
重复博弈囚徒困境,砸了传统经济学的场子。
因为个人的自利行为,并不一定导致集体利益的最大化,“看不见的手”拉不住,人类向堕落之城下滑的趋势,难道这真是一个悲哀?索性并非如此,撇去博弈论的理性假设不说。
博弈论者很快发现囚徒困境只在单次博弈情形下明显,一旦博弈的开始陷入重复,合作将到来。
因为,未来的收益将左右目前的决策。
以牙还牙重复的博弈理论上导致了合作的产生,但是谁也不能保证合作的继续,因为之前已经说过,合作的代价是建立在损害个人利益基础之上的。
如果个人放弃未来收益或当前背叛收益大于未来收益,背叛的风险仍然存在。
那么在重复博弈中怎样的策略才是最优。
若干睿智而复杂在经过计算机中PK 之后,极其原始的“以牙换牙”策略脱颖而出,固然这个策略简单至极,其威力却无穷,以至于人们在短暂的欣喜之后,发现这把太阿指之剑倒持的可怕,一旦重复链条中出现一次(也许不经意的)背叛,那据此原则行事的博弈将永无止境的背叛下去,个人利益极度膨胀的同时,集体利益无限衰微。
幸好,这个世界不是模型,也不是如此简单。
很多时候,我们不必以牙还牙,第三方的规范:道德与法律就是我们的假牙,他们更加有利、有理、有节。
人质困境一场憋屈的博弈。
抢打出头鸟,人质联合固然可以制服歹徒,但是谁愿出头。
这一点给了无数处于劫持者地位的一方以机会,类似于秦的远交近攻、各个击破的策略,将最终全盘赢下。
人质可有反制的策略,当然有,不过艰难至极。
人质可以选择沉默,这样他有一定时间苟延残喘;或者联合劫持者对付人质,结局还是取决于劫持者,万一他过河拆桥怎么办;同时反抗,集体将获得左右策略,但是这需要壮士断腕的勇气,部分人可能因此受伤。
这里是实力与勇气的较量,而且实力暂居上风。
酒吧博弈如果人人理性,那么每一天到达酒吧的人数将是差不多正好的,但是人非圣贤,往往是有限理性的。
第一次到酒吧的人多,那么大多人人认为酒吧人太多,太挤。
第二次决定的时候,参考前次而不去酒吧。
少数去的人发现酒吧的人第二天很少,感觉很爽,第三次将继续回来,并重新带回许多人……循环就此开始。
博弈论各章节课后习题答案 (1)
第一章绪论
1.什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?(见教材)
2.分别用规范式和扩展式表示下面的博弈。
两个相互竞争的企业考虑同时推出一种相似的产品。
如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。
3.什么是特征函数?(见教材)
4.产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子?原因:个体理性与集体理性的矛盾。
例子:厂商之间的价格战,广告竞争等。
企业B
推出
不推出企业A 推出
(400,400)(700,-600)不推出(-600,700)(-500,-500)
(。
博弈论01纳什均衡4
博弈论绪论学习选择学会放弃绪论学习选择学会放弃绪论学习选择学会放弃绪论学习选择学会放弃绪论学习选择学会放弃绪论学习选择学会放弃绪论学习选择学会放弃囚徒困境囚徒困境囚徒困境价格竞争价格竞争囚徒困境的理解显然,不论是从两个囚徒整休来看,还是从他们各自来看,两人都供认的结局都不如两人都抵赖的结局。
由于这种结局具有必然性,虽然不理想但又很难摆脱,所以称为囚徒困境囚徒困境模型同时揭示了两个矛盾:一个是个体理性与团休理性之间的矛盾,从个体利益最大化出发的行为往往不能实现团体的最大利益;另一个是个体理性本身的内在矛盾,即使从个体利益最大化出发的行为最终也不一定能真正实现个体的最大利益,甚至会得到相当差的结果。
囚徒困境的理解囚徒困境是很多社会现象的简单抽象,可以说是理性的人类社会活动最形象的比喻。
它准确地描述了人类社会中所存在的互相之间不信任和相互防范的一面。
在无法改变他人选择的情况下,背叛常常是使自己避免风险的最好选择。
上述结论是在理性人假设之下得到的。
理性人可以理解为广义上的利己之人。
人是生而利己的,利他是后天习得的,其实也是一种利己的扩大化。
利己而不损人,利人而不损己损人利己,长不了,好不了;损己利人,多不了,也长不了利己心是推动社会发展的原动力。
军备竞赛军备竞赛公地悲剧注水简历写简历应该如实介绍还是夸大其词,也是囚徒困境式的博弈。
关税之战两个国家,在进口关税上都有两种选择:提高关税,以保护本国同类商品。
(背叛)降低关税,以利各自商品的流通。
(合作)当一国独自提高关税时,另一国也会做出同样反应,会引发关税战,两国商品均会失去对方的市场,同时对本国经济也造成损害。
员工困境一名苛刻的经理和手下数名员工。
如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都要超负荷工作;如果某人不听从吩咐,其他人听从吩咐,则此人下岗,其他人继续工作;如果所有人都不听从经理吩咐,则经理下岗。
由于员工之间信息不公开,都担心别人听话自己不听话而下岗,所以大家只能继续繁重的工作。
博弈论第二章 (1)
3、举例(2):斗鸡博弈
进 A 进 退
-3,-3 0, 2
B
退
2, 0 0, 0
独木桥
2
2014/9/22
一、博弈的标式表述
3、举例(3):齐王田忌赛马
上中下 上中下 上下中 齐 王 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上下中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 田忌 中上下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中下上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下上中 -1, 1 1,-1 1,-1 1,-1 3,-3 1,-1 下中上 1,-1 -1, 1 1,-1 1,-1 1,-1 3,-3
3
2014/9/22
二、重复剔除严格劣战略
3、重复剔除严格劣战略
二、重复剔除严格劣战略
(1)、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。
10:39:53
M
R
U S D
2 ,8 08 ,8 0 ,8
1,6 0 ,6 1,5
FudenbergTirole博弈论参考答案(1)
习题解答提示1.1 (F&T )解答: 书中已有一个提示。
这里是另一个更偏重代数的提示。
一个一般的2×2的博弈为:情况1:两参与人中至少有一人占优策略。
不妨假定参与人1有占优策略U :a UL > a DL and a UR > a DR .此时找参与人2对于U 的最佳反应,譬如说L :b UL > b UR 。
这样,(U, L)就是这个博弈纯策略的Nash 均衡。
下一步考虑两参与人中都没有一人占优策略的情形。
对参与人1有两种可能:(i) a UL > a DL 但 a UR < a DR ; 或者 (ii) a UL < a DL 但 a UR > a DR .对参与人2也有两种可能:(iii) b UL > b UR 但 b DL < b DR ; 或者 (iv) b UL < b UR 但 b DL > b DR .情况 2:当 (i) 和 (iii) 成立。
(U, L) 和 (D, R) 是两个纯策略的Na 均衡sh 。
另为还有一个混合策略的均衡Nash 。
假定在这个混合策略的均衡Nash ,参与人1用p *的概率使用U ,参与人2用q *的概率使用L ,则 参与人1使用U 时的期望收益 = q *a UL + (1- q *) a UR 参与人1使用D 时的期望收益 = q *a DL + (1- q *) a DR参与人2 参与人1 L R U a UL , b ULa UR ,b UR D a DL , b DL a DR , b DR在均衡时上两式必须相等(为什么?)因此,q *a UL + (1- q *) a UR = q *a DL + (1- q *) a DRURDR DL UL URDR a a a a a a q −+−−=* .同样理由,DLDR UR UL DRDL b b b b b b p −+−−=* .这就是混合策略的Nash 均衡。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
斯顿校园里的满怀忧伤的幽灵。
在经历了长期病痛折磨之后, 纳什竟然奇迹般康复了并且由于在 博弈论方面的奠定性工作,走上了 1994年诺贝尔经济学奖的领奖台
《美丽心灵》:该片荣获2001年奥斯 卡金像奖,几乎包揽了2002年电影类 的全球最高奖项。
最经典的博弈模型——囚徒困境
A抵赖、B抵赖:均判1年 A抵赖、B招认:A10年,B3年 A招认、B招认:A5年,B5年 A招认、B抵赖:A3年,B10年
者并不知道先行动者采取了什么具体行动。囚徒困境
动态博弈:参与者的行动有先后顺序,且后行动者能够观
察到先行动者所选择的行动。下棋
根据参与者对其他参与者的了解程度,博弈可分为完全信息
博弈和不完全信息博弈。
完全信息博弈:每一位参与者对其他参与者的特征、策略
及收益有准确的信息。老夫老妻吵架
不完全信息博弈:参与者对其他参与者的信息、策略空间
在一个行业中,大企业相当于大猪,小企业相当于小猪。 按按钮相当于研发新产品/开发新市场,需要不菲的投入, 所得到的好处就是能带来新的销售收入和利润。大企业生产 和营销能力强,资金雄厚,推出一种新产品以后可以大量生 产,进行广告宣传,迅速占领市场,获取高额利润,相当于 大猪的吃食能力强。 在企业准备研发新产品/开发新市场时,懂得智猪博弈非 常重要。它告诉我们:在博弈双方力量不对等的情况下,力 量强的一方的正确策略是根据对手情况做出选择,而力量弱 的一方的正确策略是等待,跟在大企业之后,或抢份,或为 之服务,从新产品和新市场中获得一点利益。
博弈论
王丽丽
课程要求
上课时间:第4-15周(共11周) 课堂要求:不允许迟到、早退、旷课 考试时间:第15周(12月:10号/12号) 考查方式:开卷/论文
一对情侣见了一个魔鬼 魔鬼要吃掉其中一个但不知道选哪一个
让他们两石头剪子布吃掉输的人
男孩女孩约定一起出石头
此男孩,在大学学过《博弈论》
反用智猪搏弈:TCL让对手自掘坟墓
所有通往地狱的路,原先都是准备到天堂去的
2004年5月18日,广州,一场商业“阳谋”在上演。这天,TCL举行 “开启中国大屏幕液晶电视新时代发布会”,当天晴空万里,会场彩旗飘飘。 国美、苏宁、永乐等国内电器零售连锁巨头来了,TCL为他们准备了一个 好消息——从当日起,TCL向他们全面下调大屏幕液晶电视价格,降幅为 30%! 大批的媒体记者从大江南北被邀请到了现场,等待他们的也有一个好消 息——TCL多媒体事业本部总裁史万文对他们放出豪言,“今天进入大屏幕 液晶电视的未来!此举标志着中国大屏幕高品质液晶电视普及进入百姓家庭 的序幕已经徐徐拉开。” 第二天,这句话便出现在了各地报纸的黄金版面上,一字不漏。
在市政府的斡旋下,当天,牛根生与潘刚共同在《关于退出北京奥运合 作伙伴申请活动的函》上签上了大名。此函是写给北京奥组委的,核心内容 为:根据呼和浩特人民政府市长办公会议精神,蒙牛与伊利“思之再三,决 定共同退出此次奥运合作伙伴申请活动”。 双方当面将此退出申请函发送给了奥组委,而且还发了两遍。
然而,蒙牛没想到,事情还是节外生枝了。奥组委在收到两家的退出申 请函之后,又收到了伊利再次申请成为赞助商的函件。没有了竞争对手,伊 利没有不赢的道理。
蒙牛一副志在必得的架势,伊利也没有闲着。
2005年11月初,伊利出资3000万元支持内蒙古自治区、呼和浩特市文化、 体育事业建设,其中,500万元用于为参加北京奥运会和下届全运会的内蒙 古籍运动员提供补贴、奖励。
伊利和蒙牛比着花钱,二者均欲罢不能,显然,他们正一步步陷入囚徒 困境。此时,无疑是蒙牛在声势上占据着上风。
按一下会有10个单位的猪食 落进槽里。由于按钮和食槽距 离较远,按按钮的体力耗费相
当于2个单位的食物。
小猪按:大猪9个,小猪1个(-2) 大猪按:大猪7个(-2),小猪3个 一起按:大猪7个,小猪3个
都不按:都是0个
大猪到底怎样才合算?答案是,大猪的最佳选择取决于 小猪的行动,如果小猪去按,大猪最好选择等待;如果小猪 不去按,则最佳选择是大猪亲自去按。 也就是说,在智猪博弈中:大猪没有占优策略,而小猪 有占优策略,它的最佳选择就是耐心等待大猪去按钮,才能 获得最佳结果。
1996年,有两位将博弈论应用于不对称信息下机制
设计的经济学家即莫里斯和维克瑞获得本年度诺贝尔
经济学奖。
2001年,有3位经济学家即阿克洛夫、斯蒂格利茨
和斯宾塞,在运用博弈论研究信息经济学方面取得了 很大成就,成为该年度的诺贝尔经济学奖得主。
2005年,诺贝尔经济学奖授予有以色列和美国双重 国籍的罗伯特〃J〃奥曼和美国人托马斯〃C〃谢林, 为了表彰他们通过博弈论分析增加了人们对合作与冲
2005年10月9日,对蒙牛和伊利来说,是个分水岭。 这天上午,呼和浩特市政府召开市长办公会议。“鉴于呼和浩特市几十 万奶农通过奶协向政府反映,蒙牛与伊利在竞争成为奥运赞助商过程中,花 钱太多,代价太大,将来不是变相增加农民负担,便是间接波及奶农生计; 又鉴于乳品行业原料涨价、产品降价,已经进入微利时代——为此,市委市 政府认为同城伙伴,不宜过分相争,建议两家一起退出北京奥运赞助商的申 请活动。”
的结果非常重要。
信息:参与者有关博弈的知识,特别是有关自然的选择、其他参
与者的特征和行动的知识。
支付或者效用:博弈的付出或者收益。 平衡:博弈中所有参与者的策略或行动组合的稳定状态。
博弈的分类
根据参与者的先后顺序,博弈可分为静态博弈和动态博弈。
静态博弈:博弈中参与者同时选择或非同时选择但后行动
及收益了解得不够准确、不够了解。相亲
根据参与者之间是否合作,博弈可分为合作博弈和非合作博 弈。
合作博弈:参与者之间有着一个对各方具有约束力的协议,
参与者在协议范围内进行的博弈。
反之,就是非合作博弈。
典型的合作博弈是寡头企业之间的串谋行为,即企业之
间通过公开或暗地里签订协议,对各自的价格或产量进行限
在英语中,Game与中文“博弈”含义相当,字面 意思是“游戏”,但与中文“游戏”意义不尽相同, Game特别强调游戏规则,注重游戏的策略,这与上述
博弈的含义大体相当,所以中文翻译Game时选择“博
弈”更为贴切。
博弈论(Game Theory)是使用数学模型研究冲突
对抗条件下最优决策问题的理论,是研究竞争的逻辑和 规律的理论,严格来说是属于数学的分支学科。通俗地 说,博弈论是关于竞争对决双方或多方的策略选择的学
制,以达到获取更多垄断利润的行为。 非合作博弈是博弈论讨论的主要内容。
非合作博弈可分为:完全信息静态博弈、完全信息动态博 弈、不完全信息静态博弈、不完全信息动态博弈。
非合作博弈
静态 完全信息
行动顺序
动态
完全信息动态博弈
完全信息静态博弈
信 息
不完全信息 不完全信息静态博弈 不完全信息动态博弈
现实社会中的真实游戏
囚徒困境 招认
A 抵赖
A10年 B3年
均判1年
招认
Hale Waihona Puke B 抵赖均判5年A3年 B10年
博弈中的各项基本要素
参与者:博弈中的决策主体,目的是通过选择行动以最大化自己
的效用水平。可以是自然人或团体。
战略:即策略,参与者在给定信息的情况下的行动规则,它规定
参与者在什么时候选择什么行动。
行动:参与者在博弈的某个时点的决策行为。行动的顺序对博弈
刹那间,摄影师把镜头对准了伊利的“冤家”——此时正作为嘉宾而坐 在台下的蒙牛总裁牛根生,给了牛根生一个大大的面部特写,纤毫毕现。
于是,全国的观众在电视画面上看到,牛根生黝黑、粗犷的脸上,足足 10多秒内毫无表情。没有人知道,这位竞标北京奥运会乳制品赞助商的失意 者,面对在台上慷慨陈词的对手,如何任凭内心江河倒灌,五味杂陈,脸上 却波澜不兴,不露声色。
囚徒困境
两个聪明的贼,为何最后共同走向了一个最愚蠢的结局?
事实上,这就是“囚徒”之所以“困境”的原因。不信,先 让这两个贼达成一致抵赖的协议,然后重新审判他们,两个 贼还会同时坦白。因为这时他们肯定都在琢磨:“对方要抵 赖,我只要坦白,便可以马上没事了。不好意思哈,哥们,
我先走了。”
结果,两个狡猾的贼,还是一起做了“蠢事”。
此时,我们遇到了博弈论的另一个非常重要的概念: 占优策略——即站在自己的立场上,无论对方如何选择,都 能让自己得到最好的结果。因而,坦白是A贼的占优策略; 同样,B贼的占优策略也是坦白。 囚徒困境在商业上无处不在,两家聪明的企业,在竞争 中经常难免上演两败俱伤的“蠢事”。价格战和广告战是最
典型的例子。
同在呼和浩特,伊利和蒙牛,历来都是冤家。不是冤家不聚头,这次,他 们又相遇了——他们都想借赞助奥运,提升品牌,打压对手。
早在1996年亚特兰大奥运会,伊利雪糕就作为奥运特许产品,成功地进 行了一次体育营销。但更富有戏剧性的是,那次伊利的功臣,如今都在蒙牛, 一个是牛根生,另一个是蒙牛副总裁孙先红,孙在2005年借赞助“超级女 声”,又为蒙牛立下了汗马功劳。 如今,奥运会来到了北京,对两家来说,自然都是不容错过的机会。 04年,蒙牛为每一位国家队运动员都配臵了“牛奶套餐”,开始为竞标 做热身运动。05年9月1日,蒙牛宣布,从当天起,北京市民每购买一袋蒙牛 牛奶,蒙牛就捐赠一分钱,用于北京奥运会公益活动志愿者的选拔和培训。 而之前,蒙牛就曾给北京申奥捐款1000万元。
和猪有关的博弈
猪的体脂肪率仅有14%,在家畜中最 爱好清洁,从不在吃睡之处排泄,而是 在远离食槽和窝床的一个固定地点解手,
在哺乳动物中智商名列前茅,忠诚度高
于猫狗……所以,当你想称赞一位女子 身材曼妙、仪表端庄、教养良好、才气 过人、忠贞不渝时,说她是“母猪”就 全概括了~~
商业搏弈论之智猪博弈
开启社会博弈之门
博弈论堪称史上最伟大的策略 智慧,了解博弈论对开启我们的心 智、发展我们的事业、营造我们的 生活都大有裨益。现在,我们就来 开启社会博弈的大门。