应用运筹学-博弈论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
从理论上讲,博弈论是研究理性的行动者 (agents)相互作用的形式理论,而实际 上它正深入到经济学、政治学、社会学等 等,被各门社会科学所应用。
博弈论与经济学
博弈论进入主流经济学,反映了经济 学发展的几个趋势:
–经济学研究的对象越来越转向个体; –经济学越来越转向人与人关系的研究; –经济学越来越重视对信息的研究,特别
这就是博弈!
什么是博弈?
每天的报纸,头版的新闻也许是某些政治谈 判、武装暴力冲突,或是罢工;可能是国家 政府对住房的改善,在健康和社会福利方面 财政的重新分配。。 美国金融危机, 三汽车巨头与政府的博弈; 共同之处:人或群体之间的利益冲突、对抗
常见的现象
为什么家电企业要进行价格大战? 为什么五花八门的价格联盟总是非常短命? 为什么家长们拼命地给孩子上各种课外补习 班、冲刺班? 为什么旅游景点的东西总是质次价高? 麦当劳和肯德基为何总是离得不远? 。。。。
中国北方草原荒漠化的问题
荒漠化的速度呈上升趋势。20世纪50年代至70 年代中期,土地荒漠化年均扩大1560平方公里 ;而在70年代中期到80年代中期,年均扩大面 积为2100平方公里。目前的扩大速度为每年 2460平方公里。这个速度还在增加。
现在普遍的观点是,荒漠化的原因,是由于人 类对土地资源的过度利用,对土地的利用超过 了它的承受能力。在北方,雨水量小,土地上 的生态系统脆弱,为了维持人口的过度增长对 粮食等的需求,人们对土地的索取呈加速趋势 。对土地的“滥垦”、“滥牧”、“滥樵”、 “滥采”是土地沙漠化的主要原因
“囚徒困境”的正面效用
从消费者的角度,竞争带来降价,得到 实惠。 从企业的角度,鼓励竞争,激励企业不 断创新,开发新技术,提升产品质量, 拓展市场,从而赢得市场。
对经典经济学的冲击
古典经济学的创始人亚当·斯密曾经描 述,市场机制这只“看不见的手”,会 引导人们自利的行为促进社会的福利。 博弈论的“囚徒困境”却揭示,非合作 的自利行为可能导致两败俱伤的前景。 难怪著名经济学家保罗·萨缪尔森说: “要想在现代社会做一个有文化的人, 你必须对博弈论有一个大致了解。
Prisoner’s Dilemma
A prisoner’s dilemma
• if neither confesses, 1 year in prison each • if both confess, 8 years in prison each • if one confesses, and one doesn’t, then free for the one who does and 10 for the one who does not
博弈论的历史沿革
十九世纪提出Cournot的寡头竞争模型
博 弈 理 论 开 始 于 1 9 4 4 年 由 冯 ·诺 依 曼 ( Von
Neumann)和摩根斯坦恩(Oskar Morgenstern)
合作的《博弈论和经济行为》(The Theory of Games and Economic Behaviour) 一 书 由 Princeton University Press出版。
策略性思维 ——博弈概论
决策无处不在
工作,即便只是社交生活,也可以看做是一 个永无止息的决策过程; 通常人们的决策面临两种决策环境:比较伐 木工人和一个将军的决策会有什么区别:
– 伐木工人的工作环境是中立的,没有对抗; – 而将军的任何一种行动都会遭遇对手的抵抗;
研究前者的方法是决策论 研究后者的是博弈论
纳什的开创性论文《n人博弈的均衡点》(1950 )、《非合作博弈》(1951)等等,给出了纳 什均衡的概念和均衡存在定理。
纳什均衡
Nash Equilibrium
当每个局中 人都选择了自己 的最优反应策略 ,并且这些最优 反应形成一个策 略组合,便形成 了纳什均衡。
博弈论的理论意义
博弈论对于社会科学有着重要的意义,它 正成为社会科学研究范式中的一种核心工 具,以至于我们可称博弈论是“社会科学 的数学”,或者说是关于社会的数学。
我国应试教育的困境
在现有的教育体制下,从小学甚至幼儿园 起,家长就不得不带孩子去上课外的奥数 班,孩子们失去了童年的快乐。 其实每一位家长都希望自己的孩子有一个 快乐的童年,但是现实是你的孩子不上奥 数班,而其他的孩子上了,你的孩子就显 得落后,难以上到好的中学。
公共资源悲剧
哈丁(Garrit Hadin)1968年在《科学》杂志上发 表了一篇文章,题为The Tragedy of the Commons 。
囚徒困境
A. W. Tucker的囚犯困境(PriLeabharlann Baiduoner‘s Dilemma):
囚徒B
坦白
抵赖
坦白 -8,-8 0 ,-10
囚徒A
抵赖 -10, 0 -1,-1
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的 意义。个人理性与集体理性的冲突,各 人追求利己行为而导致的最终结局是一 个“纳什均衡”,也是对所有人都不利 的结局。
哈丁举例:一群牧民面对向他们开放的草地,每 一个牧民都想多养一头牛,因为多养一头牛增加 的收益大于其购养成本,是合算的,尽管因平均 草量下降,可能使整个牧区的牛的单位收益下降 。每个牧民都可能多增加一头牛,草地将可能被 过度放牧,从而不能满足牛的食量,致使所有牧 民的牛均饿死。这就是公共资源的悲剧。
你如何选择?
如果他拿的是16000元的红包,他肯定不 会提出和你交换;又因为他知道你不比 他傻,你拿到16000元的红包也不会和他 交换,你之所以同意和他交换仅仅是因 为你拿到比16000元少的红包。以此类推 ,只有当你的同事拿的是500元的红包时 ,他才会和你交换,而此时你当然不应 该和他交换。
1996
The prize was awarded jointly to James A. Mirrless and William
Vickery for their pioneering analysis of
Information Economics
(不对称信息条件下激励机制问题)
2001
The prize was awarded jointly to Jeorge Akerlof(阿克洛夫)、 Michael Spence(斯宾塞)and Joseph Stiglitz(斯蒂格利茨)
待宰的猴群
在一个笼子里关了一群猴子,主人每过一天就 打开笼子抓一只猴子去杀掉。每天主人来时, 每个猴子都紧张,它们不敢有任何举动,怕引 起主人的注意而被主人选中。当主人把目光落 在其中一只猴子身上时,其余的猴子就希望主 人赶快决定。当主人最终作出决定时,没有被 选中的猴子非常高兴。那个被选中的猴子拼命 反抗,其余猴子在一旁幸灾乐祸地观看,这只 猴子被杀掉了。这样的过程日复一日地进行着 ,最终猴子全部被宰杀掉了。
for their pioneering analysis of
非对称信息市场分析方面杰出贡献
为什么要学习博弈论?
博弈论告诉人们,要学会理解他人都有自 己的思想,每个个体都是理性的,所以必 须了解竞争对手的思想。但博弈论并不是 疗法,并不是处方。
博弈论可以解释经济中许多低效率现象的 根源,找出导致低效率的制度原因,从而 帮助政府制订、修改政策完善交易制度和 提高经济效率。
囚徒困境说明了什么
在(坦白、坦白)这个组合中,两囚徒A和B 都不能通过单方面的改变行动增加自己的收益 ,于是谁也没有动力游离这个组合,因此这个 组合是纳什均衡,也叫非合作均衡。
囚徒困境反映了个人理性和集体理性的矛盾。 如果A和B都选择抵赖,各判刑1年,显然比 都选择坦白各判刑8年好得多。当然,A和B 可以在被警察抓到之前订立一个"攻守同盟", 但是这可能不会有用,因为它不构成纳什均衡 ,没有人有积极性遵守这个协定,显然最好的策 略是双方都抵赖.
是信息不对称对个人选择及制度安排的 影响。
1994
The prize was awarded jointly to John Harsanyi, John F. Nash and
Reinhard Selten for their pioneering analysis of
equilibria in the theory of non-cooperative games.
❖ 重要的是每个参与人必须有可供选择的 行动和一个偏好函数。
行动 Action or Moves
参与人在博弈的某个时点的决策变量。 {坦白,抵赖}
N个参与人的行动的有序集称为行动组合。 例如:(坦白,抵赖)。
你如何选择?
假如你拿到一个4000元的红包,则你知 道你的同事的红包要么是2000元,要么 是8000元,两者的概率相等,所以你的 期望收入是5000元,高于你自己现在的 4000元。 如果按照这样的常理进行思考,你会得 到应该和同事交换红包的结论。但是, 你的这个推理是错误的。因为你没有考 虑你的同事的反应。
为什么要了解博弈论?
假如你是一个公司的老总,你在决定是 否将自己的产品降价以及降价多少时, 必须首先要考虑至少以下几个方面的问 题:消费者将会增加购买吗?大概会增 加多少购买量呢?其他同种产品的厂家 也会降价吗?等等。
为什么要了解博弈论?
如果想赢得生意,不可不了解博弈论, 一位商业人士每天都在不停谈判之中, 与对手谈判,与员工谈判,与经理同事 谈判,与董事会谈判; 如果你想赢得生活,也不可不懂博弈论 ,赢得你的爱情、教育你的孩子、学会 与朋友相处,只要是人与人之间的行为 ,就有博弈存在的空间。
价格大战
厂家价格大战的结局也是一个“纳 什均衡”,而且价格战的结果是谁 都没钱赚。因为博弈双方的利润正 好是零。竞争的结果是稳定的,即 是一个“纳什均衡”。这个结果可 能对消费者是有利的,但对厂商而 言是灾难性的。所以,价格战对厂 商而言意味着自杀。
石油输出国 OPEC
几乎所有的卡特尔都会遭到失败,原因 就在于卡特尔的协定(类似囚犯的攻守 同盟)不是一个纳什均衡,没有成员有 兴趣遵守。那么是不是不可能有卡特尔 合作成功了?
你如何选择?
假如你和你的同事各自从公司老板那里得 到一个红包,里面的钱可能是500元、1000 元、2000元、4000元、8000元,或者16000 元。每人都知道同事的红包里的钱要么是 自己的两倍,要么是自己的一半。 在你拿到了自己的红包,知道了红包里的 钱数后,如果你的同事要求和你交换红包 ,你会愿意吗?
博弈的要素
什么是博弈?
A. W. Tucker的囚犯困境(Prisoner‘s Dilemma):
囚徒B
坦白
抵赖
坦白 -8,-8 0 ,-10
囚徒A
抵赖 -10, 0 -1,-1
参与人 players
❖ 一个博弈中的决策主体,他的目的是通 过选择行动(或战略)以最大化自己的 支付(效用)。参与人可能是自然人, 也可能是团体,如企业,国家等。
光天化日之下的违法
在现实社会中,窃贼在公共场所比如公共 汽车上偷东西时,车上的乘客看到了,但 不敢吭声。没有被偷的人想,反正被偷的 待宰猴群的结局人不是我,我反抗了,我 得不到任何好处,反而遭到伤害;而不反 抗虽不得益,但也不受损,我何必要反抗 呢?这就是光天化日之下的偷窃行为为什 么总能成功的原因。
理论上,如果是无限期的合作,双方考 虑长远利益,他们的合作是会成功的。 但只要是有限次的合作,合作就不会成 功。比如合作10次,那么在第九次博 弈参与人就会采取不合作态度。
美国“禁烟运动”
1971年美国国会通过了一项法令,禁止 烟草公司在电视上做广告。令人称奇的 是,一向财大气粗的烟草商反应平静, 并没有动用其庞大的社会资源来阻止这 一法令的通过。这是为什么呢?
GAMES
Prisoner’s Dilemma 囚徒困境
囚徒困境
两个囚犯都可以做出自己的选择:
– 或者供出他的同伙(即与警察合作,从而背叛他的同伙), – 或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话 ,就都会被轻判。 但警方也明白这一点,所以他们就给了这两个囚 犯一点儿刺激:如果他们中的一个人背叛,即告 发他的同伙,那么他就可以被无罪释放,而他的 同伙就会被按照最重的罪来判决。
博弈论与经济学
博弈论进入主流经济学,反映了经济 学发展的几个趋势:
–经济学研究的对象越来越转向个体; –经济学越来越转向人与人关系的研究; –经济学越来越重视对信息的研究,特别
这就是博弈!
什么是博弈?
每天的报纸,头版的新闻也许是某些政治谈 判、武装暴力冲突,或是罢工;可能是国家 政府对住房的改善,在健康和社会福利方面 财政的重新分配。。 美国金融危机, 三汽车巨头与政府的博弈; 共同之处:人或群体之间的利益冲突、对抗
常见的现象
为什么家电企业要进行价格大战? 为什么五花八门的价格联盟总是非常短命? 为什么家长们拼命地给孩子上各种课外补习 班、冲刺班? 为什么旅游景点的东西总是质次价高? 麦当劳和肯德基为何总是离得不远? 。。。。
中国北方草原荒漠化的问题
荒漠化的速度呈上升趋势。20世纪50年代至70 年代中期,土地荒漠化年均扩大1560平方公里 ;而在70年代中期到80年代中期,年均扩大面 积为2100平方公里。目前的扩大速度为每年 2460平方公里。这个速度还在增加。
现在普遍的观点是,荒漠化的原因,是由于人 类对土地资源的过度利用,对土地的利用超过 了它的承受能力。在北方,雨水量小,土地上 的生态系统脆弱,为了维持人口的过度增长对 粮食等的需求,人们对土地的索取呈加速趋势 。对土地的“滥垦”、“滥牧”、“滥樵”、 “滥采”是土地沙漠化的主要原因
“囚徒困境”的正面效用
从消费者的角度,竞争带来降价,得到 实惠。 从企业的角度,鼓励竞争,激励企业不 断创新,开发新技术,提升产品质量, 拓展市场,从而赢得市场。
对经典经济学的冲击
古典经济学的创始人亚当·斯密曾经描 述,市场机制这只“看不见的手”,会 引导人们自利的行为促进社会的福利。 博弈论的“囚徒困境”却揭示,非合作 的自利行为可能导致两败俱伤的前景。 难怪著名经济学家保罗·萨缪尔森说: “要想在现代社会做一个有文化的人, 你必须对博弈论有一个大致了解。
Prisoner’s Dilemma
A prisoner’s dilemma
• if neither confesses, 1 year in prison each • if both confess, 8 years in prison each • if one confesses, and one doesn’t, then free for the one who does and 10 for the one who does not
博弈论的历史沿革
十九世纪提出Cournot的寡头竞争模型
博 弈 理 论 开 始 于 1 9 4 4 年 由 冯 ·诺 依 曼 ( Von
Neumann)和摩根斯坦恩(Oskar Morgenstern)
合作的《博弈论和经济行为》(The Theory of Games and Economic Behaviour) 一 书 由 Princeton University Press出版。
策略性思维 ——博弈概论
决策无处不在
工作,即便只是社交生活,也可以看做是一 个永无止息的决策过程; 通常人们的决策面临两种决策环境:比较伐 木工人和一个将军的决策会有什么区别:
– 伐木工人的工作环境是中立的,没有对抗; – 而将军的任何一种行动都会遭遇对手的抵抗;
研究前者的方法是决策论 研究后者的是博弈论
纳什的开创性论文《n人博弈的均衡点》(1950 )、《非合作博弈》(1951)等等,给出了纳 什均衡的概念和均衡存在定理。
纳什均衡
Nash Equilibrium
当每个局中 人都选择了自己 的最优反应策略 ,并且这些最优 反应形成一个策 略组合,便形成 了纳什均衡。
博弈论的理论意义
博弈论对于社会科学有着重要的意义,它 正成为社会科学研究范式中的一种核心工 具,以至于我们可称博弈论是“社会科学 的数学”,或者说是关于社会的数学。
我国应试教育的困境
在现有的教育体制下,从小学甚至幼儿园 起,家长就不得不带孩子去上课外的奥数 班,孩子们失去了童年的快乐。 其实每一位家长都希望自己的孩子有一个 快乐的童年,但是现实是你的孩子不上奥 数班,而其他的孩子上了,你的孩子就显 得落后,难以上到好的中学。
公共资源悲剧
哈丁(Garrit Hadin)1968年在《科学》杂志上发 表了一篇文章,题为The Tragedy of the Commons 。
囚徒困境
A. W. Tucker的囚犯困境(PriLeabharlann Baiduoner‘s Dilemma):
囚徒B
坦白
抵赖
坦白 -8,-8 0 ,-10
囚徒A
抵赖 -10, 0 -1,-1
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的 意义。个人理性与集体理性的冲突,各 人追求利己行为而导致的最终结局是一 个“纳什均衡”,也是对所有人都不利 的结局。
哈丁举例:一群牧民面对向他们开放的草地,每 一个牧民都想多养一头牛,因为多养一头牛增加 的收益大于其购养成本,是合算的,尽管因平均 草量下降,可能使整个牧区的牛的单位收益下降 。每个牧民都可能多增加一头牛,草地将可能被 过度放牧,从而不能满足牛的食量,致使所有牧 民的牛均饿死。这就是公共资源的悲剧。
你如何选择?
如果他拿的是16000元的红包,他肯定不 会提出和你交换;又因为他知道你不比 他傻,你拿到16000元的红包也不会和他 交换,你之所以同意和他交换仅仅是因 为你拿到比16000元少的红包。以此类推 ,只有当你的同事拿的是500元的红包时 ,他才会和你交换,而此时你当然不应 该和他交换。
1996
The prize was awarded jointly to James A. Mirrless and William
Vickery for their pioneering analysis of
Information Economics
(不对称信息条件下激励机制问题)
2001
The prize was awarded jointly to Jeorge Akerlof(阿克洛夫)、 Michael Spence(斯宾塞)and Joseph Stiglitz(斯蒂格利茨)
待宰的猴群
在一个笼子里关了一群猴子,主人每过一天就 打开笼子抓一只猴子去杀掉。每天主人来时, 每个猴子都紧张,它们不敢有任何举动,怕引 起主人的注意而被主人选中。当主人把目光落 在其中一只猴子身上时,其余的猴子就希望主 人赶快决定。当主人最终作出决定时,没有被 选中的猴子非常高兴。那个被选中的猴子拼命 反抗,其余猴子在一旁幸灾乐祸地观看,这只 猴子被杀掉了。这样的过程日复一日地进行着 ,最终猴子全部被宰杀掉了。
for their pioneering analysis of
非对称信息市场分析方面杰出贡献
为什么要学习博弈论?
博弈论告诉人们,要学会理解他人都有自 己的思想,每个个体都是理性的,所以必 须了解竞争对手的思想。但博弈论并不是 疗法,并不是处方。
博弈论可以解释经济中许多低效率现象的 根源,找出导致低效率的制度原因,从而 帮助政府制订、修改政策完善交易制度和 提高经济效率。
囚徒困境说明了什么
在(坦白、坦白)这个组合中,两囚徒A和B 都不能通过单方面的改变行动增加自己的收益 ,于是谁也没有动力游离这个组合,因此这个 组合是纳什均衡,也叫非合作均衡。
囚徒困境反映了个人理性和集体理性的矛盾。 如果A和B都选择抵赖,各判刑1年,显然比 都选择坦白各判刑8年好得多。当然,A和B 可以在被警察抓到之前订立一个"攻守同盟", 但是这可能不会有用,因为它不构成纳什均衡 ,没有人有积极性遵守这个协定,显然最好的策 略是双方都抵赖.
是信息不对称对个人选择及制度安排的 影响。
1994
The prize was awarded jointly to John Harsanyi, John F. Nash and
Reinhard Selten for their pioneering analysis of
equilibria in the theory of non-cooperative games.
❖ 重要的是每个参与人必须有可供选择的 行动和一个偏好函数。
行动 Action or Moves
参与人在博弈的某个时点的决策变量。 {坦白,抵赖}
N个参与人的行动的有序集称为行动组合。 例如:(坦白,抵赖)。
你如何选择?
假如你拿到一个4000元的红包,则你知 道你的同事的红包要么是2000元,要么 是8000元,两者的概率相等,所以你的 期望收入是5000元,高于你自己现在的 4000元。 如果按照这样的常理进行思考,你会得 到应该和同事交换红包的结论。但是, 你的这个推理是错误的。因为你没有考 虑你的同事的反应。
为什么要了解博弈论?
假如你是一个公司的老总,你在决定是 否将自己的产品降价以及降价多少时, 必须首先要考虑至少以下几个方面的问 题:消费者将会增加购买吗?大概会增 加多少购买量呢?其他同种产品的厂家 也会降价吗?等等。
为什么要了解博弈论?
如果想赢得生意,不可不了解博弈论, 一位商业人士每天都在不停谈判之中, 与对手谈判,与员工谈判,与经理同事 谈判,与董事会谈判; 如果你想赢得生活,也不可不懂博弈论 ,赢得你的爱情、教育你的孩子、学会 与朋友相处,只要是人与人之间的行为 ,就有博弈存在的空间。
价格大战
厂家价格大战的结局也是一个“纳 什均衡”,而且价格战的结果是谁 都没钱赚。因为博弈双方的利润正 好是零。竞争的结果是稳定的,即 是一个“纳什均衡”。这个结果可 能对消费者是有利的,但对厂商而 言是灾难性的。所以,价格战对厂 商而言意味着自杀。
石油输出国 OPEC
几乎所有的卡特尔都会遭到失败,原因 就在于卡特尔的协定(类似囚犯的攻守 同盟)不是一个纳什均衡,没有成员有 兴趣遵守。那么是不是不可能有卡特尔 合作成功了?
你如何选择?
假如你和你的同事各自从公司老板那里得 到一个红包,里面的钱可能是500元、1000 元、2000元、4000元、8000元,或者16000 元。每人都知道同事的红包里的钱要么是 自己的两倍,要么是自己的一半。 在你拿到了自己的红包,知道了红包里的 钱数后,如果你的同事要求和你交换红包 ,你会愿意吗?
博弈的要素
什么是博弈?
A. W. Tucker的囚犯困境(Prisoner‘s Dilemma):
囚徒B
坦白
抵赖
坦白 -8,-8 0 ,-10
囚徒A
抵赖 -10, 0 -1,-1
参与人 players
❖ 一个博弈中的决策主体,他的目的是通 过选择行动(或战略)以最大化自己的 支付(效用)。参与人可能是自然人, 也可能是团体,如企业,国家等。
光天化日之下的违法
在现实社会中,窃贼在公共场所比如公共 汽车上偷东西时,车上的乘客看到了,但 不敢吭声。没有被偷的人想,反正被偷的 待宰猴群的结局人不是我,我反抗了,我 得不到任何好处,反而遭到伤害;而不反 抗虽不得益,但也不受损,我何必要反抗 呢?这就是光天化日之下的偷窃行为为什 么总能成功的原因。
理论上,如果是无限期的合作,双方考 虑长远利益,他们的合作是会成功的。 但只要是有限次的合作,合作就不会成 功。比如合作10次,那么在第九次博 弈参与人就会采取不合作态度。
美国“禁烟运动”
1971年美国国会通过了一项法令,禁止 烟草公司在电视上做广告。令人称奇的 是,一向财大气粗的烟草商反应平静, 并没有动用其庞大的社会资源来阻止这 一法令的通过。这是为什么呢?
GAMES
Prisoner’s Dilemma 囚徒困境
囚徒困境
两个囚犯都可以做出自己的选择:
– 或者供出他的同伙(即与警察合作,从而背叛他的同伙), – 或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话 ,就都会被轻判。 但警方也明白这一点,所以他们就给了这两个囚 犯一点儿刺激:如果他们中的一个人背叛,即告 发他的同伙,那么他就可以被无罪释放,而他的 同伙就会被按照最重的罪来判决。