第12讲:博弈论简介(一)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
运筹学
第12讲:博弈论简介(一)
结论: 结论:
计算可得G 计算可得 NE>G* ; G*是该草地的最优放牧量,此时,草地资源不会遭到不可 是该草地的最优放牧量,此时, 是该草地的最优放牧量 逆转的破坏,草地资源恰好被充分利用; 逆转的破坏,草地资源恰好被充分利用;GNE>G*表示在 表示在 纳什均衡的情况下,草地被过度使用,由此逐年破坏后, 纳什均衡的情况下,草地被过度使用,由此逐年破坏后, 最终会导致荒漠化; 最终会导致荒漠化; 这个例子证明,如果一种资源没有排他性的所有权, 这个例子证明,如果一种资源没有排他性的所有权,就会 排他性的所有权 导致对这种资源的过度使用。公海捕鱼、 导致对这种资源的过度使用。公海捕鱼、山西小煤窑的过 度发展都属于这类问题。 度发展都属于这类问题。
运筹学
第12讲:博弈论简介(一)
博弈论分类简述
信息拥有程度 完全信息博弈 不完全信息博弈 决策时序 静态博弈 动态博弈 完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
运筹学
第12讲:博弈论简介(一)
dilemma) 一、囚徒困境(prisoners’ dilemma) 囚徒困境(
运筹学
第12讲:博弈论简介(一)
运筹学
第12讲:博弈论简介(一)
例3、公共物品的私人自愿供给 、
考虑一个城市位于大江边上,正在集资建设一座防洪大堤。 考虑一个城市位于大江边上,正在集资建设一座防洪大堤。每个居民 自愿提供沙袋,沙袋的总供给等于所有居民个人供给之和。 自愿提供沙袋,沙袋的总供给等于所有居民个人供给之和。沙袋的总 供给越大,大堤越坚固,所有居民都收益。 供给越大,大堤越坚固,所有居民都收益。 为第i个居民贡献的沙袋数量 个居民贡献的沙袋数量, 为沙袋的总数量 为沙袋的总数量; 是第i个居民的 设gi为第 个居民贡献的沙袋数量,G为沙袋的总数量;xi是第 个居民的 私人物品(例如 大米 消费量,居民i的效用函数为 的效用函数为u 私人物品 例如:大米 消费量,居民 的效用函数为 i(xi,G);Mi是第 个居 例如 大米)消费量 ; 是第i个居 民的个人总预算收入, 为沙袋的单价, 为大米的单价。 民的个人总预算收入, pG为沙袋的单价, pX为大米的单价。每个居民 面临的问题是:在给定 的情况下,如何选择自己的策略( 面临的问题是:在给定Mi的情况下,如何选择自己的策略(xi, gi), 使自己的效用最大。 使自己的效用最大。 问题的描述包括:求解帕累托最优下的 和纳什均衡下的 和纳什均衡下的G 问题的描述包括:求解帕累托最优下的G*和纳什均衡下的 NE ,比较 两种的差异,并得出有益的结论。 两种的差异,并得出有益的结论。
运筹学
第12讲:博弈论简介(一)
假设个人效用函数采用柯布-道格拉斯形式: 假设个人效用函数采用柯布-道格拉斯形式:
ui = xiα G β ,0 < α , β < 1, α + β ≤ 1
表示利己性, 表示利他性。 α表示利己性,β表示利他性。 (一)考虑所有居民(共n人)的收入水平相同,均为 ,则 考虑所有居民( 人 的收入水平相同,均为M,
运筹学
第12讲:博弈论简介(一)
囚犯 B 囚犯 A 坦白 抵赖 坦白 -8,-8 , -10,0 , 抵赖 0,-10 , -3,-3 ,
(坦白,坦白)是双方决策的纳什均衡解,但该结果不是双方的 坦白,坦白)是双方决策的纳什均衡解 纳什均衡 帕累托均衡解。 帕累托均衡解
纳什均衡:各方从自身效用最大化角度出发进行决策所导致的均衡结果。 纳什均衡:各方从自身效用最大化角度出发进行决策所导致的均衡结果。 帕累托均衡:各方从整体效用最大化角度出发进行决策所产生的结果。 帕累托均衡:各方从整体效用最大化角度出发进行决策所产生的结果。 帕累托均衡状态是不稳定的,纳什均衡才是稳定的结果。在现实问题中, 帕累托均衡状态是不稳定的,纳什均衡才是稳定的结果。在现实问题中, 决策各方为追求自身效用的最大化,往往难以实现整体的帕累托最优, 决策各方为追求自身效用的最大化,往往难以实现整体的帕累托最优, 决策的结果是纳什均衡。 决策的结果是纳什均衡。
小猪 大猪 按 等待 按 5, 1 , 9, - 1 , 等待 4, 4 , 0, 0 ,
运筹学
第12讲:博弈论简介(一)
智猪博弈中,双方决策的纳什均衡为( 等待) 智猪博弈中,双方决策的纳什均衡为(按,等待),多 劳者不多得。 劳者不多得。 例如,大企业和小企业(新产品的研发、广告) 例如,大企业和小企业(新产品的研发、广告) 公共产品提供(两户人家修路) 公共产品提供(两户人家修路) 股份公司中的大股东和小股东(大股东收集信息、 股份公司中的大股东和小股东(大股东收集信息、监督 经理,小股东搭便车) 经理,小股东搭便车)
运筹学
第12讲:博弈论简介(一)
考虑所有居民( (二)考虑所有居民(共n人)的收入水平不相同 人
公共物品的纳什均衡供给小于帕累托最优供给; 公共物品的纳什均衡供给小于帕累托最优供给; 收入平均分配下的纳什均衡总供给小于分配不均时的纳什均衡总供给; 收入平均分配下的纳什均衡总供给小于分配不均时的纳什均衡总供给; 供给不足的程度会随着收入分配的差距的扩大而减弱。 供给不足的程度会随着收入分配的差距的扩大而减弱。
运筹学
第12讲:博弈论简介(一)
二、关于纳什均衡的三个案例
例1、古诺(Cournot)模型 、古诺( )
两个寡头企业,分别称为企业1和企业 和企业2, 两个寡头企业 , 分别称为企业 和企业 , 每个企业的策 略是选择产量 效用是利润 利润是企业产量的函数。 产量; 利润, 略是选择产量;效用是利润,利润是企业产量的函数。
给定纳什均衡解,如果某个企业提高产量 双方收益均下降 双方收益均下降, 给定纳什均衡解,如果某个企业提高产量,双方收益均下降,损 人不利己 帕累托均衡解是不稳定的 ,最后双方的产量稳定在纳什均衡解 最后双方的产量稳定在纳什均衡解 纳什均衡解有利于消费者
运筹学
第12讲:博弈论简介(一)
例如:彩电联盟(联合维持价格) OPEC( 例如:彩电联盟(联合维持价格)、OPEC(石油输出 国组织联盟) 哥本哈根气候大会等; 国组织联盟)、哥本哈根气候大会等; 多成员联盟内达成的协议如果不是纳什均衡的话, 多成员联盟内达成的协议如果不是纳什均衡的话,是 不稳定的。 不稳定的。
两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里受审。 两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里受审。警 察告诉他们:如果两人都坦白,各判刑8 如果两个都抵赖, 察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各 可能因证据不足) 如果一人坦白一人抵赖, 判3年(可能因证据不足);如果一人坦白一人抵赖,坦白的放出 去,抵赖的判刑10年。 抵赖的判刑10年 10
囚犯 B 囚犯 A 坦白 抵赖 坦白 -8,-8 , -10,0 , 抵赖 0,-10 , -3,-3 ,
博弈矩阵
(坦白,坦白)是双方决策的纳什均衡 坦白,坦白)
运筹学
第12讲:博弈论简介(一)
囚徒困境” 与“囚徒困境”类似的几个例 子 广告战
企业 乙 做广告 不做广告 6,6 12,4 4,12 10,10
运筹学
第12讲:博弈论简介(一)
例2、公共地悲剧 、
一个村庄有一片草地, 个牧民, 一个村庄有一片草地,有n个牧民,每个牧民都有在草地上放羊的 个牧民 自由。每年春天,每个牧民决定自己今年要养多少羊; 自由。每年春天,每个牧民决定自己今年要养多少羊; gi表示第 个牧民养羊的数量;G表示羊的总数量;v表示每只羊的价 表示第i个牧民养羊的数量 个牧民养羊的数量; 表示羊的总数量 表示羊的总数量; 表示每只羊的价 值;注意!我们认为羊的增多以破坏草地资源为代价,因此,可以 注意!我们认为羊的增多以破坏草地资源为代价,因此, 认为v是 的函数 的函数, 越大 越小。 越大v越小 认为 是G的函数,G越大 越小。 问题的描述包括:求解帕累托均衡下的 和纳什均衡下的G*, 问题的描述包括:求解帕累托均衡下的GNE和纳什均衡下的 ,比 较两种的差异,并得出有益的结论。 较两种的差异,并得出有益的结论。
运筹学
第12讲:博弈论简介(一)
三、除“囚徒困境”外的几类博弈 囚徒困境”
智猪博弈( 智猪博弈(boxed pigs game) )
猪圈里有一头大猪和一头小猪,猪圈的一头有一个猪食槽, 猪圈里有一头大猪和一头小猪,猪圈的一头有一个猪食槽,另一头 安装一个按钮来控制猪食的供应。按一下按钮会有 个单位的猪食 安装一个按钮来控制猪食的供应。按一下按钮会有10个单位的猪食 进槽,但谁按按钮谁就要付出2个单位的成本。如果大猪先到,大 个单位的成本。 进槽,但谁按按钮谁就要付出 个单位的成本 如果大猪先到, 猪吃9个单位,小猪 个单位 如果小猪先到,大猪6个单位 小猪4 个单位; 个单位, 猪吃 个单位,小猪1个单位;如果小猪先到,大猪 个单位,小猪 个单位 个单位;如果同时到,大猪 个单位 小猪3个单位 个单位, 个单位。 个单位;如果同时到,大猪7个单位,小猪 个单位。
第12讲: 12讲 博弈论简介(一) 博弈论简介(
浙江工业大学经贸管理学院 曹柬
运筹学
第12讲:博弈论简介(一)
game theory:在西方,game是人们遵循一 :在西方, 是人们遵循一 定规则下的活动, 定规则下的活动,参与人的目的是使自己 “赢”。Olympic Games,有竞赛的意思。 ,有竞赛的意思。 中文译为博弈论或对策论。 中文译为博弈论或对策论。
G
NE
nβ M = ⋅ , G * = nβ ⋅ M nα + β pG α + β pG
,
G NE α +β = <1 * G nα + β
公共物品的纳什均衡供给小于帕累托最优供给; 公共物品的纳什均衡供给小于帕累托最优供给; 二者之间的差距随着城市居民人数的增加而扩大; 二者之间的差距随着城市居民人数的增加而扩大; 也与α/β的比率有关,比例越大 自利性强 ,表示居民们更看重个人消费带给自己的 的比率有关,比例越大(自利性强 自利性强), 也与 的比率有关 效用,而导致公共物品供给严重不足;比例越小(利他性强 利他性强) 效用 , 而导致公共物品供给严重不足 ; 比例越小 利他性强 ) , 纳什均衡供给趋向于 帕累托最优水平。 帕累托最优水平。
应试教育的困境
父Βιβλιοθήκη Baidu的选择:减负、增负。纳什均衡为都“增负” 父母的选择:减负、增负。纳什均衡为都“增负”。教育 部的减负文件都是无效文件。 部的减负文件都是无效文件。 在应试教育的前提下,即使原先所有的学生都是减负的, 在应试教育的前提下,即使原先所有的学生都是减负的, 这种状态也是不均衡的,不长久的。 这种状态也是不均衡的,不长久的。
企业 做广告 甲 不做广告
(做广告,做广告)是双方决策的纳什均衡 做广告,做广告)
运筹学
第12讲:博弈论简介(一)
军备竞赛
国家 乙 搞军备 不搞军备 6,6 , 12,4 , 4,12 , 10,10 ,
国家 甲
搞军备 不搞军备
(搞军备,搞军备)是双方决策的纳什均衡 搞军备,搞军备)
运筹学
第12讲:博弈论简介(一)