环境污染与治理中的博弈
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
小猪
按 按 5,1 不按 4 ,4
大猪 不按 9,-1 0,0
类似例子:股份公司的大股东,股票市场上的大户,富 户修路。
例三:性别战(battle of sexes)
女
足球 足球 2,1 0,0 芭蕾 0,0 1,2
男
芭蕾
这个博弈中有两个纳什均衡(足球,足球),(芭蕾,芭蕾)。实 际生活中,这里有一种先动优势(first-mover advantage)。
例四:斗鸡博弈(chicken game)
B 进 A 进 退 -3,-3 0,2 退 2 ,0 0 ,0
斗鸡博弈的应用:毛泽东战略思想,冷战期间美苏争霸, 警察与游行队伍,夫妻间吵架……
例五:市场进入阻挠(entry deterrence)
在位者
默许 进入 进入者 不进入 0,300 0,300 40,50 斗争 -10,0
仍然以市场进入为例
市场进入:高成本情况
市场进入:低成本情况
进入者
进入
不进入
在位者 默许 斗争 40,50 -10, 0
进 进入 入 0,300 0,300 者 不进入
在位者 默许 斗争 30,100 -10, 140
0,400 0,400
贝叶斯均衡
贝叶斯均衡是一种类型依从战略组合:给定自己的类 型和别人类型的概率分布的情况下,每个参与人的期 望效用得到了最大化,也就是说,没有人有积极性选 择其他战略。 在市场进入例子中,在位者有两种类型:高成本或低 成本。给定进入者选择进入的情况下,在位者选择默 许还是斗争依赖于他的类型;如果是高成本,就默许; 低成本,就斗争。进入者不知道在位者的实类型,但 是,如果他知道在位者高成本的可能性为x,低成本的 可能性为1-x,那么进入者选择进入得到的期望利润为 40x+(-10)(1-x),选择不进入的期望利润为0。当x>0.2 时,进入得到的期望利润大于不进入时的期望利润。 假定 x>0.2,贝叶斯纳什均衡是:进入者选择进入,高 成本在位者选择默许,低成本在位者选择斗争。
市场进入阻挠博弈树
默许 进入 在位者 斗争 40,50 -10,0
进入者
不进入
0,300
一个纳什均衡称为精炼纳什均衡,当只当参与人的战略在每一个子 博弈中都构成纳什均衡,就是说,组成精炼纳什均衡的战略必须在 每一个子博弈中都是最优的。
一个精炼纳什均衡首先必须是一个纳什均衡,但纳什均衡不一定是 精炼均衡。只有那些不包含不可置信威胁的纳什均衡才是精炼纳什 均衡。
例一:囚徒困境(prisoner’s dilemma)
囚徒B
坦白 坦白 -8,-8 -10,0 抵赖 0,-10 -1,-1
囚徒A
抵赖
类似例子:公共产品,军备竞赛,环境污染。
从囚徒困境中引出一个重要结 论:
一种体制或制度安排要发生效力, 必须是一种纳什均衡。否则,这种 制度安排便不能成立。
例二:智猪博弈(boxed pigs)
例:求爱博弈
求爱博弈:品德优良者求爱 求爱博弈:品德恶劣者求爱
你
接受 不接受
你Leabharlann Baidu
接受 不接受
求爱 求爱者
不求爱
100,100 -50, 0
0, 0 0,0
求爱
求爱者 不求爱 0, 0
100,100
-50, 0
0, 0
应用领域:招投标,拍卖
第四节:不完全信息动态博弈: 精炼贝叶斯均衡
精炼贝叶斯均衡是完全信息动态博弈的精炼纳什 均衡和不完全信息静态博弈的贝叶斯均衡的结合。 精炼贝叶斯均衡的要点:当事人要根据所观察到 的他人的行为来修正自己有关后者类型的“信念” (主观概率),并由此选择自己的行动。这里修 正过程中使用的是贝叶斯规则。 精炼贝叶斯均衡是所有参与人战略和信念的一种 结合,它满足如下条件(1)给定每个人有关其 他人类型的信念的情况下,他的战略选择是最优 的;(2)每个人有关他人类型的信念都是使用 贝叶斯法则从所观察到的行为中获得的。
承诺行动(commitment)
一个简单的办法:在位者可以和第三者 打赌,如果进入者进入后他不斗争,他 就付给后者100,这时,斗争的威胁就变 得可置信了
承诺行动的实例:
破釜沉舟 《三国演义》中曹操与袁绍仓亭之战 工业工程2001毕业设计
第三节:不完全信息静态博弈: 贝叶斯纳什均衡
第四节:不完全信息动态博弈: 精炼贝叶斯均衡
精炼贝叶斯均衡不能仅定义在战略组合 上,它必须同时说明参与人的信念,因 为最优战略是相对于信念而言的。 贝叶斯规则:是概率统计学中用所观察 到的现象修正先验概率的一种标准方法。 举例:黔驴技穷
子博弈精炼纳什均衡的实例
分析一下,如果一个姑娘爱上了一个小 伙子,她父亲坚决不同意,威胁说,如 果女儿不与小伙子断绝恋爱关系,他就 与女儿断绝父女关系。最后的结果会是 怎样的?父亲会不会跟女儿断绝父女关 系?
承诺行动(commitment)
承诺行动是当事人使自己的威胁战略变得可置 信的行动。一种威胁只有在当事人在不施行这 种威胁时,就会遭受更大的损失的时候。所以, 承诺行动意味着当事人要为自己的“失信”付 出成本,尽管这种成本并不一定真的发生。 思考:在市场进入博弈中,如果在位者通过某 种承诺行动使自己的“斗争”威胁变得可置信, 进入者就不敢进入,在位者就可以获得300的 垄断利润,而不是50的寡头利润。如何使“斗 争”威胁变得可置信?
四种不同的博弈
行动顺序 信息
静态
动态
完全信息
完全信息静 完全信息动 态博弈 态博弈
纳什均衡(纳什) 子博弈精炼纳什 均衡(泽尔腾)
不完全信息 不完全信息 不完全信息 静态博弈 动态博弈
贝叶斯纳什均衡 精炼贝叶斯纳什 (海萨尼) 均衡(泽尔腾)
第一节:完全信息静态博弈: 纳什均衡
纳什均衡:假设有n个人参与博弈,给定其他 人战略的条件下,每个人选择自己的最优战略 (个人最优战略可能依赖于也可能不依赖于其 他人的战略),所有参与人选择的战略一起构 成了一个战略组合(strategy profile)。纳什均 衡是这样一组战略组合,这种战略组合由所有 参与人的最优战略构成。也就是说,给定别人 战略的情况下,没有任何单个参与人有积极性 选择其他战略,从而没有任何人有积极性打破 这种均衡,即给定别人不动的情况下,没有人 有兴趣动。
环境污染与治理中的博弈
美国的政策
污染
发展 污染 中国 家的 政策 控制
控制
500,-500 250,250
0,0 -500,500
类似囚徒的困境博弈
第二节:完全信息动态博弈: 子博弈精炼纳什均衡
博弈的标准型表述有三个要素:参与人,每个 参与人可选择的策略,支付函数 博弈的扩展型(extensive form)表述包含五个要 素(1)参与人, (2)每个参与人选择行动的时点, (3)每个参与人在每次行动时可供选择的行动集 合, (4)每个参与人在每次行动时有关对手过 去行动选择的信息, (5)支付函数 博弈树(game trees):是扩展型的一种形象化表 述。
环境污染与治理中的博弈
博弈论的基础知识 完全信息静态博弈 环境污染与治理中的博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
博弈论的基础知识
博弈论(game theory):是研究决策主体的行为 发生直接相互作用时候的决策以及这种决策的 均衡问题的学科。 博弈的基本要素包括:参与人,行动,信息, 战略,支付函数,结果,均衡。 博弈的划分: 行动的先后顺序:静态博弈(static game)和动态 博弈(dynamic game)。 参与人对有关其他参与人的特征、战略空间以 及支付函数的知识的了解:完全信息和不完全 信息。
按 按 5,1 不按 4 ,4
大猪 不按 9,-1 0,0
类似例子:股份公司的大股东,股票市场上的大户,富 户修路。
例三:性别战(battle of sexes)
女
足球 足球 2,1 0,0 芭蕾 0,0 1,2
男
芭蕾
这个博弈中有两个纳什均衡(足球,足球),(芭蕾,芭蕾)。实 际生活中,这里有一种先动优势(first-mover advantage)。
例四:斗鸡博弈(chicken game)
B 进 A 进 退 -3,-3 0,2 退 2 ,0 0 ,0
斗鸡博弈的应用:毛泽东战略思想,冷战期间美苏争霸, 警察与游行队伍,夫妻间吵架……
例五:市场进入阻挠(entry deterrence)
在位者
默许 进入 进入者 不进入 0,300 0,300 40,50 斗争 -10,0
仍然以市场进入为例
市场进入:高成本情况
市场进入:低成本情况
进入者
进入
不进入
在位者 默许 斗争 40,50 -10, 0
进 进入 入 0,300 0,300 者 不进入
在位者 默许 斗争 30,100 -10, 140
0,400 0,400
贝叶斯均衡
贝叶斯均衡是一种类型依从战略组合:给定自己的类 型和别人类型的概率分布的情况下,每个参与人的期 望效用得到了最大化,也就是说,没有人有积极性选 择其他战略。 在市场进入例子中,在位者有两种类型:高成本或低 成本。给定进入者选择进入的情况下,在位者选择默 许还是斗争依赖于他的类型;如果是高成本,就默许; 低成本,就斗争。进入者不知道在位者的实类型,但 是,如果他知道在位者高成本的可能性为x,低成本的 可能性为1-x,那么进入者选择进入得到的期望利润为 40x+(-10)(1-x),选择不进入的期望利润为0。当x>0.2 时,进入得到的期望利润大于不进入时的期望利润。 假定 x>0.2,贝叶斯纳什均衡是:进入者选择进入,高 成本在位者选择默许,低成本在位者选择斗争。
市场进入阻挠博弈树
默许 进入 在位者 斗争 40,50 -10,0
进入者
不进入
0,300
一个纳什均衡称为精炼纳什均衡,当只当参与人的战略在每一个子 博弈中都构成纳什均衡,就是说,组成精炼纳什均衡的战略必须在 每一个子博弈中都是最优的。
一个精炼纳什均衡首先必须是一个纳什均衡,但纳什均衡不一定是 精炼均衡。只有那些不包含不可置信威胁的纳什均衡才是精炼纳什 均衡。
例一:囚徒困境(prisoner’s dilemma)
囚徒B
坦白 坦白 -8,-8 -10,0 抵赖 0,-10 -1,-1
囚徒A
抵赖
类似例子:公共产品,军备竞赛,环境污染。
从囚徒困境中引出一个重要结 论:
一种体制或制度安排要发生效力, 必须是一种纳什均衡。否则,这种 制度安排便不能成立。
例二:智猪博弈(boxed pigs)
例:求爱博弈
求爱博弈:品德优良者求爱 求爱博弈:品德恶劣者求爱
你
接受 不接受
你Leabharlann Baidu
接受 不接受
求爱 求爱者
不求爱
100,100 -50, 0
0, 0 0,0
求爱
求爱者 不求爱 0, 0
100,100
-50, 0
0, 0
应用领域:招投标,拍卖
第四节:不完全信息动态博弈: 精炼贝叶斯均衡
精炼贝叶斯均衡是完全信息动态博弈的精炼纳什 均衡和不完全信息静态博弈的贝叶斯均衡的结合。 精炼贝叶斯均衡的要点:当事人要根据所观察到 的他人的行为来修正自己有关后者类型的“信念” (主观概率),并由此选择自己的行动。这里修 正过程中使用的是贝叶斯规则。 精炼贝叶斯均衡是所有参与人战略和信念的一种 结合,它满足如下条件(1)给定每个人有关其 他人类型的信念的情况下,他的战略选择是最优 的;(2)每个人有关他人类型的信念都是使用 贝叶斯法则从所观察到的行为中获得的。
承诺行动(commitment)
一个简单的办法:在位者可以和第三者 打赌,如果进入者进入后他不斗争,他 就付给后者100,这时,斗争的威胁就变 得可置信了
承诺行动的实例:
破釜沉舟 《三国演义》中曹操与袁绍仓亭之战 工业工程2001毕业设计
第三节:不完全信息静态博弈: 贝叶斯纳什均衡
第四节:不完全信息动态博弈: 精炼贝叶斯均衡
精炼贝叶斯均衡不能仅定义在战略组合 上,它必须同时说明参与人的信念,因 为最优战略是相对于信念而言的。 贝叶斯规则:是概率统计学中用所观察 到的现象修正先验概率的一种标准方法。 举例:黔驴技穷
子博弈精炼纳什均衡的实例
分析一下,如果一个姑娘爱上了一个小 伙子,她父亲坚决不同意,威胁说,如 果女儿不与小伙子断绝恋爱关系,他就 与女儿断绝父女关系。最后的结果会是 怎样的?父亲会不会跟女儿断绝父女关 系?
承诺行动(commitment)
承诺行动是当事人使自己的威胁战略变得可置 信的行动。一种威胁只有在当事人在不施行这 种威胁时,就会遭受更大的损失的时候。所以, 承诺行动意味着当事人要为自己的“失信”付 出成本,尽管这种成本并不一定真的发生。 思考:在市场进入博弈中,如果在位者通过某 种承诺行动使自己的“斗争”威胁变得可置信, 进入者就不敢进入,在位者就可以获得300的 垄断利润,而不是50的寡头利润。如何使“斗 争”威胁变得可置信?
四种不同的博弈
行动顺序 信息
静态
动态
完全信息
完全信息静 完全信息动 态博弈 态博弈
纳什均衡(纳什) 子博弈精炼纳什 均衡(泽尔腾)
不完全信息 不完全信息 不完全信息 静态博弈 动态博弈
贝叶斯纳什均衡 精炼贝叶斯纳什 (海萨尼) 均衡(泽尔腾)
第一节:完全信息静态博弈: 纳什均衡
纳什均衡:假设有n个人参与博弈,给定其他 人战略的条件下,每个人选择自己的最优战略 (个人最优战略可能依赖于也可能不依赖于其 他人的战略),所有参与人选择的战略一起构 成了一个战略组合(strategy profile)。纳什均 衡是这样一组战略组合,这种战略组合由所有 参与人的最优战略构成。也就是说,给定别人 战略的情况下,没有任何单个参与人有积极性 选择其他战略,从而没有任何人有积极性打破 这种均衡,即给定别人不动的情况下,没有人 有兴趣动。
环境污染与治理中的博弈
美国的政策
污染
发展 污染 中国 家的 政策 控制
控制
500,-500 250,250
0,0 -500,500
类似囚徒的困境博弈
第二节:完全信息动态博弈: 子博弈精炼纳什均衡
博弈的标准型表述有三个要素:参与人,每个 参与人可选择的策略,支付函数 博弈的扩展型(extensive form)表述包含五个要 素(1)参与人, (2)每个参与人选择行动的时点, (3)每个参与人在每次行动时可供选择的行动集 合, (4)每个参与人在每次行动时有关对手过 去行动选择的信息, (5)支付函数 博弈树(game trees):是扩展型的一种形象化表 述。
环境污染与治理中的博弈
博弈论的基础知识 完全信息静态博弈 环境污染与治理中的博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
博弈论的基础知识
博弈论(game theory):是研究决策主体的行为 发生直接相互作用时候的决策以及这种决策的 均衡问题的学科。 博弈的基本要素包括:参与人,行动,信息, 战略,支付函数,结果,均衡。 博弈的划分: 行动的先后顺序:静态博弈(static game)和动态 博弈(dynamic game)。 参与人对有关其他参与人的特征、战略空间以 及支付函数的知识的了解:完全信息和不完全 信息。