《运筹学》ch12博弈论
博弈论-中国运筹学会
博弈论-中国运筹学会中国博弈论新近进展及展望摘要1944年著名数学家冯·诺伊曼和经济学家莫根施坦合著并出版的《博弈论与经济行为》标志着博弈论作为一门独立学科的诞生。
在国际上,从1994到2012年,博弈论学家已先后获得6届诺贝尔经济学奖,对于一个运筹学分支而言这是一个奇迹。
随着运筹学的发展,博弈论在中国也取得了飞速的进步。
本报告介绍了国内外博弈论的发展历程、主要研究方向以及常用术语的中文规范。
针对八个主要方面重点介绍了国内外的研究现状以及未来五年的发展趋势展望,具体的,包括对策理论、对策论与互联网、算法博弈论、对策与社会科学、对策与可持续发展、不确定性与对策、组合拍卖以及带熵博弈局势分析。
Recent Development and Future Prospect ofGame Theory in ChinaIn 1944, the masterpiece of‘Theory of Games and Economic Behavior’ written by famous mathematician John von Neumann and economist Oskar Morgenstern marks the game theory as an independent subject. Experts in game theory have won six Nobel Prizes in economics from 1994 to 2012, which is a miracle for a branch of operation research. With the development of operations research, the study of game theory in China has been gotten rapid advances. In this chapter we first present a brief history, definition and Chinese technical terms of game theory. Then we review advances and tendencies in eight research topics including game theory, Internet and game theory, algorithmic game theory, social science and game theory, sustainable development and game theory, uncertainty and game theory, combinatorial auction, situation analysis on games with entropy.一、引言博弈论,亦名“对策论”、“赛局理论”,是运筹学的一个重要学科。
运筹学博弈论
i a 2 1 3 a c 1 3 a c c 1 3 a c 9 1 a c 2
产量博弈的古诺模型是一种囚徒困境,无法实现 博弈方总体和各个博弈方各自最大利益的结论,对 于市场经济组织、管理,对于产业组织和社会经济 制度的效率判断,都具有非常重要的意义。说明对 市场的管理,政府对市场的调控和监管都是必须的。
纳什均衡(Nash Equilibrium)
通俗地说,纳什均衡的含义 就是:
给定你的策略,我的策略是 最好的策略;给定我的策略, 你的策略也是你的最好的策 略。即双方在给定的策略下 不愿意调整自己的策略。
1. 纯战略Nash均衡
策略空间:每个博弈方的全部可选策略的集合 S1,Sn
博弈方 i的第 j个策略: si j Si 博弈方 i的得益:u i
每个参与人都想猜透对方的战略,而每个参与人又 不愿意让对方猜透自己的战略。
这种博弈的类型是什么?如何找到均衡?
请举一些这样的例子:
✓石头、剪子、布游戏 ✓老虎、杠子、鸡、虫子游戏 ✓扑克游戏 ✓橄榄球赛 ✓战争中
大猪先到:大猪吃到9个单位,小猪吃到1个单位; 小猪先到:小猪吃到4个单位,大猪吃到6个单位; 同时到达:大猪吃到7个单位,小猪吃到3个单位。
局中人:大猪和小猪 行动:按按钮吃东西
小猪
按
不按
大
猪
按 (5, 1) (4, 4)
不按 (9, -1) (0, 0)
24
大猪 按 等待
小猪的上策
寡头产量竞争——以两厂商产量竞争为例 Qq1 q2 PP(Q) aQ
u 1 q 1 P ( Q ) c 1 q 1 q 1 [ a ( q 1 q 2 ) c ]1q
u 2 q 2 P ( Q ) c 2 q 2 q 2 [ a ( q 1 q 2 ) c ]2q
《管理运筹学》12-管理博弈
管理博弈的基本概念与分类
例12-5 产量竞争问题
一、博弈的基本要素
解 企业A和B分别为两个局中人,它们的策略为各自的产量qi ϵ[0,∞)(i=1,2),每一方都有无穷多个策略。在局势(q1 + q2)下,局中人i的赢得函数为
衬底1
管理博弈的基本概念与分类
按局中人的数量:二人博弈和多人博弈; 按各局中人赢得函数的代数和是否为零:零和博弈与非零和博弈; 按局中人之间是否合作:合作博弈和非合作博弈; 按策略集中策略数目的有限和无限:有限博弈和无限博弈; 按局中人选择策略的先后顺序:静态博弈和动态博弈; 按博弈过程中对信息掌握的情况:完全信息博弈和不完全信息博弈。
采购员
自然状态
行最小
较暖
正常
较冷
采购100吨
-5
-7.75
-11
-11
采购150吨
-7.5
-7.5.
-10.5.
-10.5
采购200吨
-10
-10
-10
-10*
列最大值
-5
衬底1
管理博弈的基本概念与分类
例12-3 囚徒困境
一、博弈的基本要素
解 A和B为两个局中人,每个局中人都有两个策略:坦白或不坦白。按照各局中人的策略组合,共有四个局势:{坦白,坦白},{坦白,不坦白},{不坦白,坦白},{不坦白,不坦白}。两个局中人的赢得函数可以用表12-2所示的一个双变量矩阵来表示。
β1
β2
β3
4
4
10
4
2
3
1
1
6
5
7
5*
6
5*
10
表12-4 具有鞍点的矩阵博弈的赢得矩阵
运筹学博弈论 PPT
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
囚徒困境
坦白是B的 占优战略
坦白
囚徒 B
抵赖
坦白
坦白是A的 囚徒A 占优战略
抵赖
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的均衡。
囚徒困境( Prisoners’Dilemma )
运筹学博弈论
第一节 博弈论概述
一、博弈论的产生和发展
1. 博弈在中国 田忌赛马Байду номын сангаас弈
华容道博弈
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年 , 冯 ·诺 依 曼 和 摩 根斯顿发表《博弈论和经 济行为》的一书,
标志着博弈论作为一门独立科学的开始, 也标志着新古典经济学进入了一个新的发 展阶段。
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).
运筹学博弈论简介
合作博弈
非合作博弈
二)按局中人数分 类:
二人博弈 多人博弈
三)按策略数分 类:
•有限策略博弈 •无限策略博弈
二人非合作博 弈是我们讨论的重 点。
非合作博弈的进一步分类
非合作博弈
非零和的四种博弈
零和博弈
也可以有纯策略和混合
– 纯策略博弈 策略博弈之分。
策略—前进或后退
支付函数
斗鸡B
前进 后退
前进 -3/-3 2/0
斗鸡A
后退 0/2 0/0
五、博弈论的典型例子
市场进入阻挠—二人非合作非零和纯策略博弈
局中人—在位者和进入者 策略—在位着:容忍或斗争;进入者:进入或不进入 支付函数—垄断利润300,寡头利润各50;进入成本10
进入 进入者
不进入
在位者 容忍 斗争
– 混合策略博弈
非零和博弈
动态时行动和策略
– 完全信息博弈 不同,要素有五个;而
静态博弈
静态时行动与策略不加
动态博弈
区别,要素有三个。
– 不完全信息博弈
静态博弈
动态博弈
四、博弈论发展史的要件
1944年,von Neumann and Oskar Morgenstern 发表专著 The Theory of Games and Economic Behavior创立了博弈论
2000 -40万 -40万 -40万
五、博弈论的典型例子
齐王赛马—二人非合作零和博弈
局中人—齐王和田忌 策略—上中下三种等级的马的组合 ,比三
次,有六组策略:(上,中,下)、 (中,上, 下)、 (上,下,中)、 (中,下,上)、 (下, 上,中)、 (下,中,上)
博弈论
Day 1
Day 2
Day 3
分析
如果是情况(2),2红1黑
那么在第一天,红头发的人会看到1红1黑,他会考虑如果自己头发颜色是黑的, 那么为情况(1),他所见的红发人会在第一天黄昏自杀,如果他头发为红, 为情况(2),他所见的红发人不会自杀。黑头发人看到2红,那么可排除情况 (1),如果他头发为黑,则为情况(2),否则为情况(3)。到了第二天, 没有人自杀。那么两个红发人都认定此为情况(2),知道自己头发为红,于 第二天晚自杀。黑发人第三天发现这是情况(2),知道自己头发为黑,于当 晚自杀。
分析
我们从1个海盗的情况开始讨论。 (1)如果只有1个海盗,那么他显然会把 10个金币都分给自己。此时最佳方案为{10}。
分析
(2)如果有2个海盗,那么2号来制定方案。 但是他无论怎么制定,1号海盗都投反对票, 根据规则2号海盗会被丢入大海,并且金币 被1号海盗独享。最佳方案为{死,10}。
2 1
分析
(3)如果有3个海盗,那么3号无论怎么制定方 案,2号必同意(因为如果只剩2人了那么2号必 死,他保命要紧),而1号必反对(因为如果只剩 2人,他将独享10金币并搞死2号)。所以3号可 以给自己分10个,依然能通过。最佳方案为{10, 0,0}。 3 2 1
分析
(4)如果有4个海盗,那么4号除自己需要2票,此时3号必反 对提议(因为如果到3海盗情况他将得10金币,就算现在给他 10金币他也反对因为他还想搞死4号),那么此时需要1、2号 各一票。如果到3海盗情况,那么1、2号会颗粒无收。若不给 他们金币让他们同样颗粒无收,他们将反对(同样都一无所获 那为什么不让你死),但若给他们1人1金币,他们就会同意。 所以最佳方案为{8,0,1,1}。
博弈论
百度百科博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
博弈论已经成为经济学的标准分析工具之一。
在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。
其中局中人、策略和收益是最基本要素。
局中人、行动和结果被统称为博弈规则。
理论历史博弈论[1] 是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,中国古代的《孙子兵法》等著作就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策梅洛(Zermelo),波莱尔(Borel)及冯·诺依曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)策墨洛(Zermelo)基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
运筹学中的对策论与博弈论
人工智能技术为 对策论与博弈论 提供新的研究工 具和思路
机器学习算法在 对策论与博弈论 中的应用,提高 决策效率和准确 性
深度学习技术可 以模拟复杂的博 弈场景,为对策 论与博弈论提供 更真实的数据支 持
人工智能与对策 论与博弈论的结 合将推动相关领 域的发展和创新
对策论与博弈论在商业竞争中的应用研究
不完全信息静态博弈
定义:博弈参与者在完全信息条 件下进行的一次性决策,每个参 与者只能选择一种策略,并且所 有参与者同时做出选择。
示例:寡头垄断市场中的价格竞 争、囚徒困境等。
添加标题
添加标题
添加标题
添加标题
特点:参与者之间无法进行有效 的沟通或协商,只能依靠自己的 判断和决策。
应用:在经济学、政治学、社会 学等领域有广泛应用。
03
对策论的主要内容
合作博弈与非合作博弈
合作博弈:参与者通过合作达成共赢,核心概念包括联盟和核心
非合作博弈:参与者追求个体理性,核心概念包括纳什均衡和优势策略
区别:合作博弈强调合作与共赢,非合作博弈注重竞争与冲突
应用场景:合作博弈常用于国际关系、经济合作等领域,非合作博弈适用于市场竞争、决策分 析等场景
对策论与博弈论 在商业竞争中具 有重要地位,是 制定竞争策略和 决策的重要工具。
随着大数据和人 工智能技术的发 展,对策论与博 弈论在商业竞争 中的应用将更加 广泛和深入。
对策论与博弈论 可以帮助企业预 测竞争对手的行 动,制定更加有 效的竞争策略。
在商业竞争中, 运用对策论与博 弈论需要综合考 虑各种因素,包 括市场环境、竞 争对手、自身实 力等。
面临的挑战与问题:如何将对策论与博弈论更好地应用于实际场景,解决 复杂的问题,仍需进一步的研究和探索。
第九章-运筹学博弈论
(Daniel L. McFadden) 获奖理由:在微观计量经济学领域做出了重大贡献。 1999年 加拿大著名经济学家罗伯特-蒙代尔教授(Robert
A. Mundell) 获奖理由:对不同汇率体制下的货币和财政政策以及最
早期的博弈实例是中国春秋战国时代的齐王和 田忌赛马的故事:齐王有上,中,下三等马,他麾下 的大将也有上,中,下三等马,但是同等级的马都 比齐王差一些.赛马时齐王表示按上,中,下的顺 序出马,而田忌的谋士让他按下,上,中的顺序出 马,比赛结果田忌赢了一千金.请思考:这是一种 什么类型的博弈?理论上齐王不会输,但他为什 么输了?
“博弈中一个理性的决策必定建立在预测其他 局中人的反应之上.一个局中人将自己置身于 其他局中人的位置并为他着想从而预测其他局 中人将选择的行为,在这个基础上该局中人决 定自己最理想的行动.”
博弈的三个要素,即局中人,策略集和收益函 数构成了博弈信息,根据不同信息可对博弈 做如下分类:
1.按局中人对信息掌握情况分为:完全信息博弈 和不完全信息博弈; 2.按局中人采取行动的次序分为:如果同时采取 行动或在互相保密情况下采取行动,称为静态博 弈;如果采取行动有先后,后采取行动的人可以 观察到前面人采取的行动,称为动态博弈.
获奖理由:第一个提出储蓄的生命周期假 设,这一假设在研究家庭和企业储蓄中得到了 广泛应用。
什么是博弈论?
所谓博弈是指局中人按一定规则,在充分考虑其 他局中人可能采取的策略的基础上,从自己的策 略集中选取相应策略,并从中得到回报的过程. 博弈是一种特殊的决策,在决策论中,决策者的 对手是大自然,在博弈论中,代替大自然的是有 理性的人,因而任何一方做出决定时,都必须考 虑其他对手可能作出的反应.
ch12博弈论
CH12 博弈论 game theory
2015年3月19日星期四
Page 23
i pmi [20 (m1 m2 m3 )] mi
可算出在产量组合为(3,9,6)时,市场价格为2,三厂商的 利润分8,16和12,再作其它产量组合时亦会有不同的结果,如 表12-2. 表12-2 三厂商离散产量结合对应价格和利润 m1 3 3 5 5 3 6 m2 9 8 5 5 3 3 m3 6 6 6 5 3 3 p 2 3 4 5 11 8 π1 6 9 20 25 33 48 π2 18 24 20 25 33 24 π3 12 18 24 25 33 24
亚 贸
高价
100,100 150,20
20,150 70,70
低价
类似地,广告投资、采用新技术等方面,厂商之间常常耗资 巨大,但不一定有利可图的争夺战;对公共资源的掠夺式使 用等问题。 我们的目的是如何利用这种困境达到有利于社会,合理利 用和开发公共资源,保护环境。
12.1 引言
CH12 博弈论 game theory
12.2 纳什均衡 Nash Equilibrium
CH12 博弈论 game theory
2015年3月19日星期四
Page 24
12.2.2混合策略纳什均衡
北线
南线
12.1 引言
CH12 博弈论 game theory
2015年3月19日星期四
Page 11
【解】局中人:盟军、日军;双方策略:北线、南线,记为:
S1= 1, 2 ;S 2=1, 2
盟军的赢得矩阵如下: 日军
盟军 北线( 1 )
南线( )
2
北线 ( 1 ) 2 1
运筹学12对策论
下上中
-1,1 1,-1 1,-1 1,-1 3,-3 1,-1
下中上
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
《运筹学课程建设组》
14
由表12-2我们可以看到,如果按照严格的博弈问题的假设来重新 安排这一游戏的话,齐威王只要把从策略集中选择策略的顺序不断改
动(随机产生选择),不让田忌掌握策略规律,齐威王的胜率(统计 事件)显然要高于田忌。
《运筹学课程建设组》
回本章目录
2
一、猜币博弈
古老的流传广泛的猜硬币游戏想来对于我们每一个人来说都不陌 生,而正是这样的一个简单游戏构成了一个最基本的博弈问题。
这个游戏非常简单,两人通过猜硬币的正反面赌输赢,其中一人 抛起一枚硬币,用手盖住后,由另一方猜是正面朝上还是反面朝上, 若猜对,则猜者赢,盖硬币者输;否则,猜者输,而盖硬币者赢。
第十二章 博弈论
§1 引论 §2 博弈论的概念及历史沿革 §3 矩阵对策的最优纯策略 §4 矩阵对策的混合策略 §5 我们从博弈论中学习什么
《运筹学课程建设组》
1
§1 引论
为了对什么是博弈论以及博弈包括哪些类型等问题有一些更清晰 的理解和认识,本节先介绍几个典型的简单博弈问题实例,并对它们 作初步的分析。其实博弈本身就如这些实例一样,并不像人们通常理 解的那样深奥、复杂,当然,要想完全弄懂它,也的确需要下一番功 夫。
《运筹学课程建设组》
3
如果我们记赢的一方收益为1角(记为收益1),输的一方损失1 角(记为收益-1),则我们可用表12-1中收益矩阵表示这个猜硬币 博弈问题。
表12-1 猜币博弈
猜硬币方 盖硬币方
正面 反面
《运筹学课程建设组》
正面
《运筹学》课件 第六章 博弈论
§1 基本概念
一、博弈论的定义 二、博弈理论的历史 三、博弈问题举例 四、博弈的分类
三、
1. 囚犯困境(Prisoners’ dilemma
囚犯困境是图克(Tucker)1950年提出的; 该博弈是博奕论最经典、著名的博弈; 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷。
所有局中人的策略组成的向量。)
s (s1,, si,, sn ) 表示n个局中人达成的
一个协议,当这个协议可以自动实施(Self-enforcing) 时,即没有任何局中人有积极性破坏这个协议,那么 这个协议就构成纳什均衡。
否则,若至少存在某些局中人有积极性偏离这个协 议,就构不成纳什均衡。
例:囚犯困境问题:
但是,尽管政府当时无力制止这种事情,公众也不 必担心彩电价格会上涨。这是因为,“彩电厂商自 律联盟”只不过是一种“囚徒困境”,彩电价格不 会上涨。在高峰会议之后不到二周,国内彩电价格 不是上涨而是一路下跌。这是因为厂商们都有这样 一种心态:无论其他厂商是否降价,我自己降价是 有利于自己的市场份额扩大的。
Ⅱ
坦白 抵赖
坦白
Ⅰ
-9,-9
0,-10
抵赖 -10,0 -1,-1
均衡解: 二人均坦白
相关概念介绍
➢博弈分析的基本假设 (1)个人理性 假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。
(2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最
大化的策略。
坦白 抵赖
➢ 博弈问题的基本要素 (1)局中人(Players)
现代博弈论主要指非合作博弈理论。非合作博弈 更受重视的原因:主导人们行为的主要还是个体理性, 而非集体理性;即,竞争是一切社会、经济关系的根 本基础,不合作是基本的,合作是有条件和暂时的。
运筹学:chap12_对策论 (简)
E(x, y) 3x1 y1 6x1 y2 5x2 y1 4x2 y2
3x1 y1 6x1(1 y1) 5(1 x1) y1 4(1 x1)(1 y1)
1 19
4(x1
4
)(
y1
) 2
2
矩阵对策的混合策略示例
E(
x,
y)
4(
x1
1 )( 4
y1
1 2
)
9 2
取x*
1 4
,
3 4
i
j
aij
min j
max i
aij
,存在最优纯策略。
若
max i
min j
aij
min j
max i
aij,情况会怎样?
矩阵对策的混合策略示例
3 6 A 5 4
v1
max i
min j
aij
4
v2
min j
max i
aij
5
i* 2 j* 1
当双方均根据最不利情形中选择最有利的原则,局中人的
一旦你开始考虑他人会如何对自
己的行动进行反应时,你便进入了 博弈论的领域。
对策论的指导思想
假设你的对手在研究你的策略,并采 取追求最大利益行动的时候,你如何选 择最有效的策略。
对策现象的三要素
➢局中人(players) ➢策略(strategies) ➢赢得函数(支付函数)(payoff function)
中下上 -1 1 1 3 1 1
下上中 1 1 1 -1 3 1
下中上 1 1 -1 1 1 3
西班牙叛乱---击溃赫图勒斯
西班牙叛乱决策树
守拉米尼姆城, 截击巴埃蒂斯河
运筹学:chap12_对策论 (简)
上策与上策均衡
上策:无论其它局中人如何选择都使自己利益 极大化的策略。
上策均衡:对策的各局中人都有一个上策,各 自选择自己的上策就达到了均衡状态。
囚犯困境
两个嫌疑犯涉嫌一大案被警官拘留,并被分别进行审讯。 根据法律,如果两人均认罪,则每人将各判刑7年;如 果两人均不认罪,根据已掌握的证据,则每人将各判刑 1年;如果只有一人认罪,则认罪者将被宽大释放,不 认罪者则将判刑9年。
S S1 S2 Sn
赢得函数(支付函数)
对于任意一个局势s,应该为每一个局中人i规定一个赢得值
Hi (s) ,称为局中人i的赢得函数。
个人的赢得函数不仅依赖于自己的选择,而且依赖于他 人的选择;
个体的最优选择是他人选择的函数。
对策现象举例---田忌赛马
战国时期,齐王提出要与田忌赛马,双方约定: 1. 从各自的上、中、下三个等级的马中各选一匹
囚犯A
认罪 不认罪
囚犯B
认罪 -7,-7 -9,0
不认罪 0,-9 -1,-1
囚犯困境决策树
认罪 认罪
0,-9
认罪
-9,0
不认罪
-1,-1
囚犯困境引发的思考
➢经济学的经典理论:个体利益的极大化必 然导致整体利益的提高,个体理性与整体理 性是一致的。
➢囚犯困境的上策均衡:个体的最优选择带 来了总体最不利的结局,个体理性与整体理 性发生了冲突。
i
j
aij
min j
max i
aij
,存在最优纯策略。
若
max i
min j
aij
min j
max i
aij,情况会怎样?
矩阵对策的混合策略示例
3 6 A 5 4
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1的最优 策略(行)
目录
博弈论的基本概念 纯策略矩阵博弈
混合策略矩阵博弈
其它类型博弈简介(多人博弈、非零和博弈)
基本概念
设矩阵博弈G {S1, S2 , A} 的支付矩阵是 A (aij )mn ,其中S1 {A1, , Am}
S2 {B1, , Bn }
多人非合作博弈
(1)局中人集合 I {1, , n} ; (2)每个局中人i有一个纯策略的有限集:
Si
{s(i)} {s1i , s2i ,
,
si mi
}
i 1, , n
Hale Waihona Puke (3)每个局中人i有一个支付函数u i ,i 1, , n 。
记为此博弈为G {I , Si ,ui }。
第十二章 博弈论
教学要求:
了解博弈论的基本分析方法 掌握二人零和博弈模型和求解方法 会运用该模型分析一些经济和管理问题
目录
博弈论的基本概念 纯策略矩阵博弈 混合策略矩阵博弈 其它类型博弈简介(多人博弈、非零和博弈)
目录
博弈论的基本概念
纯策略矩阵博弈 混合策略矩阵博弈 其它类型博弈简介(多人博弈、非零和博弈)
同越理小,越若好局,中所人以,2选局择中策人略2可B j以,选则择他至B j ,多使失他去失m1ia去mx a的ij 。不因大局于中1m ji人nm m21i希amx望aij aij
鞍点:如果存在 i*, j* 使支付矩阵 (aij ) 的元素满足:
max
1im
min
1 jn
动态博弈 微分博弈
最常见
目录
博弈论的基本概念
纯策略矩阵博弈
混合策略矩阵博弈 其它类型博弈简介(多人博弈、非零和博弈)
矩阵博弈
矩阵博弈 G {S1, S2 , A}
设局中人1有m个策略S1 {A1, , Am} ;局中人2有n个策略 S2 {B1, , Bn}
局中人2的期望支付
u2 1pq (1) p(1 q) (1)(1 p)q 1(1 p)(1 q) 2q(2 p 1) (2 p 1)
局中人2 1
鞍点
1/2
1/2
1
局中人1
目录
博弈论的基本概念 纯策略矩阵博弈 混合策略矩阵博弈
其它类型博弈简介(多人博弈、非零和博弈)
局中人2使保证对方得到的期望值最多不超过 v2
min max E(x, y)
ySn xSm
鞍点:设 x* Sm ,y* S n 。如果对任意 x Sm和任意 y Sn有:
E(x, y* ) E(x* , y* ) E(x* , y)
则称 (x* , y* ) 是矩阵博弈混合策略A (aij ) 意义下的一个鞍点。
m
n
记 Sm {x R m | xi 0, i 1, , m, xi 1} Sn {y R n | y j 0, j 1, , n, y j 1}
则 Sm,Sn
分别称为局中人1和局i中1 人2的混合策略集;对
x (x1,
j 1
, xm ) Sm
aij
min
1im
a ij
*
ai* j*
min
1 jn
ai*
j
min
1 jn
max
1im
aij
则称(Ai* , Bj* ) 为该矩阵博弈的鞍点
实例
局中人2
2的最优 策略(列)
局中人1
B1 B2 B3 B4
A1 1 1 0 3 A2 2 3 1 3 A3 2 2 3 4
实例
局中人1、2玩扑克牌游戏, 支付矩阵和混合策略选择概略如 下图:
局中人2
红q 黑1-q
局 中
红p -1,1 1,-1
人 1 黑1-p 1,-1 -1,1
局中人1的期望支付
u1 (1) pq 1p(1 q) 1(1 p)q (1)(1 p)(1 q) 2 p(1 2q) (2q 1)
对于非零和博弈,可虚增一局中人使 其化为零和博弈。
合作博弈
博弈
静态博弈非合作博弈无 有限 限多 多 两 两人 人 人 人非 非 非 非零 零 零 零零 零 零 零和 和 和 和和 和 和 和
给胜者一千金。
支付矩阵:把局中人、策略和赢利数字写成矩阵形式。如下为“锤子、
剪刀、布”游戏的支付矩阵。其中方案1代表出锤子,方案2代表出剪刀, 方案3代表出布。
参与者2
1
2
3
参
与
1
0
1
-1
者
2
-1
0
1
1
3
1
-1
0
囚徒困境
囚徒一的支付矩阵
囚徒二
坦白
不坦白
坦白
5年
释放
囚
徒
一
不坦白
8年
1年
博弈分类
设
s (i)
S
(i
i
1,
,n
)是局中人i
的一个策略,则
s (s (1) , , s (n) )
称为一个局势。对于博弈的每一个局势
,
每个s 局(中s (1人) ,i得, s到(n)的) 支付:
ui ui (s)
这就是博弈在纯策略下的支付函数。
非零和博弈
在经济管理问题中,经常遇到的是对 抗的双方既有对抗又有合作,双方的利益 既有所得又有所失,各参与人的目的并不 完全对立。这种如果至少存在一个结局, 使所有局中人的支付之和不为零的博弈称 为非零和博弈。
如果局中人1选择策略 Ai ,局中人2选择B
支付是 a,ij 则支付矩阵是:
j
,局中人1从局中人2得到的
a11 a12 a1n
A
(aij
)
a21 am1
a22 am2
a2n
amn
由上述矩阵完全确定的博弈,称为矩阵博弈。
局果行选中局元择人中素i,1人中使希1的他望选最得支择小到付策元的值略素支aA。付iij 由越,不于大 则小局越 他于中好 至m1i人a, 少mx1m1局 可 ji希n中 以n a望ij人 得a到2i则j越支希大付望越1m付好jin出n,a的ij因。此a即ij局越支中小付人越矩1好阵可。第以如i
和
y ( y1, , yn ) Sn分别称为局中人1和局中人2的混合策略。
mn
局中人1的期望支付:E(x, y) aij xi y j xT Ay
i1 j 1
局中人1应选择 x Sm,保证自己的赢得期望值不少于
v1
max min E(x, y)
xSm ySn
博弈的基本要素
局中人:博弈中的决策者或参与者,至少要有2个,个人和集体都可以
作为局中人,如“齐王赛马”中的齐王和田忌。
策略:局中人在整个决策过程中一系列行动的一个方案。如用(上、中、
下)表示出场参赛的三匹马依此为上马、中马和下马,这就是局中人的 一个策略。
赢利:在决策过程的最终结局上的利害结果。如每一场比赛中的负者付