第九章 运筹学博弈论

合集下载

运筹学博弈论

运筹学博弈论

i a 2 1 3 a c 1 3 a c c 1 3 a c 9 1 a c 2
产量博弈的古诺模型是一种囚徒困境,无法实现 博弈方总体和各个博弈方各自最大利益的结论,对 于市场经济组织、管理,对于产业组织和社会经济 制度的效率判断,都具有非常重要的意义。说明对 市场的管理,政府对市场的调控和监管都是必须的。
纳什均衡(Nash Equilibrium)
通俗地说,纳什均衡的含义 就是:
给定你的策略,我的策略是 最好的策略;给定我的策略, 你的策略也是你的最好的策 略。即双方在给定的策略下 不愿意调整自己的策略。
1. 纯战略Nash均衡
策略空间:每个博弈方的全部可选策略的集合 S1,Sn
博弈方 i的第 j个策略: si j Si 博弈方 i的得益:u i
每个参与人都想猜透对方的战略,而每个参与人又 不愿意让对方猜透自己的战略。
这种博弈的类型是什么?如何找到均衡?
请举一些这样的例子:
✓石头、剪子、布游戏 ✓老虎、杠子、鸡、虫子游戏 ✓扑克游戏 ✓橄榄球赛 ✓战争中
大猪先到:大猪吃到9个单位,小猪吃到1个单位; 小猪先到:小猪吃到4个单位,大猪吃到6个单位; 同时到达:大猪吃到7个单位,小猪吃到3个单位。
局中人:大猪和小猪 行动:按按钮吃东西
小猪

不按


按 (5, 1) (4, 4)
不按 (9, -1) (0, 0)
24
大猪 按 等待
小猪的上策
寡头产量竞争——以两厂商产量竞争为例 Qq1 q2 PP(Q) aQ
u 1 q 1 P ( Q ) c 1 q 1 q 1 [ a ( q 1 q 2 ) c ]1q
u 2 q 2 P ( Q ) c 2 q 2 q 2 [ a ( q 1 q 2 ) c ]2q

博弈论9

博弈论9

• 2.市场机会 设两个厂商都发现了一个市场机 会,但市场容量不大。若只有一家进入,能赚 100,若同时进入,则各亏50. • 厂商2 • 进 不进 • 进 100, 0 -50 -50 -50,-50 • 厂商1 • 不进 0 , 0
0 ,100
• 本博弈也有两个纯策略纳什均衡(不进,进), (进,不进)但它们分别有利于两个厂商,因此 这两个均衡都不容易实现,都应采取混合策略。 • 请同学们自己计算混合策略纳什均衡及得益。
• • • • •
2 s 1 s w
1,3 d 2,2 0,0 r 0,0 3,1
w
• 这是一个第二阶段为静态博弈的动态博弈问题。如 这是一个第二阶段为静态博弈的动态博弈问题。 果第一阶段1选 则博弈结束 双方各得2;如果1 则博弈结束, 果第一阶段 选d,则博弈结束,双方各得 ;如果 则第二阶段有三个纳什均衡: 选r则第二阶段有三个纳什均衡:纯策略的(s,w) 则第二阶段有三个纳什均衡 纯策略的( 和混合策略的双方以1/4和 选 和 和混合策略的双方以 和3/4选s和w.

• • • •
3.三寡头垄断市场的需求函数是 三寡头垄断市场的需求函数是p=100-Q, 三寡头垄断市场的需求函数是 , 市场总产量Q=q1+q2+q3 ,p为市场价格 三个企 为市场价格,三个企 市场总产量 为市场价格 业的边际成本都为2,固定成本为 如果企业1 业的边际成本都为 固定成本为0.如果企业 固定成本为 如果企业 和企业2先同时决定产量 先同时决定产量q 企业3看到 、 看到q 和企业 先同时决定产量 1和q2,企业 看到 1、 q2后同时决策,问三个企业各自的产量和利润 后同时决策, 是多少? 是多少? 解:三个企业的利润函数是 L(q1,q2,q3)=qi(100-Q)-2qi i=1,2,3 根据逆推归纳法先看企业3 的选择:( :(企业 根据逆推归纳法先看企业 的选择:(企业 3的利润对其产量求导并令其为零) 的利润对其产量求导并令其为零) 的利润对其产量求导并令其为零 q3=(98-q1-q2)/2

博弈论概述

博弈论概述
“坦白”是A的占优策略。同样,“坦白”也是B的占优策略。
一般地,称 si*为局中人i的(严格)占优策略, 若对应所有的
si , s i*是i的严格最优策略 , 即:
ui (si*, si ) ui (si' , si ) si , si' si*
对应地,所有的 si' si* 被称为“劣策略”。注意:这
甲的策略
1
2
3
乙的策略
1
7
8
9
2
6
2
3
3
5
4
0
1.乙先行动。若乙选1,则甲选3;乙选2,则甲选1;乙选3, 则甲选1。乙在行动时会估计到甲的行动,它估计三种选择 中的最高代价为策略1(损失900万),其次为策略2(损失 600万),最低为策略3(损失为500万)。因此,乙必选代 价最低的策略3。——最大最小原理。结论:乙选择3,甲选 1作为回应,乙损失500万,甲获益500万。
在博弈论里,一个博弈可以有两种表述方式:一种是策 略式(strategic form representation)表述,另一种是 扩展式( extensive form representation )表述。前者 适合于讨论静态博弈,后者适合于讨论动态博弈。在策略式 表述中,所有参与人同时选择各自的策略,所有参与人选择 的策略一起决定每个参与人的支付。
2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E.

第九章-运筹学博弈论

第九章-运筹学博弈论

乙 石头 布

石头
0
-1

1
0
剪刀
-1
1
剪刀
1 -1 0
21
例2 写出齐王和田忌赛马中齐王的收益矩阵. 赢一场得一千金.
解:
S1 a1,a2,a3,a4,a5,a6,S2 b1,b2,b3,b4,b5,b6
a1 (上,中,下),a2 (上,下,中),a3 (中,上,下), a4 (中,下,上),a5 (下,中,上),a6 (下,上,中). S2中的各策 S1对 略应 与的策.略相同
史密斯(Vernon L. Smith)
获奖理由:在心理和实验经济学研究方面做出了开创性工
作。
2001年 三位美国学者乔治-阿克尔洛夫(George A.
Akerlof)、迈克尔-斯彭斯(Michael Spence)和约瑟夫-斯
蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进行分析”领域
11
1986年 美国人詹姆斯-布坎南(James M. Buchanan Jr.)
获奖理由:将政治决策的分析同经济理论结 合起来,使经济分析扩大和应用到社会,政治法 规的选择
1985年 意大利人弗兰科-莫迪利安尼 (Franco Modigliani)
获奖理由:第一个提出储蓄的生命周期假 设,这一假设在研究家庭和企业储蓄中得到了 广泛应用。
完全信息是指所有局中人对其他局中人各自策略 集以及不同局势下的收益函数都有完全的了解.
18
博弈的三个要素的矩阵表示(局中人A的收益)
局中人B
局中人A
策 a1 a2

am
b 1
c11 c 21

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。

即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。

1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。

1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。

两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。

倘若不能,则称非合作博弈(Non-cooperative game)。

合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。

目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。

博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。

把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。

博弈论完整版PPT课件

博弈论完整版PPT课件

ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战

运筹学博弈论 PPT

运筹学博弈论 PPT
性研究。
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
囚徒困境
坦白是B的 占优战略
坦白
囚徒 B
抵赖
坦白
坦白是A的 囚徒A 占优战略
抵赖
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的均衡。
囚徒困境( Prisoners’Dilemma )
运筹学博弈论
第一节 博弈论概述
一、博弈论的产生和发展
1. 博弈在中国 田忌赛马Байду номын сангаас弈
华容道博弈
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年 , 冯 ·诺 依 曼 和 摩 根斯顿发表《博弈论和经 济行为》的一书,
标志着博弈论作为一门独立科学的开始, 也标志着新古典经济学进入了一个新的发 展阶段。
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).

运筹学博弈论简介

运筹学博弈论简介
弈双方是 否存在有约束力 的协议来分:
合作博弈
非合作博弈
二)按局中人数分 类:
二人博弈 多人博弈
三)按策略数分 类:
•有限策略博弈 •无限策略博弈
二人非合作博 弈是我们讨论的重 点。
非合作博弈的进一步分类
非合作博弈
非零和的四种博弈
零和博弈
也可以有纯策略和混合
– 纯策略博弈 策略博弈之分。
策略—前进或后退
支付函数
斗鸡B
前进 后退
前进 -3/-3 2/0
斗鸡A
后退 0/2 0/0
五、博弈论的典型例子
市场进入阻挠—二人非合作非零和纯策略博弈
局中人—在位者和进入者 策略—在位着:容忍或斗争;进入者:进入或不进入 支付函数—垄断利润300,寡头利润各50;进入成本10
进入 进入者
不进入
在位者 容忍 斗争
– 混合策略博弈
非零和博弈
动态时行动和策略
– 完全信息博弈 不同,要素有五个;而
静态博弈
静态时行动与策略不加
动态博弈
区别,要素有三个。
– 不完全信息博弈
静态博弈
动态博弈
四、博弈论发展史的要件
1944年,von Neumann and Oskar Morgenstern 发表专著 The Theory of Games and Economic Behavior创立了博弈论
2000 -40万 -40万 -40万
五、博弈论的典型例子
齐王赛马—二人非合作零和博弈
局中人—齐王和田忌 策略—上中下三种等级的马的组合 ,比三
次,有六组策略:(上,中,下)、 (中,上, 下)、 (上,下,中)、 (中,下,上)、 (下, 上,中)、 (下,中,上)

博弈论和运筹学

博弈论和运筹学

博弈论和运筹学
博弈论和运筹学是两个与决策和优化相关的学科,尽管它们有一些共同点,但也存在明显的区别。

博弈论(Game Theory)是研究决策者在相互作用下做出决策的数学理论。

它研究以多方参与的决策情境为基础的策略选择和决策过程。

博弈论主要关注决策者的利益、策略和收益,并考虑不同决策者之间的相互依赖关系。

博弈论被广泛应用于经济学、管理学、政治学等领域,用于分析和解决与决策者的冲突、合作、竞争相关的问题。

与之相比,运筹学(Operations Research)是一个研究如何最优地利用有限资源来解决实际问题的学科。

运筹学涉及数学建模、优化算法、模拟等方法,以帮助决策者做出最佳的决策。

它在多个领域中应用广泛,如供应链管理、生产调度、库存控制等。

运筹学通过分析问题的结构、建立数学模型并运用数学优化方法,提供了一种系统化的方法来解决复杂的决策问题。

尽管博弈论和运筹学都关注决策和优化,但它们的重点和方法有所不同。

博弈论注重决策者之间的竞争和合作关系,研究决策者如何做出最佳策略。

而运筹学则注重如何通过有效地分配资源和优化决策,来解决特定的问题,并达到最佳结果。

因此,博弈论和运筹学可以被看作是从不同角度和层面来研究决策和优化的学科。

运筹学中的对策论与博弈论

运筹学中的对策论与博弈论

人工智能技术为 对策论与博弈论 提供新的研究工 具和思路
机器学习算法在 对策论与博弈论 中的应用,提高 决策效率和准确 性
深度学习技术可 以模拟复杂的博 弈场景,为对策 论与博弈论提供 更真实的数据支 持
人工智能与对策 论与博弈论的结 合将推动相关领 域的发展和创新
对策论与博弈论在商业竞争中的应用研究
不完全信息静态博弈
定义:博弈参与者在完全信息条 件下进行的一次性决策,每个参 与者只能选择一种策略,并且所 有参与者同时做出选择。
示例:寡头垄断市场中的价格竞 争、囚徒困境等。
添加标题
添加标题
添加标题
添加标题
特点:参与者之间无法进行有效 的沟通或协商,只能依靠自己的 判断和决策。
应用:在经济学、政治学、社会 学等领域有广泛应用。
03
对策论的主要内容
合作博弈与非合作博弈
合作博弈:参与者通过合作达成共赢,核心概念包括联盟和核心
非合作博弈:参与者追求个体理性,核心概念包括纳什均衡和优势策略
区别:合作博弈强调合作与共赢,非合作博弈注重竞争与冲突
应用场景:合作博弈常用于国际关系、经济合作等领域,非合作博弈适用于市场竞争、决策分 析等场景
对策论与博弈论 在商业竞争中具 有重要地位,是 制定竞争策略和 决策的重要工具。
随着大数据和人 工智能技术的发 展,对策论与博 弈论在商业竞争 中的应用将更加 广泛和深入。
对策论与博弈论 可以帮助企业预 测竞争对手的行 动,制定更加有 效的竞争策略。
在商业竞争中, 运用对策论与博 弈论需要综合考 虑各种因素,包 括市场环境、竞 争对手、自身实 力等。
面临的挑战与问题:如何将对策论与博弈论更好地应用于实际场景,解决 复杂的问题,仍需进一步的研究和探索。

高级运筹学(博弈论书稿)-周晶

高级运筹学(博弈论书稿)-周晶

第章博弈论(对策论)第一节引言1.1博弈行为和博弈论在日常生活中,经常会看到一些相互之间具有斗争或竞争性质的行为。

譬如,两个人下棋,任何一个人在走某一步之前,都需要考虑对方是怎么走的,以及对方在他走了一步之后会怎么走,以至无穷。

高手与俗手的区别往往就在于高手能够考虑10步甚至20步以后的变化,最终的输赢不仅取决于你的决策,而且取决于你对手的决策,这就是博弈。

博弈与决策的根本区别在于是否考虑对方的行为,具有竞争或对抗性质的行为称为博弈行为。

在这类行为中,参加斗争或竞争的各方各自具有不同的目标和利益。

为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最有利或最合理的方案。

比如战争活动中的双方,都力图选取对自己最有利的策略,千方百计去战胜对方;还比如在政治方面,国际间的谈判、各种政治力量间的较量、各国际集团之间的角逐等都无一不具有对抗性质;在经济活动中,各国之间、各公司企业之间的经济谈判,企业之间为争夺市场而进行的竞争等,举不胜举。

博弈论(game theory),就是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论与方法,即研究博弈行为中竞争各方是否存在着最合理行动方案,以及如何找到最合理行动方案的数学理论和方法。

也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。

博弈论应是一种分析问题的方法,它被设计用来帮助我们理解所观察到的决策主体相互作用时的现象,其应用范围涉及经济学、政治学、犯罪学、军事、外交、国际关系、公共选择等各个领域。

博弈论思想的主要特征是各参与人所实施的行为方案(策略)相互依存,各方在冲突或合作后所实现的损益得失结果不仅取决于自己所采取的行为方案,同时也依赖于其他参与方所实施的行为方案,是各参与方行为方案组合的函数。

所以,博弈论在我国也被称为“对策论”。

第九章-运筹学博弈论

第九章-运筹学博弈论
2000年 美国芝加哥大学的詹姆斯-赫克曼(James J. Heckman)和加州大学伯克利分校的丹尼尔-麦克法登
(Daniel L. McFadden) 获奖理由:在微观计量经济学领域做出了重大贡献。 1999年 加拿大著名经济学家罗伯特-蒙代尔教授(Robert
A. Mundell) 获奖理由:对不同汇率体制下的货币和财政政策以及最
早期的博弈实例是中国春秋战国时代的齐王和 田忌赛马的故事:齐王有上,中,下三等马,他麾下 的大将也有上,中,下三等马,但是同等级的马都 比齐王差一些.赛马时齐王表示按上,中,下的顺 序出马,而田忌的谋士让他按下,上,中的顺序出 马,比赛结果田忌赢了一千金.请思考:这是一种 什么类型的博弈?理论上齐王不会输,但他为什 么输了?
“博弈中一个理性的决策必定建立在预测其他 局中人的反应之上.一个局中人将自己置身于 其他局中人的位置并为他着想从而预测其他局 中人将选择的行为,在这个基础上该局中人决 定自己最理想的行动.”
博弈的三个要素,即局中人,策略集和收益函 数构成了博弈信息,根据不同信息可对博弈 做如下分类:
1.按局中人对信息掌握情况分为:完全信息博弈 和不完全信息博弈; 2.按局中人采取行动的次序分为:如果同时采取 行动或在互相保密情况下采取行动,称为静态博 弈;如果采取行动有先后,后采取行动的人可以 观察到前面人采取的行动,称为动态博弈.
获奖理由:第一个提出储蓄的生命周期假 设,这一假设在研究家庭和企业储蓄中得到了 广泛应用。
什么是博弈论?
所谓博弈是指局中人按一定规则,在充分考虑其 他局中人可能采取的策略的基础上,从自己的策 略集中选取相应策略,并从中得到回报的过程. 博弈是一种特殊的决策,在决策论中,决策者的 对手是大自然,在博弈论中,代替大自然的是有 理性的人,因而任何一方做出决定时,都必须考 虑其他对手可能作出的反应.

管理运筹学 易错判断题整理

管理运筹学 易错判断题整理
主要内容: 1 存储费 2 订货费 3 生产成本 4.缺货成本 5 订货提前期 6 订货点 7 (s,S)型存储 2 确定性存储的4种形式,要会画图。 判断题: 1 在其他费用不变的情况下,随着单位缺货费的增加, 最优订货批量将相应减少。× 2 其他费用不变,订货费用的增加将导致订货批量的减少。 × 3 在需求量为常数,订货提前期为0的经济订货批量存储模型中, 4 最优订货批量随一次订货费的增大而增大,随存储费用的增加而减小。 √
× 5 如果运输问题或者转运问题模型中,Cij 都是产地i到销地j的最小 运输费用,则运输问题同转运问题将得到相同的最优解。

第三章:目标规划
主要内容: 1 描述目标规划建模的思路以及他的数学模型同一般线性 数学模型的相同和不同点。 2 解释下列变量:1正负偏差变量 2绝对约束和目标约束 3 优先因子与权系数。 3 目标规划图解法的步骤。 4 目标规划 目标函数特点。 判断题: 1 目标规划模型中,可以不含有绝对约束但是必须含有目 标约束。
第一章:线性规划及单纯形法
2.1单纯形法和两阶段法大M法 主要内容
1 线性规划数学模型的结构及各要素的特征。 2 求解线性规划时可能出现哪几种结果。 3 叙述线性规划问题的可行解、基解、基可行解、最优解 的概念及上述解之间的关系。
4 单纯性法的计算步骤,如何在单纯性表中判别问题是具 有唯一最优解、无穷多最优解、无界解。
√ 4 动态规划的基本方程保证各阶段内决策的独立进行,可以不考虑这之前和之后 决策的如何进行。

第六章:网络规划
主要内容:
6.1 1 通常用G=(v,e)表示一个图,试描述符号V,E及表达式的含义。 2 解释下列名词,说明区别。1 端点,相邻,关联边, 2 环,多重边,简单图 3链,初等链 4. 圈,初等圈,简单圈。 5.回路,初等路6.节点的次,悬挂点,悬挂边,孤立点 7. 连通图,连通分图 ,支撑子图8. 有向图,基础图,赋权图 3 描述树,图的支撑树,最小支撑树的概念。 4 描述Dijkstra算法的基本思想和步骤。 5 最大流问题是线性规划问题,说明其线性形式。 6 什么是增光链,为什么不存在关于可行流f的增广链,就是最大流。 7截集,截量以及最大流最小截量定理。 8 最小费用最大流的概念。

《博弈论》阅读及答案

《博弈论》阅读及答案

“博弈论”阅读及答案阅读下面文字,完成6-8题。

“博弈论”是运筹学的一个分支,它是钻研个体如何在扑朔迷离的相互影响中得出最公道的策略的一种理论。

“博弈”这一说法是从棋弈、扑克和战争等带有比赛、抗衡和决策性质的问题中借用的术语,听上去有点玄奥,实际上却拥有首要现实意义。

博弈论巨匠看经济社会问题如同棋局,往往寓深入道理于游戏当中。

所以,博弈论多从咱们日常生活中的凡人小事入手,娓娓道来,其实不乏味。

在博弈论中,有一个著名的“阶下囚窘境”博弈模型。

假定一名富翁在家中被杀,财物被盗。

警方抓到两个犯罪嫌疑人,并从他们的住处搜出赃物。

然而,他们矢口否认曾杀过人。

因而警方将两人隔离落后行审判。

检察官给出以下条件:因为你们的偷窃罪已有确实的证据,所以可以判你们一年刑期。

然而,如果你单独坦白杀人的罪恶,我只判你三个月的监禁,但你的同伙要被判十年刑。

如果你拒不坦白,而被同伙检举,那末你就将被判十年刑,他只判三个月的监禁。

然而,如果你们两人都坦白交待,那末,你们都要被判五年刑。

两个囚犯面临着两难的选择——坦白或抵赖。

明显最好的策略是双方都抵赖,结果是大家都只被判一年。

然而因为两人在隔离的情况下没法串供,所以,每一个人都从利己的目的动身,选择坦白交待这一最好策略。

因为坦白交待可以指望得到最短的监禁,但条件是同伙抵赖,这明显比自己抵赖坐十年牢要好。

这种策略是损人利己的策略。

不仅如斯,坦白还有更多的益处。

如果对方坦白了而自己抵赖了,那自己就得坐十年牢。

因而,在这种情况下仍是应当选择坦白交待,即便两人同时坦白,最多也只判五年。

所以,两人公道的选择是坦白,本来对双方都有益的策略(抵赖)和终局(被判一年刑)就不会呈现。

在这个“阶下囚窘境”中,每一个局中人选择了自己的最优策略,从而使自己利益最大化。

所有局中人的策略形成了一个最优的策略组合,没有人有足够理由打破这种均衡。

这种由所有局中人(也称当事人、参与者)的最好策略形成的战略组合,被称为“非合作博弈均衡”,也叫“纳什均衡”①。

博弈论

博弈论

局中人
策略和策略集
支付和支付函数
一.枪手博弈
1.谁能活下来?
有三个枪手,其中甲十发八中(80%),乙十发六中(60%),丙十发四中(40%)。 三人同时开枪,一次只能发射一颗子Байду номын сангаас,谁最有可能活下来?
实力最强,死得最快
2.出击时机的选择
《纽约邮报》和《每日新闻》两家报纸就曾经在报纸售价上进行过 一场较量
THANKS VERY MUCH
博弈论
game theory
你不知道的博弈论
博弈论
作为运筹学的一个分支,是一门以数学为基础,研究发 生对抗和冲突时如何选择最优策略的学问
博弈论的研究方法
构成 复杂的现象 抽象 基本的概念 数学模型 分析
产生结果
逐步引入对其 局势产生影响 的其他因素
基本假设和要素
基本假设
要素1
要素2
要素3
.
个人理性
不认罪 ( (1 1, ,1 (终身 0 , 5) ( 1) ) 监禁,0)
思考
有一个地方遭灾,国家开办粥厂赈灾,和珅去视察粥厂随手抓了一把沙土洒在粥里,同行的 大臣问和珅你这是干什么,和珅说,真正的灾民饥肠辘辘是不会在乎粥里面有沙子的,来蹭 吃蹭喝的就不来了,这样才能让最困难的人活下来
2017
势者,因利而制权也。 ——《孙子兵法》
二.智猪博弈
猪圈里有一只大猪和一只小猪,猪圈的一边有一个踏板,每踩一下踏板,在远离 踏板的另一边投食口就会有少量事物落下
小猪踩踏板→大猪会在小猪跑回食槽之前把食物吃完 大猪踩踏板→大猪有机会在小猪吃完之前赶回食槽,争吃到另一半残羹
两只猪会采取什么策略呢?
商场中的智猪博弈 20世纪中期,美国专门生产黑人化妆品的公司并不多,佛雷化妆品公司算的上是个 佼佼者。 该公司有一位名叫乔治· 约翰逊的推销员,他后来召集了两三个同事,创办属于自己 的约翰逊黑人化妆品。 与实力强大的佛雷公司相比,约翰逊公司只有500美元和三四个员工,实力相差甚远。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

瑞典诺贝尔基金会官方网站透露了近20年 诺贝尔经济学奖得主名单及其主要贡献(即获 奖理由): 2004年 挪威经济学家芬恩-基德兰德(Finn E. Kydland)和美国经济学家爱德华-普雷斯科 特(Edward C. Prescott) 获奖理由:在动态宏观经济学方面做出了 巨大贡献。 2003年 美国经济学家罗伯特-恩格尔 (Robert F. Engle III)和英国经济学家克莱夫格兰杰(Clive W.J. Granger) 获奖理由:在经济时间数列中运用了统计 学的方法。
完全信息是指所有局中人对其他局中人各自策略 集以及不同局势下的收益函数都有完全的了解.
博弈的三个要素的矩阵表示(局中人A的收益)
策 略Leabharlann 局中人B 局中人Ab 1
a1 a2 am
c11 c21 cm1
b2
c12 c22 cm 2


bn
c1n c2 n cmn


局中人A的收益函数可用如下的矩阵表示:
§2.完全信息静态博弈(一) 一.二人零和博弈 设博弈中只有局中人A,B;局中人A的策略集为
. 局中人B的策略集为 S2 b1, b2 ,, bn cij 表示局中人A采取策略ai , 局中人B采取策略b j
S1 a1 , a2 ,, am ;
时A的收益(这时局中人B的收益为 cij ), cij为ai 和 b j的二元函数,即cij F (ai , b j ), (ai , b j )称为局势.
1986年 美国人詹姆斯-布坎南(James M. Buchanan Jr.) 获奖理由:将政治决策的分析同经济理论结 合起来,使经济分析扩大和应用到社会,政治 法规的选择 1985年 意大利人弗兰科-莫迪利安尼 (Franco Modigliani) 获奖理由:第一个提出储蓄的生命周期假设, 这一假设在研究家庭和企业储蓄中得到了广泛 应用。
什么是博弈论?
所谓博弈是指局中人按一定规则,在充分考虑其 他局中人可能采取的策略的基础上,从自己的策 略集中选取相应策略,并从中得到回报的过程. 博弈是一种特殊的决策,在决策论中,决策者的 对手是大自然,在博弈论中,代替大自然的是有 理性的人,因而任何一方做出决定时,都必须考 虑其他对手可能作出的反应.
在国外,1912年E.Zermelo用集合论研究过下棋 问题,四十年代由于生产和战争的需要,博弈理 论得到了发展,系统博弈理论的形成则以1944 年V.Neumann,O.Morgensten合著的《博弈论 和经济行为》一书为标志.1994年瑞士皇家科 学院决定将诺贝尔经济学奖授予纳什(Nash),哈 萨尼(Harsanyi)和泽尔腾(Selten)三人,表彰他们 在博弈理论和应用研究方面作出的杰出贡献. 目前,博弈论在定价,招投标,拍卖,委托代理以及 很多重要的经营决策中得到应用,它已成为现代 经济学的重要基础.
1995年 美国人罗伯特-卢卡斯(Robert E. Lucas Jr.) 获奖理由:倡导和发展了理性预期与宏观经济学研究的运用 理论,深化了人们对经济政策的理解,并对经济周期理论提出 了独到的见解。 1994年 美国人约翰-海萨尼(John C. Harsanyi) 和美国人约翰 -纳什(John F. Nash Jr.)以及德国人莱因哈德-泽尔腾(Reinhard Selten) 获奖理由:在非合作博弈的均衡分析理论方面做出了开创性 的贡献,对博弈论和经济学产生了重大影响 。 1993年 美国人罗伯特-福格尔(Robert W. Fogel)和道格拉斯诺斯(Douglass C. North) 获奖理由:前者用经济史的新理论及数理工具重新诠释了过 去的经济发展过程;后者建立了包括产权理论、国家理论和意 识形态理论在内的“制度变迁理论”。 1992年 美国人加里-贝克(Gary S. Becker) 获奖理由:揭示并澄清了经济制度结构和函数中交易费用和 产权的重要性。
§1. 引言
在社会活动,经济和经济管理,军事活动中,经常 会遇到具有竞争性或利益相对抗的现象,例如下 棋,打桥牌,体育竞赛,市场竞争,广告战,价格战, 军事斗争等.竞争的各方总是想用最好的策略击 败对方,取得尽可能好的结果,这就是博弈现象. 博弈现象是一种特殊的决策,在不确定决策分析 中,决策者的对手是”大自然”,它对决策者的 各种策略不产生反应,但在博弈现象中,代替” 大自然”的是”有理性的人”,因而任何一方做 出的决定都必须充分考虑其他对手可能作出的 反应.
1990年 美国人哈里-马科维茨(Harry M. Markowitz)、 默顿-米勒(Merton H. Miller)和威廉-夏普(William F. Sharpe) 获奖理由:在金融经济学方面做出了开创性工作。 1989年 挪威人特里夫-哈维默(Trygve Haavelmo) 获奖理由:建立了现代经济计量学的基础性指导原 则。 1988年 法国人莫里斯-阿莱斯(Maurice Allais) 获奖理由:在市场理论及资源有效利用方面做出了 开创性贡献,并对一般均衡理论重新做了系统阐述。 1987年 美国人罗伯特-索洛(Robert M. Solow) 获奖理由:对增长理论做出贡献。提出长期的经济 增长主要依靠技术进步,而不是依靠资本和劳动力的 投入。
构成博弈的三个要素: 1.局中人(Players):是指参与竞争的各方,它可以 是一个人,也可以是一个集团,但局中人必须是 有决策权的主体,而不是参谋或从属人员.在博 弈中局中人可以有两方,称为二人博弈;也可以 有多方,称为多人博弈,在多人博弈中又可分为 结盟和不结盟的情况. 2.策略(Strategies):指局中人所拥有的对付其 他局中人的手段,方案的集合.在静态博弈中,策 略必须是一个独立的完整的行动,而不能是若 干相关行动中的某一步.
c11 c21 A c m1 c12 c22 cm 2 c1n c2 n cmn
二人零和博弈也称为矩阵博弈. 博弈可表为 G S1 , S2 ; A .
例1 写出”石头,剪子,布”游戏的收益矩阵.石 头赢剪刀1分,布赢石头1分,剪刀赢布1分. 解:甲的策略集为{石头,布,剪刀} 乙的策略集为{石头,布,剪刀}
约翰· 纳什 1928年生于美国
约翰· 海萨尼 1920年生于美国 约翰· 海萨尼(JOHN C. HARSANYI)美国人,由 于他与另外两位数学家在 非合作博弈的均衡分析理 论方面做出了开创性的贡 献,对博弈论和经济学产 生了重大影响,由此获得 诺贝尔经学奖。
莱因哈德· 泽尔腾 1930年生于德国
博弈的三个要素,即局中人,策略集和收益函 数构成了博弈信息,根据不同信息可对博弈 做如下分类:
1.按局中人对信息掌握情况分为:完全信息博弈 和不完全信息博弈; 2.按局中人采取行动的次序分为:如果同时采取 行动或在互相保密情况下采取行动,称为静态博 弈;如果采取行动有先后,后采取行动的人可以 观察到前面人采取的行动,称为动态博弈. 我们只研究完全信息静态博弈.
博弈论的研究建立在下述假设前提下:即参与 博弈的各局中人都是理性的. 对”理性”的理解:”理性人是指有一个很好定 义的偏好,在面临给定的约束条件下最大化自己 的偏好.” “博弈中一个理性的决策必定建立在预测其他 局中人的反应之上.一个局中人将自己置身于 其他局中人的位置并为他着想从而预测其他局 中人将选择的行为,在这个基础上该局中人决 定自己最理想的行动.”
乙 石头 0 1 -1 布 -1 0 1 剪刀 1 -1 0
甲 石头 布 剪刀
例2 写出齐王和田忌赛马中齐王的收益矩阵. 赢一场得一千金. 解:
S1 a1 , a2 , a3 , a4 , a5 , a6 , S 2 b1 , b2 , b3 , b4 , b5 , b6 a1 (上,中, 下), a2 (上, 下,中), a3 (中, 上, 下), a4 (中, 下, 上), a5 (下,中, 上), a6 (下, 上,中). S 2中的各策略与 S1对应的策略相同 .
约翰· 纳什(JOHN F.NASH)美国人 (1928- ),由于他与 另外两位数学家在 非合作博弈的均衡 分析理论方面做出 了开创性的贡献, 对博弈论和经济学 产生了重大影响, 而获得1994年诺贝 尔经济奖。
三人在非合作博弈的均 衡分析理论方面做出了 开创性贡献对博弈论和 经济学产生了重大影响
2002年 美国学者丹尼尔-卡尼曼(Daniel Kahneman)和弗农史密斯(Vernon L. Smith) 获奖理由:在心理和实验经济学研究方面做出了开创性 工作。 2001年 三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯 蒂格利茨(Joseph E. Stiglitz) 获奖理由:在“对充满不对称信息市场进行分析”领域 做出了重要贡献。 2000年 美国芝加哥大学的詹姆斯-赫克曼(James J. Heckman)和加州大学伯克利分校的丹尼尔-麦克法登 (Daniel L. McFadden) 获奖理由:在微观计量经济学领域做出了重大贡献。 1999年 加拿大著名经济学家罗伯特-蒙代尔教授(Robert A. Mundell) 获奖理由:对不同汇率体制下的货币和财政政策以及最 优货币区域的分析做出了伟大贡献。
第九章 博弈论


引言 完全信息静态博弈(有鞍点的博弈,混合策 略,纳什均衡) 完全信息静态博弈(非零和的情况,纳什均 衡)





教学目的与要求:理解具有竞争性问题的博 弈思想,对纳什均衡概念有初步的认识,掌 握矩阵博弈的求解方法. 重点与难点:有鞍点的静态博弈和无鞍点的 静态博弈,难点是纳什均衡的概念. 教学方法:通过大量的实例讲解相关概念和 解法,并进行课堂讨论. 思考题,讨论题,作业:两个课堂讨论题,本章 习题. 参考资料:见前言. 学时分配:6学时.
例如在齐王和田忌赛马的博弈中,双方都有六 个策略:(上,中,下),(上,下,中),(中,上,下), (中,下,上),(下,中,上),(下,上,中),这六个策略 形成一个策略集合.在一局对策中,局中人的 策略只有有限个,称为有限策略,否则为无限 策略.相应每个局中人的策略选择形成的策略 组称为一个局势. 3.收益函数(Payoff function):指一局博弈后各 局中人的输赢得失,用正的数字表示局中人的 赢得,负的数字表示局中人的损失.显然,收益函 数的取值与局中人选定的策略有关,于是一局 博弈的”得失”是”局势”的函数.
相关文档
最新文档