博奕论特点、原则与对策行为

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基本概念
博弈论和对策行为
在策略型博奕中,一个对策有以下几种基本要素: 一.局中人 二.策略(strategies):
即指每个局中人在对策中可以选择采用的行动方 案,但这个方案必须是一个完整的行动,而不是行动 的某一步。每个局中人均有可供选择的多种策略。
博奕论特点、原则与对策行为
基本概念
博弈论和对策行为
博奕论特点、原则与对策行为
概论
博弈论和对策行为
博奕论是一门内容广泛且复杂的学科,不仅是经 济学,政治学、军事、外交、国际关系、公共选择, 还有犯罪学等,都涉及到博奕论。
实际上,很多人把博奕论看成数学的一个分支, 博奕论的一个重要代表人物---纳什(Nash,曾获1994 年诺贝尔经济学奖,该年度的诺贝尔经济学奖授与了 三位博奕论专家),在1951年的一篇奠基性的文章就 是发表在数学杂志上,而非在经济学杂志上。
策略型博弈的实例和解(囚徒困境) 例1. 囚徒困境(prisoner’s dilemma)
囚徒B
坦白 抵赖
囚徒A
坦白 抵赖
-8,- 0,-
8 10
-10, -1,-
0
1
博奕论特点、原则与对策行为
博弈论和对策行为
策略型博弈的实例和解(囚徒困境)
例1. 囚徒困境(prisoner’s dilemma)
博奕论特点、原则与对策行为
概论
博弈论和对策行为
对策思想明确地应用于经济领域,始于Cournot (1838), Bertrand (1883), Edgeworth (1925)等人关于寡 头竞争、产量与价格垄断、产品交易行为的研究。
然而,作为一门学科的创立,则是以美国数学 家冯.诺依曼(John Von Neumann)和经济学家奥斯卡. 摩根斯坦(Oskar Morgenstern)合著的《博奕论与经济 行为》(The Game Theory and Economic Behavior) (1944)一书出版为标志,他们奠定和形成了这门学科 的理论与方法论基础。
但是,本讲只是介绍博奕论的最基本的内容,且 限于博奕论在经济学博奕中论特的点、应原则与用对策。行为
基本概念
博弈论和对策行为
本书讨论博奕论模型的最基本表述方式---策略型 表述,它主要用于表现静态对策。这里介绍策略型表 述中的基本概念,明确有关术语的准确含义。
博奕论特点、原则与对策行为
基本概念
博弈论和对策行为
博奕论特点、原则与对策行为
wenku.baidu.com博奕论特点、原则与对策行为
概论
博弈论和对策行为
博奕论(the Game Theory)也就是运筹学中的对策 论。
对策思想最早产生于我国古代。 早在两千多年的春秋时期,孙武在《孙子兵法》 中论述的军事思想和治国策略,就蕴育了丰富和深 刻的对策论思想。孙武的后代孙膑,为田忌谋划, 巧胜齐王,这个著名的“田忌赛马”,就是典型的对策 思想的成功运用。
在策略型博奕中,一个对策有以下几种基本要素:
一.局中人 二.策略 三.支付或收益(payoffs):
是指一局博奕的得失。或者说是局中人从各种策 略组合中获得的效用,它是策略组合的函数。如果 局中人得失的总和为零,则称这种对策为零和对策; 否则,称为非零和博奕。
博奕论特点、原则与对策行为
博弈论和对策行为
博奕论特点、原则与对策行为
纳什均衡
博弈论和对策行为
定义2: 一个策略组合s*=(s1*,s2*,…,sn*)被称为纳什均 衡是指,对于所有 的 i,
u i(si* ,s * i) u i(si',s * i) si' S i
纳什均衡的思想就是,博奕的理性结局是这样一 种策略组合,其中每个局中人选择的策略都已是对其 它局中人所选策略的最优反应,所以,谁也没有积极 性去选择其它策略。因为每一个局中人均不能因为单 方面改变自己的策略而获利,于是谁也没有兴趣主动 打破这种均衡。
对囚徒B作同样分析:如果囚徒A的策略是“坦白”,则他 采取“坦白”策略为好;如果囚徒A的策略是“抵赖”,他还是采取“ 坦白”策略好,所以囚徒B对囚徒A的最优反应也是“坦白”。
这个例子可以看作是非合作博奕现象的一个抽象概括。 它讲的是两个嫌疑犯被隔离审讯。他们面临的处境是:如果 两人都坦白,各判刑8年;如果两人都抵赖,各判刑1年(或许 证据不足);如果一人坦白另一人抵赖,则坦白的放出去,不 坦白的判刑10年,(“坦白从宽、抗拒从严”)。这里,两个囚徒 就是两个局中人,每个局中人都有两个策略可供选择:坦白 或抵赖。表中每一格的一对数字分别表示局中人不同策略组 合的收益,第一个数字是囚徒A的收益,第二个数字是囚徒B 的收益。这种有限对策(局中人是有限个,每个局中人的策略
博奕论特点、原则与对策行为
纳什均衡
博弈论和对策行为
定义1: 给定其它局中人的策略s,局中人i的最优反应 记为s,是指能给他带来最大收益的策略,即
u i(s i* ,s i) u i(s i',s i) s i' s i*
当每个局中人都选择了自己的最优反应策略,并 且这些最优反应形成一个策略组合,便形成了纳什均 衡。
在策略型博奕中,一个对策有以下几种基本要素: 一.局中人(players):
即博奕的参与者,他们是博奕的决策主体行为。 根据自己的利益要求决定自己的,记局中人为i,局 中人集合为{1,2,…,I},即共有I个局中人。我们将某 个局中人以外的其它局中人称为“i的对手”,记为-i。
博奕论特点、原则与对策行为
数也是有限的)往往用矩阵形式表示。
博奕论特点、原则与对策行为
博弈论和对策行为
策略型博弈的实例和解(囚徒困境) 例1. 囚徒困境(prisoner’s dilemma)
在对博奕局势进行描述后,博奕论分析就是要求 出局中人进行策略选择的理性结局,或者说找出博奕 问题的解。在非合作博奕中,有两种解的技术:一种 是纳什均衡,一种是优超解。
博奕论特点、原则与对策行为
纳什均衡
博弈论和对策行为
在囚徒困境中,考虑囚徒A对他人的最优反应。如果给定 囚徒B的策略是“坦白”,那么对囚徒A来说,采取“坦白”策略得 到的收益是-8,采取“抵赖”策略得到的收益是-10,显然“坦白” 为好;同理,如果给定囚徒B的策略是“抵赖”,对囚徒A来说 ,“坦白”也比“抵赖”好。因此,囚徒A对囚徒B的最优反应是“ 坦白”。
相关文档
最新文档