经典博弈论完整版培训课程
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
option to retain text.
05 04
近年来,由于纳什、泽尔腾、 海萨尼获诺贝尔经济学奖 (1994),进一步推动了博 弈论的研究。
03 02
第一次、第二次世界大战,军 事对策应C op用y 于pas战te 役fon和ts.战C h略oos研e 究the。
only option to retain text.
表中每一格的一对数字分别表示局中人不同策略组合的 收益,第一个数字是囚徒A的收益,第二个数字是囚徒B 的收益。这种有限对策(局中人是有限个,每个局中人的 策略数也是有限的)往往用矩阵形式表示。
在对博弈局势进行描述后,博弈论分析就是要求 出局中人进行策略选择的理性结局,或者说找出博 弈问题的解。
在非合作博弈中,有两种解的技术:一种是纳什 均衡,一种是优超解。
经典博弈论 培训课程
目 录
一 博弈论概述 二 博弈论模型 三 博弈论应用 四 博弈论成果
博弈论概述
博弈论概念:
博弈即一些个人,队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一 次或多次,从各允许选择的行为或策略中进行选择并加以实施,各自取得相应的结果的过程。
在策略型博弈中,一个对 策有以下几种基本要素:
对囚徒B作同样分析:如果囚徒A的策略是“坦白”,则他采取“坦白”策略为好;如果囚徒A的策略是“抵 赖”,他还是采取“坦白”策略好,所以囚徒B对囚徒A的最优反应也是“坦白”。
两个最优反应形成了一个策略组合(坦白,坦白),这就是一个纳什均衡。
博弈论模型—纳什均衡
定义一:
给定其它局中人的策略s,局中人i的最优反应记为s,是指能给他带来最大收益的策略, 当每个局中人都 选择了自己的最优反应策略,并且这些最优反应形成一个策略组合,便形成了纳什均衡。
博弈论常见经典模型
Text here
01
囚徒困境
02
Text here
C opy p纳aste什fon均ts.衡
C hoose the only option to retain text.
Text here
性别战 C opy paste fonts.
C hoose the only option
公式一:
ui (si* , si ) ui (si' , si ) si' si*
定义二:
一个策略组合s*=(s1*,s2*,…,sn*)被称为纳什均衡,对于所有的i,纳什均衡的思想就是,博弈的理性结局是这 样一种策略组合,其中每个局中人选择的策略都已是对其它局中人所选策略的最优反应,所以,谁也没有积极 性去选择其它策略。因为每一个局中人均不能因为单方面改变自己的策略而获利,于是谁也没有兴趣主动打破 这种均衡。
女
足球
芭蕾
足球
2,1
0,0
男
芭蕾
0,0
1,2
三.支付或收益(payoffs):
是指一局博弈的得失。或者说是局中人从各种策略组合中获得的效用,它 是策略组合的函数。如果局中人得失的总和为零,则称这种对策为零和对策; 否则,称为非零和博弈。
博弈论历史变革
1944年,冯·诺意曼、摩根T e斯xt特h合ere 写了“博弈论和经济行为”,推动 了博弈C论op在y p经as济te 管fon理ts.中C的hoo应se用th。e only
1912年,数学家翟墨罗把对策从模拟模 型抽象为数学模型。
01
我国古CT代oepxy围tpa棋hsete、refo国nts际. C象ho棋ose(th印e o度nly)op等tion。to retain
text.
博弈论现代应用案例
美丽心灵
美丽心灵(A Beautiful Mind)是一 部改编自同名传记而获得奥斯卡金像 奖的电影。影片讲述一位患有精神分 裂症但却在博弈论和微几何学领域 潜心研究以致获得诺贝尔经济学奖的 数学家约翰·福布斯·纳什。
这个例子可以看作是非合作博弈现象的一个抽象概括。
它讲的是两个嫌疑犯被隔离审讯。
他们面临的处境是:
如果两人都坦白,各判刑8年;
如果两人都抵赖,各判刑1年(或许证据不足);
如果一人坦白另一人抵赖,则坦白的放出去,不坦白的判 刑15年,(“坦白从宽、抗拒从严”)。
策这略里可T,供ex两选t个择h囚:er徒坦e就白是或两抵个赖局。中人,每个局中人都有两个
囚徒A
坦白 抵赖
囚徒B
坦白
抵赖
-8,-8 0,-15
-15,0 -1,-1
博弈论模型—纳什均衡
类型 囚徒A 囚徒B
选择一 坦白(8) 坦白(8)
纳什均衡
选择二 抵赖(15) 坦白(0)
选择三 坦白(0) 抵赖(15)
选择四 抵赖(1) 抵赖(1)
解析:
在囚徒困境中,考虑囚徒A对他人的最优反应。如果给定囚徒B的策略是“坦白”,那么对囚徒A来说,采取 “坦白”策略得到的收益是-8,采取“抵赖”策略得到的收益是-15,显然“坦白”为好;同理,如果给定囚徒B 的策略是“抵赖”,对囚徒A来说,“坦白”也比“抵赖”好。因此,囚徒A对囚徒B的最优反应是“坦白”。
一.局中人(players):
即博弈的参与者,他们是博弈的决策主体行为。根据自己的利益要求决定 自己的,记局中人为i,局中人集合为{1,2,…, i},即共有i个局中人。我们将某个 局中人以外的其它局中人称为“i的对手”,记为-i。
二.策略(strategies):
即指每个局中人在对策中可以选择采用的行动方案,但这个方案必须是一 个完整的行动,而不是行动的某一步。每个局中人均有可供选择的多种策略。
to retain text.
Text here
优超解 C opy paste fonts.
C hoose the only option
to retain text.
04
03
目 录
一 博弈论概述 二 博弈论模型 三 博弈论应用 四 博弈论成果
博弈论模型—囚徒困境(prisoner’s dilemma)
公式二:
ui (si* , s*i ) ui (si' , s*i ) si' Si
博弈论模型—性别战(battle of the sexes)
一男一女恋爱,有些业余活动要安排,或者去看足球比赛,或者去看芭蕾舞演出。男的偏好 足球,女的则更喜欢芭蕾舞,但他们都宁愿在一起,不愿分开。下表给出收益矩阵:
05 04
近年来,由于纳什、泽尔腾、 海萨尼获诺贝尔经济学奖 (1994),进一步推动了博 弈论的研究。
03 02
第一次、第二次世界大战,军 事对策应C op用y 于pas战te 役fon和ts.战C h略oos研e 究the。
only option to retain text.
表中每一格的一对数字分别表示局中人不同策略组合的 收益,第一个数字是囚徒A的收益,第二个数字是囚徒B 的收益。这种有限对策(局中人是有限个,每个局中人的 策略数也是有限的)往往用矩阵形式表示。
在对博弈局势进行描述后,博弈论分析就是要求 出局中人进行策略选择的理性结局,或者说找出博 弈问题的解。
在非合作博弈中,有两种解的技术:一种是纳什 均衡,一种是优超解。
经典博弈论 培训课程
目 录
一 博弈论概述 二 博弈论模型 三 博弈论应用 四 博弈论成果
博弈论概述
博弈论概念:
博弈即一些个人,队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一 次或多次,从各允许选择的行为或策略中进行选择并加以实施,各自取得相应的结果的过程。
在策略型博弈中,一个对 策有以下几种基本要素:
对囚徒B作同样分析:如果囚徒A的策略是“坦白”,则他采取“坦白”策略为好;如果囚徒A的策略是“抵 赖”,他还是采取“坦白”策略好,所以囚徒B对囚徒A的最优反应也是“坦白”。
两个最优反应形成了一个策略组合(坦白,坦白),这就是一个纳什均衡。
博弈论模型—纳什均衡
定义一:
给定其它局中人的策略s,局中人i的最优反应记为s,是指能给他带来最大收益的策略, 当每个局中人都 选择了自己的最优反应策略,并且这些最优反应形成一个策略组合,便形成了纳什均衡。
博弈论常见经典模型
Text here
01
囚徒困境
02
Text here
C opy p纳aste什fon均ts.衡
C hoose the only option to retain text.
Text here
性别战 C opy paste fonts.
C hoose the only option
公式一:
ui (si* , si ) ui (si' , si ) si' si*
定义二:
一个策略组合s*=(s1*,s2*,…,sn*)被称为纳什均衡,对于所有的i,纳什均衡的思想就是,博弈的理性结局是这 样一种策略组合,其中每个局中人选择的策略都已是对其它局中人所选策略的最优反应,所以,谁也没有积极 性去选择其它策略。因为每一个局中人均不能因为单方面改变自己的策略而获利,于是谁也没有兴趣主动打破 这种均衡。
女
足球
芭蕾
足球
2,1
0,0
男
芭蕾
0,0
1,2
三.支付或收益(payoffs):
是指一局博弈的得失。或者说是局中人从各种策略组合中获得的效用,它 是策略组合的函数。如果局中人得失的总和为零,则称这种对策为零和对策; 否则,称为非零和博弈。
博弈论历史变革
1944年,冯·诺意曼、摩根T e斯xt特h合ere 写了“博弈论和经济行为”,推动 了博弈C论op在y p经as济te 管fon理ts.中C的hoo应se用th。e only
1912年,数学家翟墨罗把对策从模拟模 型抽象为数学模型。
01
我国古CT代oepxy围tpa棋hsete、refo国nts际. C象ho棋ose(th印e o度nly)op等tion。to retain
text.
博弈论现代应用案例
美丽心灵
美丽心灵(A Beautiful Mind)是一 部改编自同名传记而获得奥斯卡金像 奖的电影。影片讲述一位患有精神分 裂症但却在博弈论和微几何学领域 潜心研究以致获得诺贝尔经济学奖的 数学家约翰·福布斯·纳什。
这个例子可以看作是非合作博弈现象的一个抽象概括。
它讲的是两个嫌疑犯被隔离审讯。
他们面临的处境是:
如果两人都坦白,各判刑8年;
如果两人都抵赖,各判刑1年(或许证据不足);
如果一人坦白另一人抵赖,则坦白的放出去,不坦白的判 刑15年,(“坦白从宽、抗拒从严”)。
策这略里可T,供ex两选t个择h囚:er徒坦e就白是或两抵个赖局。中人,每个局中人都有两个
囚徒A
坦白 抵赖
囚徒B
坦白
抵赖
-8,-8 0,-15
-15,0 -1,-1
博弈论模型—纳什均衡
类型 囚徒A 囚徒B
选择一 坦白(8) 坦白(8)
纳什均衡
选择二 抵赖(15) 坦白(0)
选择三 坦白(0) 抵赖(15)
选择四 抵赖(1) 抵赖(1)
解析:
在囚徒困境中,考虑囚徒A对他人的最优反应。如果给定囚徒B的策略是“坦白”,那么对囚徒A来说,采取 “坦白”策略得到的收益是-8,采取“抵赖”策略得到的收益是-15,显然“坦白”为好;同理,如果给定囚徒B 的策略是“抵赖”,对囚徒A来说,“坦白”也比“抵赖”好。因此,囚徒A对囚徒B的最优反应是“坦白”。
一.局中人(players):
即博弈的参与者,他们是博弈的决策主体行为。根据自己的利益要求决定 自己的,记局中人为i,局中人集合为{1,2,…, i},即共有i个局中人。我们将某个 局中人以外的其它局中人称为“i的对手”,记为-i。
二.策略(strategies):
即指每个局中人在对策中可以选择采用的行动方案,但这个方案必须是一 个完整的行动,而不是行动的某一步。每个局中人均有可供选择的多种策略。
to retain text.
Text here
优超解 C opy paste fonts.
C hoose the only option
to retain text.
04
03
目 录
一 博弈论概述 二 博弈论模型 三 博弈论应用 四 博弈论成果
博弈论模型—囚徒困境(prisoner’s dilemma)
公式二:
ui (si* , s*i ) ui (si' , s*i ) si' Si
博弈论模型—性别战(battle of the sexes)
一男一女恋爱,有些业余活动要安排,或者去看足球比赛,或者去看芭蕾舞演出。男的偏好 足球,女的则更喜欢芭蕾舞,但他们都宁愿在一起,不愿分开。下表给出收益矩阵: