博弈论的几个经典模型1
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论的几个经典模型
模型四、斗鸡博弈 (chicken game)
斗鸡博弈强调的是,如何在博弈中采用妥协的 方式取得利益。如果双方都换位思考,它们 可以就补偿进行谈判,最后造成以补偿换退 让的协议,问题就解决了。
博弈论的几个经典模型
模型五、信号博弈/不完全信息动态博弈
• 光天化日之下的违法行为为什么总能成功? 人类有许多关于猴子的故事,比如朝三暮 四,杀鸡给猴看。其实猴子是没有思维的 ,它们 有一定的群体意识,但没有社会意识,人们关 于它们的故事其实是说人自己的。我们这里也 讲一个猴子的故事……。 在现实社会中,窃贼在公共场所比如公共汽 车上偷东西时,车上的乘客看到了,但不敢吭 声。没有被偷的人想,反正被偷的待宰猴群的 结局人不是我,我反抗了,我得不到任何好处 , 反而遭到伤害;而不反抗虽不得益,但也不受 损,我何必要反抗呢?这就是光天化日之下的 偷窃行为为什么总能成功的原因。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
通过海萨尼转换,博弈开始时,所有参 与人有关“自然”的行动有一致的信念,即 都知道所有参与人类型的概率分布函数,此 即“海萨尼公理”。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
某一市场原来被 A 企业所垄断。现在 B企业考虑 是否进入。 B 企业知道, A 企业是否允许它进入,取 决于 A 企业阻挠 B 企业进入所花费的成本。如果阻挠 的成本低,那么,正如下表后两列所表示的,A企业 的占优战略是阻挠,博弈有重复剔除的占优战略均衡 ——A 阻挠, B 不进入。如果阻挠的成本高,那么, 正如下表前两列所表示的,A企业的占优战略是默许 B 进入,博弈有重复剔除的占优战略均衡——A 默许 ,B进入。B企业所不知道的,是A企业的阻挠成本是 高是低。这里,某一参与人本人知道、其他参与人则 不知道的信息称为私人信息。某一参与人所拥有的全 部私人信息称为他的类型。在本例中,阻挠成本就是 A的私人信息。高阻挠成本和低阻挠成本则是两种不 同的类型。
博弈论的几个经典模型
模型一、智猪博弈/完全信息静态博弈
如果改变一下核心指标,猪圈里还会出现同样 的“小猪躺着大猪跑”的景象吗?试试看。
改变方案一:减量方案。 改变方案二:增量方案。 改变方案三:减量加移位方案。
投食仅原来的一半分量,但同时将投食口移到 踏板附近。结果呢,小猪和大猪都在拼命地 抢着踩踏板。等待者不得食 ,而多劳者多得。 每次的收获刚好消费完。 对于游戏设计者,这是一个最好的方案。 成本不高,但收获最大。
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
有两个小偷 A 和 B联合犯事、私入民宅被 警察抓住。警方将两人分别臵于不同的两个 房间内进行审讯,对每一个犯罪嫌疑人,警 方给出的政策是:如果一个犯罪嫌疑人坦白 了罪行,交出了赃物,于是证据确凿,两人 都被判有罪。如果另一个犯罪嫌疑人也作了 坦白,则两人各被判刑8年;如果另一个犯罪 嫌人没有坦白而是抵赖 ,则以妨碍公务罪(因 已有证据表明其有罪)再加刑2年,而坦白者 有功被减刑8年,立即释放。如果两人都抵赖, 则警方因证据不足不能判两人的偷窃罪,但 可以私入民宅的罪名将两人各判入狱1年。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
海萨尼转换后的市场进入博弈:
A
B 进入 不进入
高成本 默许 阻挠 (40,50) (-10,0) (0,300) (0,300)
低成本 默许 阻挠 (30,100) (-10,140) (0,400) (0,400)
Βιβλιοθήκη Baidu
显然,在这里,B所遇到的,是不确定性条件 下的选择问题。因为 B 不仅不知道 A 的类型 (是高还是低),而且不知道不同类型的分 布概率。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
高成本 默许 A 阻挠
N
低成本 A 默许 阻挠
B
进入 不进入 进入
B
不进入 进入
B
不进入 进入
B
不进入
(50,40) (300,0)(0,-10)(300,0)(100,30)(400,0)(140,-10)(400,0)
博弈论的几个经典模型
模型四、斗鸡博弈 (chicken game)
甲/乙前进 后退 前进 (-2,-2) (1,-1) 后退 (-1,1) (-1,-1) 上表中的数字的意思是:两者如果均选择 “前进”,结果是两败俱伤,两者均获得-2的 支付;如果一方“前进”,另外一方“后退 ”,前进者获得 1的支付,赢得了面子,而后 退者获得-1的支付,输掉了面子,但没有两者 均“前进”受到的损失大;两者均“后退” ,两者均输掉了面子,获得-1的支付。当然表 中的数字只是相对的值。
博弈论的几个经典模型
模型五、信号博弈/不完全信息动态博弈
如何从这种困境中摆脱出来?
我们看到,使乘客采取“反抗”策略,而非 “不反抗”策略在于加大采取“反抗”策略 的获益,而减少不反抗的获益。当“反抗” 策略下的获益大于“不反抗”策略下的获益 时,乘客就会采取“反抗”的策略。
借助于第一步和第二步中虚构的参与者“自 然”的行动,我们可以把一个不完全信息的 博弈表述为一个不完美信息的博弈。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
• 海萨尼转换分析 海萨尼转换是处理不完全信息博弈的标准方 法。一般地,“自然”在博弈开始的时候选择 参与人的类型,参与人的某个类型包括表征 类型的各个特征如策略空间、信息集、得益 函数等,这些又称为该类型参与人所拥有的 个人信息。 不完全信息意味着博弈各方中至少有一个参 与人有多个类型。
博弈论的几个经典模型
窃贼 偷东西
乘客 反抗 窃贼 殴打 不殴打 不反抗 窃贼 殴打 不殴打
乘客:受伤 乘客:无所得,乘客:受伤 乘客:无所得, 窃贼:可能被抓, 无所失 窃贼:得到赃物 无所失 可能逃脱 窃贼:被抓 窃贼:得到赃物
博弈论的几个经典模型
模型五、信号博弈/不完全信息动态博弈
对于乘客来说,窃贼的威胁是可信的,因 而乘客的最优策略是“不反抗”;而对于窃贼 来说,乘客“不反抗”下的“不殴打”策略为 最忧。 这一博弈的结果是,窃贼偷东西时“乘客不 反抗,窃贼不敢打”,这是一“子精炼纳什均 衡”。 这样一种群体不反抗的结果将使社会风气 恶化,偷窃之风盛行。对个体来说,虽然这一 次被偷的不是你 ,但下次你被偷的几率增加了。 这使得我们都如同待宰的猴子,我们不知道什 么时候轮到我们自己。这样,我们每个人的处 境比以前更差。
博弈论的几例经典模型
主讲人:鲁家乐 邵培林
引言
博弈论又被称为对策论(Game Theory), 及研究互动决策的理论。 互动决策:即各行动方(即局内人 [player] ) 的决策是相互影响的,每个人在决策的时候 必须将他人的决策纳入自己的决策考虑之中, 当然也需要把别人对于自己的考虑也要纳入 考虑之中……在如此迭代考虑情形进行决策, 选择最有利于自己的战略(strategy)。
博弈论的几个经典模型
模型五、信号博弈/不完全信息动态博弈
窃贼在偷东西时发出这样的信号:如果谁 反抗,将殴打谁。乘客想,窃贼的威胁是可 信的:因为如果个别乘客反抗,而窃贼不殴 打该乘客的话,就会有更多的乘客抓窃贼, 窃贼将有可能被抓,因此窃贼必然欧打反抗 的乘客。 乘客的策略及可能的支付为:反抗 , 有可能被殴打甚至受伤;不反抗,无所得也 无所失。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
• 什么是海萨尼转换? 海萨尼提出了一种处理不完全信息博弈的方 法 , 即引入一个虚拟的局中人——“自然”。 自然首先行动,它决定每个局中人的特征。 每个局中人知道自己的特征,但不知道别的 局中人特征。这种方法将不完全信息静态博 弈变成一个两阶段动态博弈,第一个阶段是 自然N的行动选择,第二阶段是除N外的局中 人的静态博弈。这种转换被称为“海萨尼转 换”,这个转换把“不完全信息”转变成为 完全但不完美信息,从而可以用分析完全信 息博弈的方法进行分析。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
按照海萨尼的方法,所有参与人的真实 类型都是给定的。其他参与人虽然不清楚某 一参与人的真实类型,但知道这些可能出现 的类型的分布概率,而且这种概率是公共知 识。用本例来说,公共知识不仅意味着B企业 知道A企业高阻挠成本与低阻挠成本的分布概 率,而且意味着A也清楚B知道这一概率。
小猪 大猪 按 不按(等待)
按
博弈论的几个经典模型
(5,1)
(9,-1)
(4,4)
(0,0)
不按(等待)
模型一、智猪博弈/完全信息静态博弈
选择等待是小猪的占优策略。
大猪的最佳选择取决于小猪的行动,如果小猪 去按,大猪最好选择等待;如果小猪不去按 , 则最佳选择是大猪亲自去按。 也就是说,在智猪博弈中,大猪没有占优策略 , 而小猪有占优策略,它的最佳选择就是耐心 等待大猪去按钮,才能获得最佳结果。 “小猪躺着大猪跑”的现象是由于故事中的游 戏规则所导致的。规则的核心指标是 : 每次落 下的事物数量和踏板与投食口之间的距离。
• 理性不一定道德。
博弈论的几个经典模型
模型一、智猪博弈/完全信息静态博弈
猪圈里有两只猪,一只比较大,一只比 较小。猪圈狭长,猪食槽在一头,猪食按钮 在另一头,按一下会有10个单位的猪食落进 槽里。由于按钮和食槽距离较远,按按钮的 体力耗费相当于2个单位的食物。若大猪先到 槽边,大小猪吃到食物的收益比是9:1;同 时到槽边,收益比是7:3;小猪先到槽边, 收益比是6:4。
博弈论的几个经典模型
引言
博弈: game ,即是人们遵循一定规则下的活 动,参与人的目的是“赢”。进行 game 的人 是很认真的,不同于汉语中游戏的概念。
博弈论/对策论:game theory
奥林匹克运动会:Olympic Games。
博弈论的几个经典模型
基本术语
• 博弈论研究的对象:是理性人或参与者如何 选择策略或如何作出行动的决定。
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
乙
甲
坦白 抵赖
坦白 (-8,-8) (-10,0)
抵赖 (0,-10) (-1,-1)
不难看出,“坦白”是任一犯罪嫌疑人的占 优战略,而(坦白,坦白)是一个占优战略 均衡。
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
该博弈刻划了两大难题: • 冲突情形下,参与人的目标是什么?是采用(作 为个人 ) 他自己的最好策略,还是采用 ( 作为集 体的一员)他们共同的最好策略?前者导致均衡 策略 ( 坦白,坦白 ) ,支付为 (-8 , -8) ;后者的最 好策略是 ( 抵赖,抵赖 ) ,支付为 (-1 , -1) 。这里 反映了个体理性行为与集体理性行为之间的矛 盾、冲突。 • 此博弈只进行一次还是重复进行?如果博弈只 进行一次,参与人似乎只有坦白才是最好的策 略,因为没有理由相信对手会对你有信心,他 总认为你自己会坦白;因此,双方都采取坦白 策略。然而,若博弈进行多次,则结论将会发 生变化。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
• 海萨尼转换的具体方法
一个虚拟的参与人“自然” , 自然首先决定参 与人的类型,赋予各参与人的类型向量 t,其 中 t (t1, t2 ,, tn ) ; 自然告知参与者自己的类型,却不告诉其他参 与者的类型; 参与者同时选择行动,每一参与者i 从可行集 Ai中 选择行动方案 ; 各方得到收益 Ai (a1, a2 ,, ai , ti ) 。
*贝叶斯纳什均衡
博弈论的几个经典模型
模型四、斗鸡博弈 (chicken game)
斗鸡博弈(Chicken Game)其实是一种误译。Chicken 在美国口语中是“懦夫”之意, Chicken Game 本应译成懦夫博弈。 两只公鸡狭路相逢。结果有四种可能:两只公鸡 对峙,谁也不让谁。或者两者相斗。结局都一 样——两败俱伤,这是谁也不愿意的。另两种 可能是一退一进。但退者有损失、丢面子。双 方都不愿退,也知道对方不愿退。在这样的博 弈中,要想取胜,就要在气势上压倒对方,至 少要显示出破釜沉舟、背水一战的决心来,以 迫使对方退却。但到最后的关键时刻,必有一 方要退下来。
模型四、斗鸡博弈 (chicken game)
斗鸡博弈强调的是,如何在博弈中采用妥协的 方式取得利益。如果双方都换位思考,它们 可以就补偿进行谈判,最后造成以补偿换退 让的协议,问题就解决了。
博弈论的几个经典模型
模型五、信号博弈/不完全信息动态博弈
• 光天化日之下的违法行为为什么总能成功? 人类有许多关于猴子的故事,比如朝三暮 四,杀鸡给猴看。其实猴子是没有思维的 ,它们 有一定的群体意识,但没有社会意识,人们关 于它们的故事其实是说人自己的。我们这里也 讲一个猴子的故事……。 在现实社会中,窃贼在公共场所比如公共汽 车上偷东西时,车上的乘客看到了,但不敢吭 声。没有被偷的人想,反正被偷的待宰猴群的 结局人不是我,我反抗了,我得不到任何好处 , 反而遭到伤害;而不反抗虽不得益,但也不受 损,我何必要反抗呢?这就是光天化日之下的 偷窃行为为什么总能成功的原因。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
通过海萨尼转换,博弈开始时,所有参 与人有关“自然”的行动有一致的信念,即 都知道所有参与人类型的概率分布函数,此 即“海萨尼公理”。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
某一市场原来被 A 企业所垄断。现在 B企业考虑 是否进入。 B 企业知道, A 企业是否允许它进入,取 决于 A 企业阻挠 B 企业进入所花费的成本。如果阻挠 的成本低,那么,正如下表后两列所表示的,A企业 的占优战略是阻挠,博弈有重复剔除的占优战略均衡 ——A 阻挠, B 不进入。如果阻挠的成本高,那么, 正如下表前两列所表示的,A企业的占优战略是默许 B 进入,博弈有重复剔除的占优战略均衡——A 默许 ,B进入。B企业所不知道的,是A企业的阻挠成本是 高是低。这里,某一参与人本人知道、其他参与人则 不知道的信息称为私人信息。某一参与人所拥有的全 部私人信息称为他的类型。在本例中,阻挠成本就是 A的私人信息。高阻挠成本和低阻挠成本则是两种不 同的类型。
博弈论的几个经典模型
模型一、智猪博弈/完全信息静态博弈
如果改变一下核心指标,猪圈里还会出现同样 的“小猪躺着大猪跑”的景象吗?试试看。
改变方案一:减量方案。 改变方案二:增量方案。 改变方案三:减量加移位方案。
投食仅原来的一半分量,但同时将投食口移到 踏板附近。结果呢,小猪和大猪都在拼命地 抢着踩踏板。等待者不得食 ,而多劳者多得。 每次的收获刚好消费完。 对于游戏设计者,这是一个最好的方案。 成本不高,但收获最大。
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
有两个小偷 A 和 B联合犯事、私入民宅被 警察抓住。警方将两人分别臵于不同的两个 房间内进行审讯,对每一个犯罪嫌疑人,警 方给出的政策是:如果一个犯罪嫌疑人坦白 了罪行,交出了赃物,于是证据确凿,两人 都被判有罪。如果另一个犯罪嫌疑人也作了 坦白,则两人各被判刑8年;如果另一个犯罪 嫌人没有坦白而是抵赖 ,则以妨碍公务罪(因 已有证据表明其有罪)再加刑2年,而坦白者 有功被减刑8年,立即释放。如果两人都抵赖, 则警方因证据不足不能判两人的偷窃罪,但 可以私入民宅的罪名将两人各判入狱1年。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
海萨尼转换后的市场进入博弈:
A
B 进入 不进入
高成本 默许 阻挠 (40,50) (-10,0) (0,300) (0,300)
低成本 默许 阻挠 (30,100) (-10,140) (0,400) (0,400)
Βιβλιοθήκη Baidu
显然,在这里,B所遇到的,是不确定性条件 下的选择问题。因为 B 不仅不知道 A 的类型 (是高还是低),而且不知道不同类型的分 布概率。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
高成本 默许 A 阻挠
N
低成本 A 默许 阻挠
B
进入 不进入 进入
B
不进入 进入
B
不进入 进入
B
不进入
(50,40) (300,0)(0,-10)(300,0)(100,30)(400,0)(140,-10)(400,0)
博弈论的几个经典模型
模型四、斗鸡博弈 (chicken game)
甲/乙前进 后退 前进 (-2,-2) (1,-1) 后退 (-1,1) (-1,-1) 上表中的数字的意思是:两者如果均选择 “前进”,结果是两败俱伤,两者均获得-2的 支付;如果一方“前进”,另外一方“后退 ”,前进者获得 1的支付,赢得了面子,而后 退者获得-1的支付,输掉了面子,但没有两者 均“前进”受到的损失大;两者均“后退” ,两者均输掉了面子,获得-1的支付。当然表 中的数字只是相对的值。
博弈论的几个经典模型
模型五、信号博弈/不完全信息动态博弈
如何从这种困境中摆脱出来?
我们看到,使乘客采取“反抗”策略,而非 “不反抗”策略在于加大采取“反抗”策略 的获益,而减少不反抗的获益。当“反抗” 策略下的获益大于“不反抗”策略下的获益 时,乘客就会采取“反抗”的策略。
借助于第一步和第二步中虚构的参与者“自 然”的行动,我们可以把一个不完全信息的 博弈表述为一个不完美信息的博弈。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
• 海萨尼转换分析 海萨尼转换是处理不完全信息博弈的标准方 法。一般地,“自然”在博弈开始的时候选择 参与人的类型,参与人的某个类型包括表征 类型的各个特征如策略空间、信息集、得益 函数等,这些又称为该类型参与人所拥有的 个人信息。 不完全信息意味着博弈各方中至少有一个参 与人有多个类型。
博弈论的几个经典模型
窃贼 偷东西
乘客 反抗 窃贼 殴打 不殴打 不反抗 窃贼 殴打 不殴打
乘客:受伤 乘客:无所得,乘客:受伤 乘客:无所得, 窃贼:可能被抓, 无所失 窃贼:得到赃物 无所失 可能逃脱 窃贼:被抓 窃贼:得到赃物
博弈论的几个经典模型
模型五、信号博弈/不完全信息动态博弈
对于乘客来说,窃贼的威胁是可信的,因 而乘客的最优策略是“不反抗”;而对于窃贼 来说,乘客“不反抗”下的“不殴打”策略为 最忧。 这一博弈的结果是,窃贼偷东西时“乘客不 反抗,窃贼不敢打”,这是一“子精炼纳什均 衡”。 这样一种群体不反抗的结果将使社会风气 恶化,偷窃之风盛行。对个体来说,虽然这一 次被偷的不是你 ,但下次你被偷的几率增加了。 这使得我们都如同待宰的猴子,我们不知道什 么时候轮到我们自己。这样,我们每个人的处 境比以前更差。
博弈论的几例经典模型
主讲人:鲁家乐 邵培林
引言
博弈论又被称为对策论(Game Theory), 及研究互动决策的理论。 互动决策:即各行动方(即局内人 [player] ) 的决策是相互影响的,每个人在决策的时候 必须将他人的决策纳入自己的决策考虑之中, 当然也需要把别人对于自己的考虑也要纳入 考虑之中……在如此迭代考虑情形进行决策, 选择最有利于自己的战略(strategy)。
博弈论的几个经典模型
模型五、信号博弈/不完全信息动态博弈
窃贼在偷东西时发出这样的信号:如果谁 反抗,将殴打谁。乘客想,窃贼的威胁是可 信的:因为如果个别乘客反抗,而窃贼不殴 打该乘客的话,就会有更多的乘客抓窃贼, 窃贼将有可能被抓,因此窃贼必然欧打反抗 的乘客。 乘客的策略及可能的支付为:反抗 , 有可能被殴打甚至受伤;不反抗,无所得也 无所失。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
• 什么是海萨尼转换? 海萨尼提出了一种处理不完全信息博弈的方 法 , 即引入一个虚拟的局中人——“自然”。 自然首先行动,它决定每个局中人的特征。 每个局中人知道自己的特征,但不知道别的 局中人特征。这种方法将不完全信息静态博 弈变成一个两阶段动态博弈,第一个阶段是 自然N的行动选择,第二阶段是除N外的局中 人的静态博弈。这种转换被称为“海萨尼转 换”,这个转换把“不完全信息”转变成为 完全但不完美信息,从而可以用分析完全信 息博弈的方法进行分析。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
按照海萨尼的方法,所有参与人的真实 类型都是给定的。其他参与人虽然不清楚某 一参与人的真实类型,但知道这些可能出现 的类型的分布概率,而且这种概率是公共知 识。用本例来说,公共知识不仅意味着B企业 知道A企业高阻挠成本与低阻挠成本的分布概 率,而且意味着A也清楚B知道这一概率。
小猪 大猪 按 不按(等待)
按
博弈论的几个经典模型
(5,1)
(9,-1)
(4,4)
(0,0)
不按(等待)
模型一、智猪博弈/完全信息静态博弈
选择等待是小猪的占优策略。
大猪的最佳选择取决于小猪的行动,如果小猪 去按,大猪最好选择等待;如果小猪不去按 , 则最佳选择是大猪亲自去按。 也就是说,在智猪博弈中,大猪没有占优策略 , 而小猪有占优策略,它的最佳选择就是耐心 等待大猪去按钮,才能获得最佳结果。 “小猪躺着大猪跑”的现象是由于故事中的游 戏规则所导致的。规则的核心指标是 : 每次落 下的事物数量和踏板与投食口之间的距离。
• 理性不一定道德。
博弈论的几个经典模型
模型一、智猪博弈/完全信息静态博弈
猪圈里有两只猪,一只比较大,一只比 较小。猪圈狭长,猪食槽在一头,猪食按钮 在另一头,按一下会有10个单位的猪食落进 槽里。由于按钮和食槽距离较远,按按钮的 体力耗费相当于2个单位的食物。若大猪先到 槽边,大小猪吃到食物的收益比是9:1;同 时到槽边,收益比是7:3;小猪先到槽边, 收益比是6:4。
博弈论的几个经典模型
引言
博弈: game ,即是人们遵循一定规则下的活 动,参与人的目的是“赢”。进行 game 的人 是很认真的,不同于汉语中游戏的概念。
博弈论/对策论:game theory
奥林匹克运动会:Olympic Games。
博弈论的几个经典模型
基本术语
• 博弈论研究的对象:是理性人或参与者如何 选择策略或如何作出行动的决定。
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
乙
甲
坦白 抵赖
坦白 (-8,-8) (-10,0)
抵赖 (0,-10) (-1,-1)
不难看出,“坦白”是任一犯罪嫌疑人的占 优战略,而(坦白,坦白)是一个占优战略 均衡。
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
该博弈刻划了两大难题: • 冲突情形下,参与人的目标是什么?是采用(作 为个人 ) 他自己的最好策略,还是采用 ( 作为集 体的一员)他们共同的最好策略?前者导致均衡 策略 ( 坦白,坦白 ) ,支付为 (-8 , -8) ;后者的最 好策略是 ( 抵赖,抵赖 ) ,支付为 (-1 , -1) 。这里 反映了个体理性行为与集体理性行为之间的矛 盾、冲突。 • 此博弈只进行一次还是重复进行?如果博弈只 进行一次,参与人似乎只有坦白才是最好的策 略,因为没有理由相信对手会对你有信心,他 总认为你自己会坦白;因此,双方都采取坦白 策略。然而,若博弈进行多次,则结论将会发 生变化。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
• 海萨尼转换的具体方法
一个虚拟的参与人“自然” , 自然首先决定参 与人的类型,赋予各参与人的类型向量 t,其 中 t (t1, t2 ,, tn ) ; 自然告知参与者自己的类型,却不告诉其他参 与者的类型; 参与者同时选择行动,每一参与者i 从可行集 Ai中 选择行动方案 ; 各方得到收益 Ai (a1, a2 ,, ai , ti ) 。
*贝叶斯纳什均衡
博弈论的几个经典模型
模型四、斗鸡博弈 (chicken game)
斗鸡博弈(Chicken Game)其实是一种误译。Chicken 在美国口语中是“懦夫”之意, Chicken Game 本应译成懦夫博弈。 两只公鸡狭路相逢。结果有四种可能:两只公鸡 对峙,谁也不让谁。或者两者相斗。结局都一 样——两败俱伤,这是谁也不愿意的。另两种 可能是一退一进。但退者有损失、丢面子。双 方都不愿退,也知道对方不愿退。在这样的博 弈中,要想取胜,就要在气势上压倒对方,至 少要显示出破釜沉舟、背水一战的决心来,以 迫使对方退却。但到最后的关键时刻,必有一 方要退下来。