综合I类与II类理性人的博弈策略分析

合集下载

博弈论的几个经典模型ppt课件

博弈论的几个经典模型ppt课件

博弈论的几个经典模型
22
模型二、囚徒困境/非合作博弈
该博弈刻划了两大难题: • 冲突情形下,参与人的目标是什么?是采用(作 为个人 ) 他自己的最好策略,还是采用 ( 作为集 体的一员)他们共同的最好策略?前者导致均衡 策略 ( 坦白,坦白 ) ,支付为 (-8 , -8) ;后者的最 好策略是 ( 抵赖,抵赖 ) ,支付为 (-1 , -1) 。这里 反映了个体理性行为与集体理性行为之间的矛 盾、冲突。 • 此博弈只进行一次还是重复进行?如果博弈只 进行一次,参与人似乎只有坦白才是最好的策 略,因为没有理由相信对手会对你有信心,他 总认为你自己会坦白;因此,双方都采取坦白 策略。然而,若博弈进行多次,则结论将会发 生变化。
第四章 博弈论的几个经典模型
1
引言
博弈论又被称为对策论(Game Theory), 按照2005年因对博弈论的贡献而获得诺贝尔经 济学奖的Robert Aumann教授的说法,博弈论 就是研究互动决策的理论。所谓互动决策, 即各行动方(即局中人[player])的决策是相互 影响的,每个人在决策的时候必须将他人的 决策纳入自己的决策考虑之中,当然也需要 把别人对于自己的考虑也要纳入考虑之 中……在如此迭代考虑情形进行决策,选择 最有利于自己的战略(strategy)。
此外此外还与会计学还与会计学统计学统计学数学基础数学基础社会心理学社会心理学以及诸如认识论与伦理学等哲学分支有重要联以及诸如认识论与伦理学等哲学分支有重要联博弈论的几个经典模型按照按照aumannaumann所撰写的所撰写的新帕尔格雷夫经新帕尔格雷夫经济学大辞典济学大辞典博弈论博弈论辞条的看法辞条的看法标准的标准的博弈论分析出发点是理性的博弈论分析出发点是理性的而不是心理的而不是心理的或社会的角度或社会的角度

博弈论以及经典案例分析

博弈论以及经典案例分析
• 常和博弈。在这种博弈中,各种结果下的各博弈方得益之和总是 等于一个非零常数。与零和博弈一样,常和博弈各方的利益关系 也是对立的,一方多占有一点利益,另一方必然会少占有一点。
• 变和博弈。即意味着在不同策略组合下各博弈方的得益之和是不 同的。倘若博弈各方之间相互配合,则可能争取到总得益和个人 得益均较大的理想结局;反之则社会总得益和个人得益均较小。
1.碟子、猫和古董商 有位古董商发现有个人用珍贵的碟子做猫食碗,于是假装对这 只猫相当喜爱,要从主人手中买下。猫主人不卖,为此古董商出高 价。
成交之后,古董商装作漫不经心地说:“这个碟子它用惯了, 就一块给我吧。”猫主人不干了:“你知道我用这个碟子已经买出 多少只猫了?”下面分析该故事。在这里
知识是“碟子是古董”
• 在这种情况下,无论是对开发商A还是开发商B,都不 存在一种策略优于另一种策略,也不存在严格劣策略: 如果A选择开发,则B的最优策略是不开发;如果A选 择不开发,则B的最优策略是开发;类似地,如果B选 择开发,则A的最优策略是不开发;如果B选择不开发, 则A的最优策略是开发。
第二节 生活中的博弈论
完全信息指的是每一个参与人对所有其他参与人的特征, 如策略集合及得益函数都有准确完备的知识;否则就是 不完全信息。
☞将上述角度的划分结合起来,我们就得到四种不同类型 的博弈,这就是:完全信息静态博弈、完全信息动态博 弈、不完全信息静态博弈、不完全信息动态博弈
表5-1 博弈的分类和均衡表
行动次序 信息
三、博弈论的基本概念
(一)博弈论的定义
博弈论(gametheory),又译为对策论,就是研究决策主体的行为 发生直接相互作用时的决策以及这种决策的均衡问题。实际上, 博弈是一种日常现象。
在经济学中,博弈论是研究当某一经济主体的决策受到其他经济主 体决策的影响,同时,该经济主体的相应决策又反过来影响其他 经济主体选择时的决策问题和均衡问题。

博弈论模型解析决策者理性选择与策略

博弈论模型解析决策者理性选择与策略

博弈论模型解析决策者理性选择与策略博弈论是一种研究决策者在相互依赖环境下进行决策的数学模型。

决策者在博弈过程中会根据自己的利益和对其他决策者行为的预测来选择最优策略。

本文将介绍博弈论的基本概念,并解析决策者的理性选择和策略。

首先,我们来了解博弈论中的一些重要概念。

博弈论主要研究的是决策者的互动关系,其中包括决策者、策略和支付。

决策者是参与博弈的个体,可以是个人、组织或国家等。

策略是决策者进行决策的行动或方案。

支付是决策者从策略中获得的效益或成本。

决策者在博弈过程中会根据自己的利益和对其他决策者行为的预测来选择最优策略。

决策者在选择策略时通常会考虑以下几个因素:自己的利益、对手的选择、对手的动机以及对手有关信息的了解程度。

理性决策者会选择能够最大化自己效益的策略。

决策者的理性选择基于博弈论中的均衡概念。

博弈论中的均衡是指决策者在相互依赖环境下做出的稳定决策。

常见的均衡概念包括纳什均衡、次序均衡和完全均衡等。

纳什均衡是指在博弈中,每个决策者都已经做出了最优选择,并且其他决策者无法通过改变自己的策略来获得更大的效益。

次序均衡是指在博弈中,决策者的行动顺序是合理的,每个决策者的策略是对先前决策者行动的响应。

完全均衡是指在博弈中,每个决策者都已经做出了最优选择,并且其他决策者对这些最优选择的预期与实际情况相符。

博弈论的最经典模型是囚徒困境。

囚徒困境是指两个犯罪嫌疑人之间的博弈,他们可以选择合作或背叛。

如果两人都选择合作,则会得到较轻的刑期;如果两人都选择背叛,则会得到较重的刑期;如果其中一人选择合作而另一人选择背叛,则背叛者会得到零刑期,而合作者会得到较重的刑期。

在囚徒困境中,每个囚徒都会选择背叛,因为他们认为对方也会选择背叛,这样才能避免得到较重的刑期。

然而,如果两人能够相互合作,他们将会得到较轻的刑期。

除了囚徒困境,博弈论还可以应用于许多其他领域。

例如,企业之间的价格竞争、国家之间的军备竞赛以及拍卖等都可以通过博弈论模型进行分析。

博弈论——精选推荐

博弈论——精选推荐

博弈论博弈论第⼀章完全信息⾮合作静态博弈例⼀囚徒困境本例⼦对奠定⾮合作博弈理论基础起着重⼤作⽤。

假定有两个嫌疑犯A 和B 作案后被抓住,关在不同审讯室审讯,他们部知道,如果两⼈都坦⽩各判刑8年,若两⼈都抵赖各判1年,若⼀⼈坦⽩另⼀⼈抵赖坦⽩者释放抵赖者判⼗年,下图给出本例的完整数学描述:囚徒B坦⽩抵赖坦⽩囚徒A抵赖(囚徒A ,囚徒B )基本假定:1) 两囚徒都是理性的;2) 两囚徒都了解对⽅是理性的;3) 两囚徒都了解在各种情况下审判后果的信息;4) 两囚徒都了解对⽅了解在各种情况下审判后果的信息。

研究问题:预测最终结果。

结论:从上表看出A 与B 同样是:不管对⽅采取什么⾏动,坦⽩都是最优的,因⽽两囚徒若满⾜上述条件他们所采取的⾏动都是坦⽩。

(坦⽩,坦⽩)称为本博弈的均衡解。

从上述模型中看出,如果两⼈都选择抵赖,对两⼈都是最好的,但结果-8,-8 0,-10-10,0-1,-1他们只能选择较差的结果,都坦⽩,不论他们事先如何订⽴攻守同盟都⽆效,原因出在上述四点假设上。

囚徒困境表现为个⼈理性压倒集体理性。

例⼆智猪博弈猪圈有两头理性的智猪,⼀头⼤猪,⼀头⼩猪。

猪圈⼀头放着⾷,另⼀头有⼀按钮,供智猪⾷供应。

按⼀下按钮会有10单位猪⾷进糟,但谁按谁就要付出2单位代价。

若⼤猪先到、⼤猪吃到9单位,⼩猪吃到1单位,若同时到⼤猪吃到7单位,⼩猪吃到3单位,若⼩猪先到,⼤猪吃到6单位,⼩猪吃到4单位。

本问题可⽤下形式表⽰:⼩猪按等待按⼤猪等待(⼤猪,⼩猪)基本假设:与囚徒困境相同,即理性⼈假设和完全对称信息假设。

问题分析:很显然⼩猪的最优策略是等待,⼤猪很清楚⼩猪最优策略是等待,⽽且必然采取等待⾏动,那么⼤猪的策略是按,于是其结果必然是⼤猪按⼩猪等待。

(⼤猪按,⼩猪等待)为本博弈均衡解。

5,1 4,4 9,-1 0,0智猪问题本质:在合作共事中谁享受成果多谁多出⼒。

三、基本概念包括:参与⼈、⾏动、信息、战略、⽀付(效⽤)、结果、均衡。

决策与博弈理论分析

决策与博弈理论分析

3
公共资源分配
在公共资源分配问题中,博弈论可以帮助分析各 方利益诉求和冲突,寻求合理的资源分配方案。
04 基于博弈论决策方法论述
完全信息静态博弈下决策方法
最小最大定理
在完全信息静态博弈中,参与人可以通过选择策略使得自己的最小收益最大化, 即采用最小最大定理进行决策。
纳什均衡
纳什均衡是完全信息静态博弈中的一种稳定状态,参与人在该状态下无法通过单 方面改变策略来增加收益。因此,在决策时应考虑纳什均衡的存在。
通过本课程的学习,我掌握了决 策与博弈论的基本理论和方法, 能够运用所学知识分析和解决实 际问题。
不足之处
在学习过程中,我发现自己在理 论深度和广度方面还有待加强, 需要更加深入地学习和理解相关 知识。
未来计划
我计划在未来的学习中,继续深 入探究决策与博弈论的理论体系, 并尝试将所学知识应用于实际研 究和项目中。
决策与博弈理论分析
目录
• 决策理论基本概念 • 博弈论基础知识 • 决策与博弈关系探讨 • 基于博弈论决策方法论述 • 决策与博弈在现实生活应用举例 • 总结与展望
01 决策理论基本概念
决策定义及分类
决策定义
决策是指在不确定条件下,为实 现特定目标,从多个可行方案中 选择一个最优方案的过程。
决策分类
决策过程与影响因素
决策过程
包括问题识别、信息收集、方案制定、方案评估和选择等步骤。
影响因素
决策者的个人特征(如价值观、经验、能力等)、组织环境(如组织结构、文 化、资源等)以及外部环境(如市场状况、政策法规等)都会对决策过程产生 影响。
02 博弈论基础知识
博弈论定义及发展历程
博弈论定义
博弈论是研究决策过程中理性人之间相互作用及决策均衡的 理论。它分析在竞争或合作环境中,参与者如何根据各自掌 握的信息和对未来结果的预期,选择最优策略以最大化自身 利益。

综合I类_II类理性人的博弈策略 (doc 30)

综合I类_II类理性人的博弈策略 (doc 30)

综合I类/II类理性人的博弈策略[摘要]两人零和博弈作为较归整的形式,在博弈论的早期研究中已经得到的深入讨论。

本文引入了I类理性与II类理性的概念,认为现实博弈中的参与人往往既可能从I类理性的角度采取战略,也可能是从II类理性人的角度出发,因此,构造了一个综合了I类和II类理性特征的支付矩阵,通过对一些常见的非零和博弈实例进行讨论,认为这一模型可以解决战略选择的不确定性问题。

但本文没有对此进行严格的数学证明。

[关键词]I类理性,II类理性,混合战略,战略选择,不确定性在经济学的博弈理论中,一般假设参与人(PLAYERS)具有理性人的特征, 即总是寻求自身的最大化利益,选择能使个人利益最大化的策略。

在计算收益的时候,使用的是个人所得。

这是一个“绝对量”,而现实中,也存在着另外一种情况,也就是参与者之间除了考虑自己的所得之外,也很关心对方的所得,并比较相互间的差异,采取使“相对”所得最大化的策略。

我们不妨把以追求相对所得最大化的行为人称为II类理性人,并从博弈论的角度对他们的行为模式进行研究。

具有II类理性特征的现象在很多方面都有存在。

比如,我们在人际交往中确实会碰到一些“损人利己”的人,也会见到“损人不利己”的人,从我们观点看来,他们是非理性的,但是进行换位思考就会发现,其实他们的行事原则是相对来说,总要让自己占便宜或者自己吃得亏比对方少,至于别人是否会吃亏,不是他们考虑的因素,这也是一种“理性”行为,也有出于心理层面的考虑,认为自己所得相对较少或者自己损失较大是一种不公平,并从自己的角度出发进行策略选择。

在激烈的市场角逐中,竞争双方在短期内有时会不计代价地采取大出血的策略而欲先致对手于死地,希望对手先被淘汰而自己会坚持到最后。

如果做不到这点,也要最大程度地削弱对手力量,使其一蹶不振而不会对自己再构成威胁。

这种商场竞争,并期望自己能笑到最后的思维,也是“理性”的。

有研究表明,国际关系中这样的II类理性的例子更不少见。

博弈论(整理过名词解释和简答)

博弈论(整理过名词解释和简答)

1、名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。

2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。

3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。

4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。

在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。

7、均衡:所有参与人的最优战略组合。

8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。

9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。

10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。

11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。

12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。

13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:(1)决策结x是单结信息集;(2)在一个信息集的决策结必须是同一个决策结的后续结。

综合类类理性人的博弈策略

综合类类理性人的博弈策略

综合类理性人的博弈策略在博弈论中,理性人的博弈策略是指在一定的博弈环境下,参与者为理性人,根据自身的利益最大化来选择合适的行为策略。

综合类理性人指的是在博弈环境中具有多种不同利益考量的参与者,他们会综合考虑各种因素来做出最佳的决策。

本文将从博弈论的角度出发,探讨综合类理性人在博弈中的策略选择。

博弈论基础概念在博弈论中,博弈是指两个或多个决策者在特定情况下做出决策的过程。

博弈过程中每个决策者都会考虑其他决策者的行为对自己可能产生的影响,然后选择最有利于自己的策略。

博弈论主要研究参与者之间的互动关系和最优策略的选择。

综合类理性人的特点综合类理性人在博弈中的特点是具有多种不同的利益考量,他们不单独追求某一方面的利益最大化,而是需要综合考虑多种因素来做出决策。

这种综合性的考量往往使得他们的决策更加复杂,需要综合考虑各种因素的权衡。

策略选择的依据综合类理性人在博弈中选择策略的依据主要包括以下几个方面:1.利益最大化:在博弈中,参与者的最终目的是追求自身的利益最大化,所以在选择策略时需要考虑如何能够最大化自己的利益。

2.对手的策略:综合类理性人需要考虑其他参与者可能采取的策略,以便更好地应对对手的举动。

3.博弈环境:博弈的环境包括参与者的数量、信息的透明度、博弈的次数等,这些都会对策略选择产生影响。

4.风险偏好:不同的人在面对风险时的偏好程度不同,综合类理性人需要考虑自己的风险偏好程度来选择最合适的策略。

综合类理性人的博弈策略在博弈中,综合类理性人可以采取多种策略来最大化自己的利益。

下面将介绍几种常见的博弈策略:1.合作与背叛:合作是指参与者之间相互合作,共同达成最优解;背叛是指参与者之间不合作,各自追求自身最大利益。

综合类理性人需要在合作与背叛之间做出权衡取舍,根据博弈的环境和对手的策略来选择合适的策略。

2.微笑与冷漠:微笑是指友好和善意的态度,冷漠是指不置可否的态度。

综合类理性人可以通过微笑和冷漠来传递信息,影响对手的行为。

综合I类II类理性人的博弈策略

综合I类II类理性人的博弈策略

价格战博弈
在价格战博弈中,综合II类理性人可以通过合理的定价策略来实现自身利益和社会福利的同时最大化。例如,通过制定合理的折扣政策,既能够吸引消费者,也能够保持企业盈利能力。
资源分配博弈
在资源分配博弈中,综合II类理性人需要通过有效协商和妥协,实现资源的公平分配。例如,政府和企业之间在资源分配问题上需要充分考虑各方利益诉求,寻求合理解决方案
合作与竞争
综合II类理性人既具有合作精神,也具有竞争意识。在博弈中,他们可以采取合作策略来追求共同利益,也可以采取竞争策略来争取更多自身利益。
灵活性和适应性
综合II类理性人善于根据环境和对手的变化,灵活调整自己的策略,具备较强的适应能力。
完全信息博弈
不完全信息博弈
静态博弈和动态博弈
策略分析与比较
Ⅱ类理性人
优点在于能够兼顾自身利益和社会利益,获得较好的长期收益;缺点在于难以权衡不同利益之间的矛盾和冲突,可能牺牲自身利益。
策略优劣分析
Ⅰ类理性人
01
建议加强合作和交流,寻求与Ⅱ类理性人达成合作协议,共同实现利益最大化。
对策建议
Ⅱ类理性人
02
建议注重自身利益的同时,也要关注整体利益,寻求最优解决方案。
同时
03
建议双方加强沟通和协商,共同寻找最优解决方案,实现双赢局面。
研究局限性与展望
06
现有的博弈论模型和框架在解释和分析复杂的现实博弈问题时可能存在一定的局限性,难以充分考虑多种因素和动态变化。
理论框架的限制
对于不同类型理性人的博弈策略,目前还缺乏足够的实证研究来验证和改进理论模型,有些研究结论甚至缺乏实验支持。
缺乏实证研究
为了简化分析,很多博弈模型假设参与人是完全理性的,但这与人类的实际决策行为存在差异,因此可能影响结论的适用性和可信度。

博弈论知识点总结

博弈论知识点总结

博弈论知识总结博弈论概述:1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论研究的假设:1、 决策主体是理性的,最大化自己的收益。

2、 完全理性是共同知识3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。

行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。

信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。

完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。

不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。

支付:决策主体在博弈中的收益。

在博弈中支付是所有决策主题所选择的行动的函数。

从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别:1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。

可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。

2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。

但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。

4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。

战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

博弈论——理性与非理性精品PPT课件

博弈论——理性与非理性精品PPT课件
想不到甲还要更聪明一个层次,估计到乙要写98元来坑他,于是他准 备写97元……大家知道,下象棋的时候,不是说要多“看”几步吗, “看”得越远,胜算越大。
你多看两步,我比你更强多看三步,你多看四步,我比你更老谋深算 多看五步。在花瓶索赔的例子中,如果两个人都“彻底理性”,都能 看透十几步甚至几十步上百步,那么上面那样“精明比赛”的结果, 最后落到每个人都只写一两元的地步。事实上,在彻底理性的假设之 下,这个博弈唯一的纳什均衡,是两人都写0.
启示:成功者最主要的工作,就是在最后如何做决定。当你做出高人一等的决 策时,最好把它当做是侥幸,惟有如此,才能使你自己更谨慎,更成功。
“旅行者困境”: 从100到0
为了获取最大赔偿而言,本来甲乙双方最好的策略,就是都写100元, 这样两人都能够获赔100元。可是不,甲很聪明,他想:如果我少写 1元变成99元,而乙会写100元,这样我将得到101元。何乐而不为? 所以他准备写99元。
可是乙更聪明,他算计到甲要算计他写99元,于是他准备写98元。
3号知道这个策略,就会提(100,0,0)的分配方案,对4号、5号一毛不拔而将全 部金币归为己有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票 他的方案即可通过。
不过,2号推知到3号的方案,就会提出(98,0,l,1)的方案,即放弃3号,而给 予4号和5号各1枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利, 他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。不过, 2号的方案会被l号所洞悉,l号并将提出(97,0,1,2,0)或(97,0,1,0,2)的 方案,即放弃2号,而给3号1枚金币,同时给4号或5号2枚金币。由于l号的这一 方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投l号的赞成票,再 加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入腰包。

基于综合理性的N(N≥2)囚徒困境问题

基于综合理性的N(N≥2)囚徒困境问题
n dv e h o c p i n o O wi e .Fia l ,q a tttv n lss i e o su y t e i f n e o a d a a c s t e c n e to ft e C — n g ne n h n ly u n iai e a ay i s us d t td n ue c f h l
p yf ado e aofA a zsteN ( ao t r p yf n l e Ⅳ≥2 p sn r i m rbe ae ncm rh ni a o a t n hs . y h ) r o e dl mapo l bsdo o pe es ert n i , i S e m v i ly
文 章编 号 :6 1 7 7 (0 8 0 - 24-6 17 - 8 2 20 )30 8 - - 0
基 于综合理性 的 ⅣⅣ≥2囚徒 困境 问题 ( )
谢能 刚 。肖加标
( 安徽 工业 大学 机械 工程 学院 , 安徽 马鞍 山 23 0) 4 02
摘要: 基于人性中利 己主义和利他主义兼具的特征 , 在理想的个人理性和集体理性基础上 , 出综合理性。 提 在博弈 目标 中采用利
t e r s r ie h o y i as d,wh c s ba e n t d a n i iua r to aiy a d o lc ie a in lt.I e p o e s o i h i s d o he i e l i d vd l a in l n c le tv r to a i t y n t r c s f h
维普资讯
Vo .5 1 No3 2 .
安 徽 工 业 大 学 学 报
J o h iUnv ri f e h oo y . fAn u iest o c n lg y T

博弈的分类方法和主要类型

博弈的分类方法和主要类型

博弈的分类方法和主要类型以下是 7 条关于博弈的分类方法和主要类型的内容:1. 合作博弈和非合作博弈呀!合作博弈就好比一群小伙伴一起搭积木,大家商量着怎么搭才能最高最稳,每个人都为了共同的目标努力,例子就是公司同事们合作完成一个大项目。

而非合作博弈呢,就像两个人抢玩具,都想着自己怎么才能拿到手,比如在商业竞争中,各个企业为了自己的利益争夺市场份额。

2. 静态博弈和动态博弈哦!静态博弈就如同一场拔河比赛,双方站定了位置就开始较劲儿,谁也不能临时改变策略,下棋就是一个典型的例子。

而动态博弈呀,就好像是玩躲猫猫,一方行动了,另一方根据对方的行动再做出反应,然后情况不断变化,谈恋爱时双方的互动就有点像动态博弈呢!3. 完全信息博弈和不完全信息博弈呀。

完全信息博弈就像是玩明牌的扑克牌,你清楚地知道所有的情况,比如考试时知道所有的题目和答案。

不完全信息博弈呢,则像蒙着眼猜东西,你只能知道一部分,那可就刺激啦!像在商业谈判中,双方可能并不完全了解对方的底线。

4. 零和博弈和非零和博弈呢!零和博弈不就是那种“不是你死就是我活”的局面嘛,就像两个人分一个苹果,一个人多了另一个人就少了,赌博有时候就是这样。

而非零和博弈可有意思了,像一起做蛋糕,大家一起努力把蛋糕做大,每个人都能分到更多,合作伙伴共同开拓市场就是这样呀!5. 连续博弈和离散博弈哟!连续博弈就好像是跑马拉松,一直跑一直跑,过程很漫长,股市里的长期投资就像这样。

离散博弈呢,就像短跑比赛,一下子就结束了,比如一次抽奖活动。

6. 对称博弈和非对称博弈呀。

对称博弈好比大家起点都一样,条件都相同,就像两个人进行公平的掰手腕比赛。

但非对称博弈可就不一样啦,可能一方强一方弱,这不就像拳击比赛中重量级别不同的选手对决嘛!7. 策略博弈和随机博弈呢!策略博弈就是要精心谋划,想好每一步怎么走,下象棋就是这样的例子呀。

随机博弈呢,有时候运气成分很大,就像抽奖,全看运气咯!我觉得博弈真的很神奇,不同的分类展现出不同的特点和魅力,在生活中到处都能看到博弈的影子,难道不是吗?让我们多去观察、多去思考,感受博弈带来的乐趣和挑战吧!。

同济大学马洪宽老师博弈论复习资料

同济大学马洪宽老师博弈论复习资料

博弈是一些个体,面对一定的环境,在一定的规章制度下,同时或先后,一次或多次在其允许的策略集中选择其行为并加以实施,最终获得一定结果的过程博弈论从衡量利弊得失的角度出发,分析形势得出相应的对策,在决策的过程中考虑到参与的其他人的行为会相互影响的决策者,需要博弈论,决策中不考虑他人的行为的决策者不需要博弈论。

博弈论通常记为G或Γ,局中人的集合通常为N,为局中人n,局中人的策略集记为S,则某一策略记为αi,局中人i的策略组合为(αi,α-i),其中α-i表示局中人i以外所有人的策略组合。

局中人的收益U是α的函数,则博弈也记为G(N,S,U),若考虑信息则是G(N,S,U,I)上策均衡:每个人都有上策,博弈时必取上策,形成的均衡为上策均衡。

囚徒困境:对每一行在第二个分量中划线,即甲策略不变时乙的策略。

反之亦然两人都有上策均衡,亦为纳什均衡智猪博弈:有一开关,大猪小猪都按,则大猪得7单位,小猪得3单位;大猪按,小猪不按,大猪得6单位,小猪得4单位;小猪按,大猪不按,大猪得9单位,小猪得1单位;但是按一下会消耗2单位(此处隐含条件,两者都不按则无收益与支出)。

此时小猪有上策[不按],但是大猪无上策——小猪选择不同,大猪选择也相应不同。

此时(大猪,小猪)的纳什均衡为(按,不按)此情境可推广至投资机构与散户的投资行为。

机构研究市场动向,之后散户跟风。

娱乐博弈:甲爱象棋,乙爱围棋,甲乙一起下象棋,甲得5,乙得2;甲乙一起下围棋,甲得2,乙得5;但是两人选择不同则游戏无法开始。

两人均无上策,(甲,乙)的纳什均衡为(象,象)或(围,围)便士博弈:甲乙同时放一枚硬币,如同面则乙给甲1块钱,如异面则甲给乙1块钱此题不存在纯策略静态博弈的纳什均衡,但有混策略均衡。

混策略的原则是做出某种概率,使对方的收益无差异。

设甲取正概率为p,可写出乙的期望收益,欲使乙无差异,则p=0.5;同样,对乙的选择亦如此。

定理:任意有限博弈必定存在一纳什均衡。

个体与群体的博弈论分析

个体与群体的博弈论分析

个体与群体的博弈论分析在社会生活中,个体与群体的博弈论关系一直存在,尤其在当今社会,随着经济竞争的加剧和科技进步的不断推进,这种关系变得更加复杂。

本文从博弈论的角度出发,对个体与群体的博弈论进行分析。

一、博弈论的基本理论博弈论是研究人类博弈活动的数学理论,它关注的是每个参与者的利益与策略选择,以及这些选择对博弈结果的影响。

在博弈论中,每个参与者的决策都会受到其他参与者决策的影响,因此需要考虑对手的策略。

博弈论研究问题的一般步骤可以概括为:确定参与者、确定参与者可用的策略,制定一个规则,然后通过计算可以得到博弈的结果。

二、个体对群体的影响在现代社会中,个体对群体的影响非常巨大。

一个人的选择往往影响到整个群体的生活。

例如,一个人在城市中选择不开车,而是乘坐公共交通工具,可以降低城市的交通拥堵和空气污染;逆之,如果一群人动辄开车而不乘坐公共交通工具,那么城市可能面临交通困境和空气污染问题。

在这种情况下,由于群体中每个人的选择都会影响到整个群体,在选择时个体必须考虑到自己的影响力,以及自己的选择是否符合群体的利益。

因此,个体需要了解群体中其他人的行为,并协调自己的行为,以达到最优的结果。

三、合作与竞争在群体中,合作和竞争是个体之间最常见的相互作用。

在合作中,各个个体共同行动以实现一个共同目标。

在竞争中,个体之间有不同的目标和利益,并且为了实现这些目标和利益而相互对抗。

在博弈论中,合作和竞争被视为不同类型的游戏。

在合作游戏中,个体必须协调行动,以达到合作目标,例如团队合作和合作式学习。

在竞争游戏中,个体必须尽可能地占据优势,以实现自己的目标,例如市场竞争和选举竞争。

合作和竞争之间的差异使个体必须选择不同的策略,并考虑到其他个体的策略。

四、博弈论在个体与群体关系中的应用在个体与群体关系中,博弈论可以用于分析各种不同的问题。

例如,在团队合作中,博弈论可以用于分析如何协调团队成员的行为,以实现团队目标。

在市场竞争中,博弈论可以用于分析如何与竞争对手博弈,以实现市场份额的最大化。

博弈论信息结构分类

博弈论信息结构分类

博弈论信息结构分类博弈中的每一个参与人都是工具理性“每一个参与人都是工具理性”是每一个人的共识每一个参与人都充分了解博弈的规则理性人假设:理性人有一个明确的偏好(任意两件事物都可以进行比较,比较过程中偏好保持一致性);在约束条件下,理性人总是追求偏好最大化;理性人假设中,个体是具有完全理性的,即具有完美的认知和决策能力,不会犯错偏好具有连续性,物品所能带来的满足程度是连续的,不会跳跃的,所以可以用一个连续的效用函数进行衡量(Remark:价值理性与工具理性:价值理性指有正确的价值观,动机一定会纯正,同时也会采用正确的手段来实现自己想要的目标,无论结果如何;而工具理性指为达目的不择手段,参与者的行为从自身效用最大化的角度出发,漠视人的情感和精神价值)参与人:博弈中的决策主体,参与人记为,参与人的集合记为,若共有n个参与人,则,参与人参与决策是为了让自身效用最大化(另:虚拟参与人:“自然”、“上帝”——不以参与人的意志为转移的外生事件,虚拟参与人的选择体现为外生事件的各种可能现象,并用概率分布来描述“自然”的选择机理)为方便讨论,把参与人之外的其他参与人记为,虚拟参与人\自然记为。

单人博弈已经退化为了最优化问题进行处理,对单人博弈而言掌握的信息越多,所能获得的收益越大。

双人博弈并不总是对抗的,双人博弈也包括合作的情况,与单人博弈不同,双人及以上博弈中,参与者掌握的而信息越多并不能保证所得到去的收益越多;个人理性并不一定能导致集体条理性(囚徒困境);多人博弈(大于等于3)中可能出现破坏者——做损人不利己之事。

行动:行动是参与人在决策时可供选择的动作,一般用表示第个参与人的特定行动,表示可供参与者选择的行动集合,行动可以是连续的也可以是离散的。

个参与人的行动的有序集合称为行动组合。

行动是具有顺序的:同时行动或先后行动,行动的顺序对行动结果至关重要。

静态博弈指参与人同时选择行动的博弈动态博弈指参与人先后选择行动的博弈(Remark:"同时"指的是信息概念,如果参与者在决策过程中不知道对方的选择,那么不管是否是同一时间进行的决策都是静态决策)信息:信息是指在博弈当中,参与人有关该博弈的知识:自然的选择,其他参与人的策略集合、支付函数、行动时间等。

《博弈论》精品讲义

《博弈论》精品讲义

7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
5
1.博弈现象
➢田忌赛马:正确的策略可以反败为胜。 ➢囚徒困境:
乙 甲
理性的人是自私自利的; 理性选择不是全局最优。
博弈论20092009
正大光明 公正無私
6
➢经济合作:
乙 甲
诚信的价值; 一报还一报策略; 人类生存环境启示。
博弈论20092009
正大光明 公正無私
如两人写的一样, 就 认为他们讲真话, 并 按 所 写数额赔偿;如果两人写的不一样,就认定低 者讲真话,并照此价格赔偿。同时,对讲真话的 旅客奖励2元钱,对讲假话的旅客罚款2元。
理性原则下,他们会写多少价格呢?
博弈论20092009
正大光明 公正無私
11
2. 博弈概念
➢什么是博弈:
个人或团体间在依存和对抗、合作和冲突 中的决策问题。
正大光明 公正無私
43
∴I的最优混合策略为
(1,2)
(1, 4
3) 4
同理,II的最优混合策略为
G=8
(1,2)
(1, 2
1) 2

理性与感性的博弈与结合

理性与感性的博弈与结合

理性与感性的博弈与结合人类思维的两个主要驱动力是理性和感性,在日常生活中它们常常发生角力。

理性是一种基于逻辑和事实的思维方式,它使我们能够分析问题、做出决策和解决难题。

感性则是情感和直觉的表达,它使我们能够体验和表达内心的情感和欲望。

然而,理性与感性之间的关系并不是简单的对立,而是一种相互影响、相互补充的关系。

在本文中,我将探讨理性与感性的博弈与结合,以及它们对我们的思考和行为的影响。

在决策过程中,理性往往被认为是最重要的因素。

它使我们能够以客观的方式分析和评估现实情况,并选择最佳的解决方案。

当我们面临挑战和抉择时,理性会帮助我们保持冷静和理智,避免情绪和个人偏见的干扰。

例如,当我们在职场上遇到困难时,理性思维能够帮助我们找到最有效的解决方法,而不是被情绪或个人喜好所左右。

然而,理性也有其局限性。

在某些情况下,过度强调理性可能使我们忽视了一些重要的信息和决策因素。

感性思维则能够补充这一不足。

感性不仅是我们对世界的感受,也是我们对自己内心的洞察。

通过感性思维,我们能够更好地理解自己的情感和需要,从而更好地与他人沟通和相处。

感性还能够激发我们的创造力和想象力,帮助我们发现新的解决方案和创新。

理性和感性之间的博弈可以在艺术和美学领域中得以体现。

艺术作品往往同时具有理性和感性的元素。

理性在艺术作品中体现为形式和结构的组织,而感性则是作品所传递的情感和意义。

例如,一部音乐作品可能有精确的音符和和弦的排列(理性),但它的音乐旋律和情感表达(感性)才是触动人心的关键。

同样地,一幅绘画作品可能有准确的画笔技巧和色彩运用(理性),但它所呈现的主题和情感(感性)才是吸引观众的核心。

理性和感性的结合也在人际关系中起到重要的作用。

当我们与他人交往时,理性使我们能够思考和分析对方的言行,从而更好地理解他人,并建立起有效的沟通和合作。

但感性也是构建亲密关系和情感共鸣的基础。

通过感性,我们能够表达自己的情感和关怀,与他人建立起深入的情感联系。

综合I类II类理性人的博弈策略

综合I类II类理性人的博弈策略

VS
详细描述
在智猪博弈中,大猪和小猪的策略取决于 它们的相对大小。当小猪选择等待时,大 猪会主动行动并获得更多收益;而当大猪 选择等待时,小猪会主动行动并获得更多 收益。这种策略通常用于描述自然界中的 大小关系以及人类在社会、经济等领域的 竞争与合作行为。
05
综合i类ii类理性人的博 弈策略
混合策略
博弈论广泛应用于经 济、政治、生物、社 交等多个领域。
它旨在分析不同决策 主体在给定情境下的 策略选择及后果。
博弈论的基本要素
参与者
博弈中的决策主体,通常称为玩家或局中人 。
支付函数
每个玩家在特定策略组合下的收益或损失。
策略
玩家在博弈中可选择的行动方案。
均衡
一种策略组合,其中每个玩家都认为在当前 情境下没有更好的选择。
总结词
囚徒困境是一种博弈模型,其中两个参与者被隔离并面临相互矛盾的利益。
详细描述
在囚徒困境中,每个参与者都希望对方选择合作,但出于自身利益的考虑,又不 得不选择背叛。这种策略通常用于描述人类在社会、经济等领域的竞争与合作行 为。
智猪博弈策略
总结词
智猪博弈是一种具有非零和性质的博弈 模型,其中大猪和小猪之间的利益存在 矛盾。
生物学中的应用
生态系统
在生态系统中,博弈论被 用来研究生物种群之间的 竞争、合作研究动物 的行为生态学,特别是动 物之间的互动和适应性问 题。
进化生物学
博弈论在进化生物学中也 扮演着重要角色,用来解 释生物的进化过程和适应 性问题。
THANKS
感谢观看
定义
混合策略是一种博弈策略,其中每个参与者以某种概率选择不同的策略。它允许参与者随 机选择行动,以避免被对方预测并采取相应的对策。

第四讲博弈的基本分析方法

第四讲博弈的基本分析方法
核心概念的根本原因之一。
6、 纳什均衡的选择和分析方法扩展
一、多重纳什均衡博弈的分析 二、共谋和防共谋均衡
一、 多重纳什均衡博弈的分析
帕累托上策均衡 风险上策均衡 聚点均衡 相关均衡
帕累托上策均衡
这个博弈中有两个纯策略
纳什均衡,(战争,战争) 和(和平,和平),显然 后者帕累托优于前者,所
(q, 1-q):猜硬币方选择正反面的混合策略概率分布
4、 混合策略反应函数
两个函数合在一张图
r
r R1(q)
1
1/2
q R2(r)

硬 正面
币 方
反面
猜硬币方
正面
反面
-1, 1 1, -1
1, -1 -1, 1
猜硬币博弈
r :盖硬币方选择正反面的概率 q :猜硬币方选择正反面的概率
1/2
1
q
策略
得益
妻子 (0.75,0.25) 0.67
丈夫 (1/3,2/3) 0.75
2、多重均衡博弈和混合策略
混合策略可以优于纯策略,或不劣于纯策略。
妻 时装 C 子
足球 F
丈夫 时装C 足球F 2, 1 0, 0
0, 0 1, 3
夫妻之争
夫妻之争博弈的混合策略纳什均衡
策略
得益
妻子 (0.75,0.25) 0.67
上策均衡:一个博弈的某个策略组合中的所有策略 都是各个博弈方各自的上策,必然是该博弈比较 稳定的结果
上策均衡不是普遍存在的 上策均衡肯定是纳什均衡,但纳什均衡不一定是
上策均衡
2 、严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 某一给一个博弈方带来的收益总是比另一种 策略给他带来的收益小的策略
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

综合I类与II类理性人的博弈策略两人零和博弈作为较归整的形式,在博弈论的早期研究中已经得到的深入讨论。

本文引入了I类理性与II类理性的概念,认为现实博弈中的参与人往往既可能从I类理性的角度采取战略,也可能是从II类理性人的角度出发,因此,构造了一个综合了I类和II类理性特征的支付矩阵,通过对一些常见的非零和博弈实例进行讨论,认为这一模型可以解决战略选择的不确定性问题。

但本文没有对此进行严格的数学证明。

在经济学的博弈理论中,一般假设参与人(PLAYERS)具有理性人的特征, 即总是寻求自身的最大化利益,选择能使个人利益最大化的策略。

在计算收益的时候,使用的是个人所得。

这是一个“绝对量”,而现实中,也存在着另外一种情况,也就是参与者之间除了考虑自己的所得之外,也很关心对方的所得,并比较相互间的差异,采取使“相对”所得最大化的策略。

我们不妨把以追求相对所得最大化的行为人称为II类理性人,并从博弈论的角度对他们的行为模式进行研究。

具有II类理性特征的现象在很多方面都有存在。

比如,我们在人际交往中确实会碰到一些“损人利己”的人,也会见到“损人不利己”的人,从我们观点看来,他们是非理性的,但是进行换位思考就会发现,其实他们的行事原则是相对来说,总要让自己占便宜或者自己吃得亏比对方少,至于别人是否会吃亏,不是他们考虑的因素,这也是一种“理性”行为,也有出于心理层面的考虑,认为自己所得相对较少或者自己损失较大是一种不公平,并从自己的角度出发进行策略选择。

在激烈的市场角逐中,竞争双方在短期内有时会不计代价地采取大出血的策略而欲先致对手于死地,希望对手先被淘汰而自己会坚持到最后。

如果做不到这点,也要最大程度地削弱对手力量,使其一蹶不振而不会对自己再构成威胁。

这种商场竞争,并期望自己能笑到最后的思维,也是“理性”的。

有研究表明,国际关系中这样的II类理性的例子更不少见。

这些虽然是比较极端的例子,现实生活中,更多的可能是,每个人或组织都会考虑自己的所得,并期望自己的所得比别人的大。

关键是对两种所得在考虑时的权数是随情况不同而变化的。

如果否定在策略选择中的II类理性因素,可能会对一些现象无法解释。

尽管从道德角度讲不值得提倡,而且从价值评判上总是受到谴责, 但作为一种存在的现象,仍然有必要加以研究。

但本文从II类理性个体的博弈战略开始,并过渡到一个综合了I类和II类理性行为的博弈模型,对例中设计的参与人的战略选择,只进行经济学分析而不做道义上的衡量。

当博弈参与者是II类理性人时, 此时收益矩阵的取值有一定的规律。

假设两个参与人甲和乙都是II类理性人时,对比在I类理性的得益矩阵(图1)乙S1 S2甲S1 (m1,n1) (m2,n2)S2 (m3,n3) (m4,n4)图1.I类理性参与人收益矩阵II类理性参与人的得益矩阵如下图所示:乙S1 S2甲S1 (m1-n1,n1-m1) (m2-n2,n2-m2)S2 (m3-n3,n3-m3) (m4-n4,n4-m4)图2.II类理性参与人收益矩阵很明显,在II类理性参与人进行的博弈里,在每一个战略组合下,双方的得益之和必为零,此时的博弈具有零和的性质。

这就是早期博弈论中重点研究的二人零和博弈的情形,在1910年~1930年间, 作为绝对竞争的形式,零和博弈被认为是博弈理论中的主要形态得到了深入的研究。

而且对零和博弈的研究成果成为了现代博弈理论中很多新理论的基础概念。

作为一个练习,我们把常见博弈模型改为零和博弈情形,来看相应的结果会是怎样的。

一般认为,零和博弈是一种常和博弈,而最普遍意义下的博弈情形是非常和的。

例1.囚犯困境甲,乙涉嫌同谋犯罪,分别在两个房间被提审。

提审官预先向两人交代政策:如果他们都承认犯罪事实,各判刑10年;如果两人都否认,双方都无罪释放;如果一方认罪一方抵赖,认罪方获500元奖励,抵赖方被判15年。

在非零和博弈情形下的支付矩阵如下:乙承认抵赖甲承认(-10,-10) (5,-15)抵赖(-15,5) (0,0)图3纳什均衡策略是(承认,承认),如果甲乙两人是II类理性人,他们的相应支付矩阵就变成了:乙承认抵赖甲承认(0,0) (20,-20)抵赖(-20,20) (0,0)图4可以看出,纳什均衡策略还是(承认,承认)。

例2.春节前夕,某小镇上两个商铺甲和乙同时看到一个赚钱机会:去城里贩一批鞭炮回来卖,购货款加上运输费共5000元,如果没有竞争对手,这批货在小镇上能卖6000元;但如果另一家商铺也同时在小镇上卖鞭炮,价格下跌使得这批鞭炮只能卖4000元。

对于甲乙都是I类理性人而言,有支付矩阵:乙进货不进货甲进货(-1000,-1000) (1000,0)不进货(0,1000) (0,0)图5(不进货,进货)和(进货,不进货)为纳什均衡策略。

但是问题在于,甲乙双方同时行动,而互相不知道对方采取的行动。

如果甲乙都是II类理性人,那么情况会变成:乙进货不进货甲进货(0,0) (1000,-1000)不进货(-1000,1000) (0,0)图6此时的纳什均衡策略就是(进货,进货)。

例3.利己与利他甲乙作为I类理性人,其支付矩阵为乙利己利他甲利己(1,1) (4,0)利他(0,4) (3,3)图7纳什均衡是(利己,利己);甲乙作为II类理性人,其支付矩阵转化为:乙利己利他甲利己(0,0) (4,-4)利他(-4,4) (0,0)图8纳什均衡仍然是(利己,利己)。

例4.智猪博弈一头大猪和一头小猪被关在同一个猪圈里。

猪圈的一头安装着一个特制的按键,另一头安装着一个食槽。

但一头猪按下按键时,会有10单位的食物进入槽中,但按键的猪会付出2单位的成本;如果大猪先到食槽,则小猪只能吃到1单位的残羹剩饭;但若小猪先到的话,则它能吃到4单位的食物。

若两猪同时到,则小猪可吃到3单位的食物。

如果按照I类理性,有支付矩阵:小猪按键等待大猪按键(5,1) (4,4)等待(9,-1) (0,0)图9纳什均衡策略是(按键,等待)。

在II类理性下,重写支付矩阵为:小猪按键等待大猪按键(4,-4) (0,0)等待(10,-10) (0,0)图10纳什均衡是(按键,等待)和(等待,等待)。

有趣的是,此时小猪一定会选择等待(占优战略),而大猪无论怎么做,都是一无所获!最终结果是两头猪都会饿死。

在这种情况下,两头猪的结局似乎和“布里丹的饥饿的驴”有共同点,后者因为面对同样两堆干草不能做出选择而饿死。

在智猪博弈里,小猪认为自己的结果只能是损失或者既无损失又无所得,这时它会选择后者,而将责任推给大猪。

现实中,不大可能出现两猪都饿死的结果,因为大猪最终会明白,与其被饿死还不如去按键,此时自己会得到4单位的食物;而小猪也会因为大猪作出这样的选择,而同样得到4单位的食物。

例5.性别战两个恋人,男方想看拳击,女方想看芭蕾。

如果需要的话,他们会牺牲自己的爱好而迁就对方。

有下面的支付矩阵:女拳击芭蕾男拳击(2,1) (0,0)芭蕾(0,0) (1,2)图11纳什均衡是(拳击,拳击)和(芭蕾,芭蕾)。

将支付矩阵做个变换:女拳击芭蕾男拳击(1,-1) (0,0)芭蕾(0,0) (-1,1)图12那么,(拳击,芭蕾)就是纳什均衡策略。

例6.斗鸡博弈两个人举着火棍从独木桥两端向中间前进,每个人都有两种战略:前进或退下阵来。

若两人都继续前进,则两败俱伤;如果一方前进,另一方退下来,前进者取得胜利,退后者丢了面子;若两人都退了下来,则都丢了面子。

支付矩阵如下:A进退B 进(-3,-3) (2,0)退(0,2) (0,0)图13纳什均衡策略是(进,退)和(退,进);按II类理性对支付矩阵进行变换后得:A进退B 进(0,0) (2,-2)退(-2,2) (0,0)图14纳什均衡策略是(进,进)。

在上面的讨论中,可以看到,在例2中,对于I类理性参与人,(不进货,进货)和(进货,不进货)都是纳什均衡策略,采取哪个战略要取决于对方的行动,在一次静态博弈中是很难在行动之初就了解到对方的战略的,因此存在选择上的不确定性。

在智猪博弈中,对于II类理性参与人而言,不能根据支付矩阵决定出大猪的战略,如何才能避免在选择时出现这样的不确定状态呢?有必要考虑某种混合战略。

一般来讲,博弈的每个参与者在某些时间会按I类理性人行为模式行事,而有时又会采用II类理性人模式行事。

不妨将这种组合看成是决定于概率p和q。

这时候,假设甲遵循I 类理性的概率是p,那么他是II类理性人的概率就是1-p,乙遵循I类理性的概率是q,相应他是II类理性人的概率是1-q。

这时我们也可以构造出一种混合战略,得到支付矩阵:乙S1 S2甲S1 m1-(1-p)n1,n1-(1-q)m1 m2-(1-p)n2,n2-(1-q)m2 S2 m3-(1-p)n3,n3-(1-q)m3 m4-(1-p)n4,n4-(1-q)m4图15对于I类理性可以看作p=1,q=1时的上述混合战略的一个特例;而II类理性对应p=0,q=0的情况。

在现实中,还可能出现另一种情况,也就是甲乙两个参与者中,一方是I类理性的,而另一方是II类理性的,为方便起见,我们假设甲是I类理性人,乙为II类理性人,那么支付矩阵具有下面一般形式:乙S1 S2甲S1 (m1,n1-m1) (m2,n2-m2)S2 (m3,n3-m3) (m4,n4-m4)图16这其实是在p=1,q=0时,混合战略的一个特殊情况。

对于上述常见博弈案例,在这种情况下进行演绎,相应也会得到一些有趣的结果。

例1.囚犯困境乙承认抵赖甲承认(-10,0) (5,-20)抵赖(-15,20) (0,0)图17纳什均衡策略仍是(承认,承认);例2.进货与不进货乙进货不进货甲进货(-1000,0) (1000,-1000) 不进货(0,1000) (0,0)图18纳什均衡策略是(不进货,进货)。

例3.利己与利他乙利己利他甲利己(1,0) (4,-4)利他(0,4) (3,0)图19纳什均衡策略仍是(利己,利己)。

例4.智猪博弈小猪按键等待大猪按键(5,-4) (4,0)等待(9,-10) (0,0)图20纳什均衡策略是(按键,等待)。

例5.性别战女拳击芭蕾男拳击(2,-1) (0,0)芭蕾(0,0) (1,1)图21纳什均衡策略是(芭蕾,芭蕾)。

例6.斗鸡博弈A进退B 进(-3,0) (2,-2)退(0,2) (0,0)图22纳什均衡策略是(退,进)可以发现,在多数情况下,II类理性人的结果都好于I类理性人。

现在使用如图15的混合战略,看看在例2,性别战,斗鸡博弈和智猪博弈中,战略的选择情况:在例2中,为方便起见,将原支付矩阵先转换成:乙进货不进货甲进货(-1,-1) (1,0)不进货(0,1) (0,0)图23再设甲乙为I类理性的概率为p,q:乙进货不进货甲进货(-p,-q) (1,q-1)不进货(p-1,1) (0,0)图24可以看到(进货,不进货)是一个可能的均衡策略,但若要使其成为唯一的纳什均衡,还应该要求q-1>-q,即q>1/2。

相关文档
最新文档