综合I类与II类理性人的博弈策略doc17(3)
微观经济学 第17讲-重复博弈
两阶段重复博弈
• 不过也说明子博弈完美对于可信性的要求 并不严格。 • 人们可以在第二阶段经过重新谈判都选择 帕累托占优的(R1 , R2),此时(M1 , M2)就不 是最优的 • 为了解决重新谈判这个问题,可以考虑下 面的博弈
两阶段重复博弈
L1 M1 R1 P1 Q1
L2 1,1 0,5 0,0 0,0 0,0 M2 5,0 4,4 0,0 0,0 0,0 R2 P2 Q2 0,0 0,0 0,0 0,0 0,0 0,0 3,3 0,0 0,0 0,0 4,1/2 0,0 0,0 0,0 ½,4
两阶段重复博弈
L1
L2 2,2 M2 6,1 7,7 1,1 R2 1,1 1,1 4,4
M1 1,6 R1 1,1
两阶段重复博弈
• 这里有三个均衡(L1 , L2), (M1 , M2), (R1 , R 2) • 如果G={A1 ,…,An ;u1,…,un }是一个有多个 纳什均衡的完全信息静态博弈,那么重复 博弈G(T)可以存在子博弈精炼解,其中对 每一t<T,t阶段的结果都不是G的纳什均衡 • 这个结论说明,对将来行动所做的可信威 胁可以影响到当前行动。
两阶段重复博弈
• 纯策略均衡(L1 , L2),(R1 , R2),(P1 , P2)和 (Q1 , Q2) • 后面三个纳什均衡处于一个帕累托边界上 • 如果博弈进行两个阶段 • 策略:如果第一阶段(M1 , M2),那么(R1 , R2);如果(M1 ,Z),那么(P1 , P2);如果(x , M2), 那么(Q1 , Q2);如果(y , h),那么(R1 , R2)
两阶段重复博弈
• 此博弈第二阶段均衡为(L1 , L2) • 假如第一阶段,那么博弈变为 参与人2 L2 R2 L1 2,2 6,1 参与人1 R1 1,6 5,5
博弈论——理性与非理性精品PPT课件
“旅行者困境”: 从100到0
巴罗教授提出这个案例旨在警世:一方面,它有启示人们在为私利考虑 的时候不要太“精明”,告诫人们精明不等于高明,太精明往往会坏事; 另一方面,它于理性行为假设的适用性提出了警告。
“旅行者困境”: 从100到0
理性行为假设是讨论消费者和企业这些经济主体人的行为的基本假设。 所以经济学在理性行为假设之下得到的结论是否符合实际,还要进行另 外的分析。在这个意义上,“旅行者困境”是所有博弈论学者甚至所有 经济学者必然面对的困境。
换言之,人不但知道自己的利益何在,而且知道该如何去 追求。他可以“损人利己”,也可能“利人利己”,但并 不会去“损己利人”、“损人损己”和“损人不利己”。
人是否聪明到了知道自己利益所在, 并知道追求利益的正确途径?
理性的困境
分钱博弈
两人分一笔总数固定的钱,比如100元。方法是:一人提出方案,另外一人 表决,如果表决的人同意,那么就按提出的方案来分,如果不同意的话, 两人将一无所得。
假如由一次博弈变成重复博弈呢,比如,大家讲清楚下次再得100枚金币时, 先由2号强盗来分,然后是3号……“轮流坐庄”,这倒颇有点像西方国家的 两党政治,当然,你也可以说,其实是民主制度下的分赃制。
可能还会有比这闹得更凶的。比如,四人会想:l号居然要独得97枚金币,这 简直是赤裸裸的剥削嘛!于是,他们立即起来“造反”,组成一个反l号的大 联盟并制定出新规则:四人平分金币,独将l号扔进大海……
3号知道这个策略,就会提(100,0,0)的分配方案,对4号、5号一毛不拔而将全 部金币归为己有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票 他的方案即可通过。
不过,2号推知到3号的方案,就会提出(98,0,l,1)的方案,即放弃3号,而给 予4号和5号各1枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利, 他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。不过, 2号的方案会被l号所洞悉,l号并将提出(97,0,1,2,0)或(97,0,1,0,2)的 方案,即放弃2号,而给3号1枚金币,同时给4号或5号2枚金币。由于l号的这一 方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投l号的赞成票,再 加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入腰包。
博弈论模型解析决策者理性选择与策略
博弈论模型解析决策者理性选择与策略博弈论是一种研究决策者在相互依赖环境下进行决策的数学模型。
决策者在博弈过程中会根据自己的利益和对其他决策者行为的预测来选择最优策略。
本文将介绍博弈论的基本概念,并解析决策者的理性选择和策略。
首先,我们来了解博弈论中的一些重要概念。
博弈论主要研究的是决策者的互动关系,其中包括决策者、策略和支付。
决策者是参与博弈的个体,可以是个人、组织或国家等。
策略是决策者进行决策的行动或方案。
支付是决策者从策略中获得的效益或成本。
决策者在博弈过程中会根据自己的利益和对其他决策者行为的预测来选择最优策略。
决策者在选择策略时通常会考虑以下几个因素:自己的利益、对手的选择、对手的动机以及对手有关信息的了解程度。
理性决策者会选择能够最大化自己效益的策略。
决策者的理性选择基于博弈论中的均衡概念。
博弈论中的均衡是指决策者在相互依赖环境下做出的稳定决策。
常见的均衡概念包括纳什均衡、次序均衡和完全均衡等。
纳什均衡是指在博弈中,每个决策者都已经做出了最优选择,并且其他决策者无法通过改变自己的策略来获得更大的效益。
次序均衡是指在博弈中,决策者的行动顺序是合理的,每个决策者的策略是对先前决策者行动的响应。
完全均衡是指在博弈中,每个决策者都已经做出了最优选择,并且其他决策者对这些最优选择的预期与实际情况相符。
博弈论的最经典模型是囚徒困境。
囚徒困境是指两个犯罪嫌疑人之间的博弈,他们可以选择合作或背叛。
如果两人都选择合作,则会得到较轻的刑期;如果两人都选择背叛,则会得到较重的刑期;如果其中一人选择合作而另一人选择背叛,则背叛者会得到零刑期,而合作者会得到较重的刑期。
在囚徒困境中,每个囚徒都会选择背叛,因为他们认为对方也会选择背叛,这样才能避免得到较重的刑期。
然而,如果两人能够相互合作,他们将会得到较轻的刑期。
除了囚徒困境,博弈论还可以应用于许多其他领域。
例如,企业之间的价格竞争、国家之间的军备竞赛以及拍卖等都可以通过博弈论模型进行分析。
第1章 策略式博弈
高等经济学讲义蒲勇健重庆大学教材:2013年陪同2012年诺贝尔奖得主A.Roth访问中国第一章博弈模型的策略式表述第一节 策略式表述的博弈策略式的博弈也称为静态博弈。
抽象的表达就是:定义1.1:一个策略式博弈,(),()i iG N A u =由下列要素构成: ·博弈参与人集合:{1,...,}N n =;·每个参与人i 有一个包含其所有可选择行动的行动集A i ,i ∈N ;·每个参与人i 有一个支付函数:i u A R →,其中j N j A A ∈=⨯。
参与人(players ):每个博弈都有参与者人。
记i 为博弈的一个参与人(1,2,,i n =),则N ={1,...,n }为所有参与人构成的集合。
象棋比赛有两人参与,因此{1,2}N =;麻将有四个人参与,因此{1,2,3,4}N =。
参与人可以是作为自然人的个人,也可以是企业、组织甚至国家等等。
博弈论假定参与人是追求效用最大化的理性人,即他们会根据自己的信念,选择他们觉得最好的行动。
行动空间(action space ):每个参与人i N ∈都有行动集A i 。
该行动集包含可供其选择的所有行动,因此被称为行动空间。
记i A 中的一个元素为i i A a ∈;又记1(,...,,...,)i n a a a a =为一个行动组合。
行动组合告诉我们每个参与人的行动。
又记j j NA A ∈=⨯为行动组合空间。
有时我们也称行动为“策略”(在引入“扩展式博弈之前”是如此的),行动空间为“策略空间”,行动组合为“策略组合”,行动组合空间为“策略组合空间”。
支付函数(payoff function ):指参与人从博弈中获得的效用水平(或利润水平等其他的目标)。
根据前面给出的说明,无论什么样的支付函数,一般都是以效用函数作为基础的。
如果所有参与人的行动构成行动组合a ,则i 的支付为(),i i u u a i N =∈。
第二单元理性的博弈
是记录孔子及其 弟子言行的书。 共20篇。 是儒家最重要的 经典。
21
上页
返回
下页
《论语》:
• 中国两千年来最重 要的课本。 • 其中语句大量化为 成语(全文11750字,
出成语300多条)。
22
上页
返回
下页
《论语》作者是谁?
• 孔子的弟子及再传弟子。 • 注意:作者不是孔子。
第二单元 理性的博弈——典籍
典籍,是文化的载体,承载着一个国家或 民族最悠久、最优秀的思想。 阅读典籍,就是在汲取民族文化,从古老 文献中获得新生的智慧……
文化聚焦
公元前800年到公元前200年,人类精神文明史的第二 次重大突破 ,被称之为“轴心时代” 中国先秦诸子,百家争鸣,成就中华文化最初的华彩乐 章:《易经》、孔子、墨子、老子、庄子、《孙子兵法》 印度的释迦摩尼创立了佛教,在亚洲广泛流传 犹太教与基督教先后完成《圣经》的新约和旧约部分, 成为现代欧美文化的基石 古希腊出现苏格拉底、柏拉图和亚里士多德三位伟大的 哲学家 他们提出的思想原则塑造了不同的文化传统,一直在影 响人类的生活,直到今天还在发挥着巨大的作用
【原文】子曰:“君子和而不同,小人同 而不和。”《子路》 【翻译】孔子说:“君子讲求和谐而不同 流合污,小人只求完全一致,而不讲求协 调。”
探究与思考
请找出《论语》中其他有关“仁”的两个 句子,并结合自己的理解分析。
翻译 颜渊请教什么是“仁”(仁,人生正途) ,孔子说:“能够自己做主去实践的规范 就是人生的正途,你只要有一段时间能够 自己做主去实践礼的规范,天下人都会肯 定你走在人生的正路上,走在人生的正路 上是要靠自己的,难道要靠别人吗?”颜 渊说:“希望指点一些具体做法。”孔子 说:“不合乎礼的不去看,不合乎礼的不 去听,不合乎礼的不去说,不合乎礼的不 去做。”颜渊说:“我虽然不够聪明,也 要努力做到这些。”
综合类类理性人的博弈策略
综合类理性人的博弈策略在博弈论中,理性人的博弈策略是指在一定的博弈环境下,参与者为理性人,根据自身的利益最大化来选择合适的行为策略。
综合类理性人指的是在博弈环境中具有多种不同利益考量的参与者,他们会综合考虑各种因素来做出最佳的决策。
本文将从博弈论的角度出发,探讨综合类理性人在博弈中的策略选择。
博弈论基础概念在博弈论中,博弈是指两个或多个决策者在特定情况下做出决策的过程。
博弈过程中每个决策者都会考虑其他决策者的行为对自己可能产生的影响,然后选择最有利于自己的策略。
博弈论主要研究参与者之间的互动关系和最优策略的选择。
综合类理性人的特点综合类理性人在博弈中的特点是具有多种不同的利益考量,他们不单独追求某一方面的利益最大化,而是需要综合考虑多种因素来做出决策。
这种综合性的考量往往使得他们的决策更加复杂,需要综合考虑各种因素的权衡。
策略选择的依据综合类理性人在博弈中选择策略的依据主要包括以下几个方面:1.利益最大化:在博弈中,参与者的最终目的是追求自身的利益最大化,所以在选择策略时需要考虑如何能够最大化自己的利益。
2.对手的策略:综合类理性人需要考虑其他参与者可能采取的策略,以便更好地应对对手的举动。
3.博弈环境:博弈的环境包括参与者的数量、信息的透明度、博弈的次数等,这些都会对策略选择产生影响。
4.风险偏好:不同的人在面对风险时的偏好程度不同,综合类理性人需要考虑自己的风险偏好程度来选择最合适的策略。
综合类理性人的博弈策略在博弈中,综合类理性人可以采取多种策略来最大化自己的利益。
下面将介绍几种常见的博弈策略:1.合作与背叛:合作是指参与者之间相互合作,共同达成最优解;背叛是指参与者之间不合作,各自追求自身最大利益。
综合类理性人需要在合作与背叛之间做出权衡取舍,根据博弈的环境和对手的策略来选择合适的策略。
2.微笑与冷漠:微笑是指友好和善意的态度,冷漠是指不置可否的态度。
综合类理性人可以通过微笑和冷漠来传递信息,影响对手的行为。
综合I类II类理性人的博弈策略
VS
详细描述
在智猪博弈中,大猪和小猪的策略取决于 它们的相对大小。当小猪选择等待时,大 猪会主动行动并获得更多收益;而当大猪 选择等待时,小猪会主动行动并获得更多 收益。这种策略通常用于描述自然界中的 大小关系以及人类在社会、经济等领域的 竞争与合作行为。
05
综合i类ii类理性人的博 弈策略
混合策略
博弈论广泛应用于经 济、政治、生物、社 交等多个领域。
它旨在分析不同决策 主体在给定情境下的 策略选择及后果。
博弈论的基本要素
参与者
博弈中的决策主体,通常称为玩家或局中人 。
支付函数
每个玩家在特定策略组合下的收益或损失。
策略
玩家在博弈中可选择的行动方案。
均衡
一种策略组合,其中每个玩家都认为在当前 情境下没有更好的选择。
总结词
囚徒困境是一种博弈模型,其中两个参与者被隔离并面临相互矛盾的利益。
详细描述
在囚徒困境中,每个参与者都希望对方选择合作,但出于自身利益的考虑,又不 得不选择背叛。这种策略通常用于描述人类在社会、经济等领域的竞争与合作行 为。
智猪博弈策略
总结词
智猪博弈是一种具有非零和性质的博弈 模型,其中大猪和小猪之间的利益存在 矛盾。
生物学中的应用
生态系统
在生态系统中,博弈论被 用来研究生物种群之间的 竞争、合作研究动物 的行为生态学,特别是动 物之间的互动和适应性问 题。
进化生物学
博弈论在进化生物学中也 扮演着重要角色,用来解 释生物的进化过程和适应 性问题。
THANKS
感谢观看
定义
混合策略是一种博弈策略,其中每个参与者以某种概率选择不同的策略。它允许参与者随 机选择行动,以避免被对方预测并采取相应的对策。
CH02混合策略(博弈论,张醒洲)
– 白色 %
2021/5/27
张醒洲,大连
16
猜猜哪个硬币被标记了
• 这里有三枚硬币,每一 面被贴上红色或白色 纸片(如下图).为了方 便从左向右编号1、2、 3号硬币
1
2
3
• 现在从中任取一枚放在桌 面,结果你看到白色。请 猜一下,这是几号硬币?
1/3 1/3
N
1/3
1/2
C1
1/2
1/2
C2
1/2
•
15、一年之计,莫如树谷;十年之计 ,莫如 树木; 终身之 计,莫 如树人 。2021年5月上 午8时49分21.5.2708:49May 27, 2021
•
16、提出一个问题往往比解决一个更 重要。 因为解 决问题 也许仅 是一个 数学上 或实验 上的技 能而已 ,而提 出新的 问题, 却需要 有创造 性的想 像力, 而且标 志着科 学的真 正进步 。2021年5月27日星期 四8时49分5秒 08:49:0527 May 2021
13、He who seize the right moment, is the right man.谁把握机遇,谁就心想事成 。21.5.2721.5.2708:49:0508:49:05M ay 27, 2021
•
14、谁要是自己还没有发展培养和教 育好, 他就不 能发展 培养和 教育别 人。2021年5月 27日星 期四上 午8时49分5秒 08:49:0521.5.27
• 模型
– 两个参与人 {1,2} – 每个参与人的策略
空间为{H,T} – 收益
• 零和
• 试着找到纳什均衡
正面 参与人 1
背面
参与人2
正面
背面
-1, 1 1, -1
博弈的分类方法和主要类型
博弈的分类方法和主要类型以下是 7 条关于博弈的分类方法和主要类型的内容:1. 合作博弈和非合作博弈呀!合作博弈就好比一群小伙伴一起搭积木,大家商量着怎么搭才能最高最稳,每个人都为了共同的目标努力,例子就是公司同事们合作完成一个大项目。
而非合作博弈呢,就像两个人抢玩具,都想着自己怎么才能拿到手,比如在商业竞争中,各个企业为了自己的利益争夺市场份额。
2. 静态博弈和动态博弈哦!静态博弈就如同一场拔河比赛,双方站定了位置就开始较劲儿,谁也不能临时改变策略,下棋就是一个典型的例子。
而动态博弈呀,就好像是玩躲猫猫,一方行动了,另一方根据对方的行动再做出反应,然后情况不断变化,谈恋爱时双方的互动就有点像动态博弈呢!3. 完全信息博弈和不完全信息博弈呀。
完全信息博弈就像是玩明牌的扑克牌,你清楚地知道所有的情况,比如考试时知道所有的题目和答案。
不完全信息博弈呢,则像蒙着眼猜东西,你只能知道一部分,那可就刺激啦!像在商业谈判中,双方可能并不完全了解对方的底线。
4. 零和博弈和非零和博弈呢!零和博弈不就是那种“不是你死就是我活”的局面嘛,就像两个人分一个苹果,一个人多了另一个人就少了,赌博有时候就是这样。
而非零和博弈可有意思了,像一起做蛋糕,大家一起努力把蛋糕做大,每个人都能分到更多,合作伙伴共同开拓市场就是这样呀!5. 连续博弈和离散博弈哟!连续博弈就好像是跑马拉松,一直跑一直跑,过程很漫长,股市里的长期投资就像这样。
离散博弈呢,就像短跑比赛,一下子就结束了,比如一次抽奖活动。
6. 对称博弈和非对称博弈呀。
对称博弈好比大家起点都一样,条件都相同,就像两个人进行公平的掰手腕比赛。
但非对称博弈可就不一样啦,可能一方强一方弱,这不就像拳击比赛中重量级别不同的选手对决嘛!7. 策略博弈和随机博弈呢!策略博弈就是要精心谋划,想好每一步怎么走,下象棋就是这样的例子呀。
随机博弈呢,有时候运气成分很大,就像抽奖,全看运气咯!我觉得博弈真的很神奇,不同的分类展现出不同的特点和魅力,在生活中到处都能看到博弈的影子,难道不是吗?让我们多去观察、多去思考,感受博弈带来的乐趣和挑战吧!。
8个生活中常见、常用的博弈策略
8个生活中常见、常用的博弈策略1、最大最小收益策略。
即从最坏的可能性做准备,不放弃好的可能性。
从悲观的角度出发,从最小收益里取大。
仔细想想,生活、国际上的很多事情,都是这个策略所导致的现象。
2、最小最大收益策略使对方的最大收益最小化,这个策略也是广泛使用的。
尤其在国际上,1)比如印巴分治,破坏掉——自己撤退后、对方能取得的最大收益。
2)比如日本失落的30年,就是这个策略的现象。
3)比如中等收入陷阱,也是这个策略的现象。
4)南非的衰弱,也是这个策略的现象。
3、“人不犯我,我不犯人”的“以牙还牙”策略这是重复囚徒困境的最佳策略。
4、监督博弈(做老板必看)这是监督博弈的现象、用来减少监督成本,获取全局、个体最优。
比如1)三大件策略。
2)差一点点就够得着策略。
使用这个监督博弈模型,可以量化制定工资、收入策略。
也就是工资=用这个公式,就可以制定收入政策、管理政策,获得均衡,并取得全局收益最大。
所以,CEO的工资高,就好理解了吧,CEO有可能产生负贡献,但仍然要保证他的高工资,因为对他的监督难度超级大。
5、非升即走的策略这个策略也很有意思,在大学里经常使用。
在有些类型的企业里,也经常能遇到。
6、双寡头策略在生活里经常看到各个领域的双寡头,一家独大是危险的,此时应该培育对手,形成双寡头竞争的市场格局,才是最有利的。
7、重复博弈在重复博弈中,每次博弈的条件、规则和内容都是相同的, 但由于有一个长期利益的存在, 因此各博弈方在当前阶段的博弈中,适当通过让步达成合作。
这样就可以开发一个技巧,给对方营造出后续还有合作的判断,就能在这次合作中,让对方让步,使自己在本次合作中收益增大。
8、夏普里值假定,有一个三人财产分配问题:假定财产为1000万元,这1000万在三人之间进行分配。
A拥有45%的决定权,B拥有35%的决定权,C拥有20%的决定权。
规定,当超过50%的同意时,才能获得整个财产,否则三人将一无所获。
像这样的场景是很多,以这个夏普里值的计算方法,就可以知道各方的折衷点,并以此预测妥协达成的可能和所需要付出的代价、或者能争取的额外收益。
个体与群体的博弈论分析
个体与群体的博弈论分析在社会生活中,个体与群体的博弈论关系一直存在,尤其在当今社会,随着经济竞争的加剧和科技进步的不断推进,这种关系变得更加复杂。
本文从博弈论的角度出发,对个体与群体的博弈论进行分析。
一、博弈论的基本理论博弈论是研究人类博弈活动的数学理论,它关注的是每个参与者的利益与策略选择,以及这些选择对博弈结果的影响。
在博弈论中,每个参与者的决策都会受到其他参与者决策的影响,因此需要考虑对手的策略。
博弈论研究问题的一般步骤可以概括为:确定参与者、确定参与者可用的策略,制定一个规则,然后通过计算可以得到博弈的结果。
二、个体对群体的影响在现代社会中,个体对群体的影响非常巨大。
一个人的选择往往影响到整个群体的生活。
例如,一个人在城市中选择不开车,而是乘坐公共交通工具,可以降低城市的交通拥堵和空气污染;逆之,如果一群人动辄开车而不乘坐公共交通工具,那么城市可能面临交通困境和空气污染问题。
在这种情况下,由于群体中每个人的选择都会影响到整个群体,在选择时个体必须考虑到自己的影响力,以及自己的选择是否符合群体的利益。
因此,个体需要了解群体中其他人的行为,并协调自己的行为,以达到最优的结果。
三、合作与竞争在群体中,合作和竞争是个体之间最常见的相互作用。
在合作中,各个个体共同行动以实现一个共同目标。
在竞争中,个体之间有不同的目标和利益,并且为了实现这些目标和利益而相互对抗。
在博弈论中,合作和竞争被视为不同类型的游戏。
在合作游戏中,个体必须协调行动,以达到合作目标,例如团队合作和合作式学习。
在竞争游戏中,个体必须尽可能地占据优势,以实现自己的目标,例如市场竞争和选举竞争。
合作和竞争之间的差异使个体必须选择不同的策略,并考虑到其他个体的策略。
四、博弈论在个体与群体关系中的应用在个体与群体关系中,博弈论可以用于分析各种不同的问题。
例如,在团队合作中,博弈论可以用于分析如何协调团队成员的行为,以实现团队目标。
在市场竞争中,博弈论可以用于分析如何与竞争对手博弈,以实现市场份额的最大化。
博弈论经典例子(17)利己与利他的悖论
人不是天使,人们往往首先关心自己的利益,依据经济学说法是每个人都是一个“经济人”——自私,追求个人利益最大化的人。
在本文中讨论的博弈问题中有一个限定,那就是我们所讨论的博弈论问题都是建立在个体行为理性基础上,所谓个体行为理性是指个体的行为始终都是以实现自身的最大利益为唯一目标,除非为了实现自身最大利益的需要,否则不会考虑其他个体或社会的利益这样一种决策原则。
自从囚徒困境的推论被提出以来,围绕它的涵义涌现了大量的文献,其中似是而非的解释与完全错误的理解不可胜数。
误解之一就是,认为囚徒困境是自私自利的结果,如果个人进行决策时多考虑别人的利益,就不会去选择损人利己的策略,如此则能避免囚徒困境,经常有人发出这样的感慨:如果人人都不自私,世界该是多么美好。
与自私相反,那么道德能给我们这个世界带来的就是一切都美好的吗?在《镜花缘》这本书中描述这样的一个君子国的故事。
君子国里的人,个个都是以自己吃亏让人得利为荣的事。
小说描写了一笔交易。
这笔交易中的买方认为货色鲜美卖方索价太低,而卖方则坚持认为自己的货色不行,较为平常。
最后成交时买者挑了次等货物,引起公众议论,说买者欺人不公,买方只好将上等下等货物各携带一半而去。
还有一笔交易,是双方在银子的成色和分量上发生了争执。
付钱的一方硬说自己的银子成色欠佳,分量不足,而收银的一方则嫌成色超标,分量过高,无奈收银人已走远,收银人只好将他觉得收多了的银子称出,送给了过路的乞丐。
由此可见,无论是双方让利还是双方争利都会引起争论。
我们在现实生活中所遇到的争论,都是由各方偏袒自己的利益引起的。
因此,我们常常错误的认为,如果关系别人的利益胜过关心自己的利益,争论就不会发生,而君子国里发生的事情,说明了以别人的利益作为自己行动的原则同样会引起争论,结果我们仍然得不到一个和谐与协调的社会。
而国外著名的经济学著作《蜜蜂的故事》中却描写的是与君子国截然相反的一种情景,在这本书中作者曼德维尔提出了他的悖论,私人恶德就是公众利益。
博弈问题中最常见的博弈类型
博弈问题中最常见的博弈类型
博弈问题中最常见的博弈类型包括:
1. 囚徒困境博弈:这种博弈中,参与者需要在不信任对方的情况下选择自己的最优策略。
由于每个参与者都追求自己的利益最大化,最终的结果往往并不是最优的。
2. 零和博弈:这种博弈中,一方的收益就是另一方的损失,总和为零。
比如,石头、剪刀、布游戏就属于零和博弈。
3. 合作博弈:这种博弈中,参与者需要通过合作来达到共赢的结果。
合作博弈强调的是团体利益的最大化,而不是个人利益的最大化。
4. 竞争博弈:这种博弈中,参与者之间存在竞争关系,每个参与者都在追求自己的利益最大化。
竞争博弈中最常见的例子是价格竞争,比如两家公司通过降价来争夺市场份额。
5. 微分博弈:这种博弈中,参与者需要根据对方的策略来选择自己的最优策略,而且这个最优策略是随着对方的策略变化而变化的。
微分博弈在经济学和金融学中有着广泛的应用。
6. 博彩博弈:这种博弈中,参与者通过购买彩票或者参与其他博彩活动来获得赢取奖金的机会。
博彩博弈的魅力在于其不确定性和风险性。
这些是博弈问题中最常见的博弈类型,不同的博弈类型有着不同的规则和策略,需要参与者根据具体情况选择最优的策略。
理性与感性的博弈与结合
理性与感性的博弈与结合人类思维的两个主要驱动力是理性和感性,在日常生活中它们常常发生角力。
理性是一种基于逻辑和事实的思维方式,它使我们能够分析问题、做出决策和解决难题。
感性则是情感和直觉的表达,它使我们能够体验和表达内心的情感和欲望。
然而,理性与感性之间的关系并不是简单的对立,而是一种相互影响、相互补充的关系。
在本文中,我将探讨理性与感性的博弈与结合,以及它们对我们的思考和行为的影响。
在决策过程中,理性往往被认为是最重要的因素。
它使我们能够以客观的方式分析和评估现实情况,并选择最佳的解决方案。
当我们面临挑战和抉择时,理性会帮助我们保持冷静和理智,避免情绪和个人偏见的干扰。
例如,当我们在职场上遇到困难时,理性思维能够帮助我们找到最有效的解决方法,而不是被情绪或个人喜好所左右。
然而,理性也有其局限性。
在某些情况下,过度强调理性可能使我们忽视了一些重要的信息和决策因素。
感性思维则能够补充这一不足。
感性不仅是我们对世界的感受,也是我们对自己内心的洞察。
通过感性思维,我们能够更好地理解自己的情感和需要,从而更好地与他人沟通和相处。
感性还能够激发我们的创造力和想象力,帮助我们发现新的解决方案和创新。
理性和感性之间的博弈可以在艺术和美学领域中得以体现。
艺术作品往往同时具有理性和感性的元素。
理性在艺术作品中体现为形式和结构的组织,而感性则是作品所传递的情感和意义。
例如,一部音乐作品可能有精确的音符和和弦的排列(理性),但它的音乐旋律和情感表达(感性)才是触动人心的关键。
同样地,一幅绘画作品可能有准确的画笔技巧和色彩运用(理性),但它所呈现的主题和情感(感性)才是吸引观众的核心。
理性和感性的结合也在人际关系中起到重要的作用。
当我们与他人交往时,理性使我们能够思考和分析对方的言行,从而更好地理解他人,并建立起有效的沟通和合作。
但感性也是构建亲密关系和情感共鸣的基础。
通过感性,我们能够表达自己的情感和关怀,与他人建立起深入的情感联系。
第10讲:有限理性博弈(I):具有快速学习能力的小群体成员的反复博弈汇总
(1)0A;
(2)1A;
(3)相邻2A;
1
(4)不相邻2A;
(5)3连A;
(6)非3连A;
5
2
(7)4A;
(8)5A。
4
3
30
协调博弈的有限理性博弈方快速学习模型(续)
•情形1:初次博弈有0个A
B
B
B
B
B
B
B
B
B
B
最优反应动态机制:
如果在 t 时期博弈方 i 的两个邻居中只要有1个采用A,那 么博弈方 i在第t+1时期采用A,如果两个邻居都没有采用A, 31 那么博弈方 i 在t+1时期采用B。
第10讲:有限理性博弈(I): 具有快速学习能力的小群体成员的反复博弈
1
OUTLINE 1、完全理性&有限理性 2、具有快速学习能力的小群体成员的反复博弈:一
般分析思路 3、协调博弈的有限理性博弈方快速学习模型 4、进化稳定策略(Evolutionary Stable Strategy:
ESS)
“所有博弈方都采用A”的稳定状态是具有“稳健性” 的
在达到所有博弈方都采用A的稳定状态后,如果出现少数 博弈方偏离A的情况,那么最优反应动态会使博弈方的策 略很快回到都采用A的状态 。
41
协调博弈的有限理性博弈方快速学习模型(续)
“所有博弈方都采用B”的稳定状态不具有稳健性
一旦某个博弈方偏离B,那么最优反应动态会使博弈方的 策略离该稳定状态越来越远。
在上述协调博弈中,所有博弈方都采用A就是一个进化稳 定策略,而所有博弈方都采用B则不是进化稳定策略。
45
有限理性博弈的一般分析思路
一般分析思路: (1)(初始条件)初次进行博弈时,各别博弈方的策略 选择; (2)博弈方相互博弈、学习和模仿的环境条件; (3)博弈方的理性层次决定的学习和策略调整的方式、 特征。
理智与感性的博弈
理智与感性的博弈在人类的思维中,理智和感性一直以来都是两个相互对立又相互依存的力量。
理智是人们通过分析、推理和逻辑思维来做出决策的能力,而感性则是人们基于情感、直觉和直观感受来做出决策的能力。
理智和感性在人类的认知中起着至关重要的作用,它们共同协作着指引我们在人生的道路上作出正确的选择。
理智是人类思维的重要组成部分。
它是基于认知和分析的,通过对问题进行全面的思考和评估,为我们提供了逻辑和理性的思考方式。
理性思维使我们能够从客观的角度看待问题,通过数据和事实来做出决策。
在很多情况下,理智是我们取得成功的关键。
比如在职场上,我们需要理智的思考来解决问题、制定计划和做出决策。
理智思维的好处是它能够让我们保持冷静、客观和理性,不被情感所左右,从而更好地应对挑战和困难。
然而,纯粹依靠理智思维也有其局限性。
感性作为理智思维的补充,是人们做出决策和行动的重要依据。
感性思维是建立在情感和直观感受的基础上的,它能够让我们更好地理解他人的情感和需求,从而帮助我们做出更有同情心和同理心的决策。
感性思维还能够激发我们的创造力和想象力,使我们能够超越现实世界的限制,去探索未知和创造美好。
在艺术创作、人际关系和情感表达等方面,感性的力量是不可或缺的。
当理智和感性发生冲突时,我们需要进行适当的博弈和平衡。
在某些情况下,理智可能会告诉我们做出安全和稳妥的选择,而感性则会推动我们冒险和尝试新事物。
在这种情况下,我们需要理智和感性相互配合,找到最佳的平衡点。
理智使我们能够从长远的利益出发,考虑事情的风险和收益;而感性则使我们能够体验生活的美好和激情,并发现意想不到的机遇。
只有理智和感性能够相互协作,才能够让我们更好地应对挑战和困难。
在生活中,理智和感性的博弈也常常出现在个人选择和人际关系中。
有时候,我们对于一个人或者一种行为会有一种直观的感受,但理智告诉我们应该保持冷静和客观,不要凭感觉做出决策。
而在另一些情况下,我们可能会因为某种感觉和情感而做出决策,但理智告诉我们需要进行全面的思考和评估。
CH02混合策略(博弈论,张醒洲)
12/19/2019
张醒洲,大连
22
对参与人j的混合策略,参与人i的最优
混合策略
• 参与人 2: ( q, 1-q )
• 参与人 1: ( r, 1- r )
•
求解 r*(q)
参与人 1
– 当参与人2的混合策略为(q, 1 - q)
• 给定以下信念
– 如果参与人1出正面, 他的期望 收益是1 - 2q ;
–
如果参与人1出背面,他的期望 收益是2q-1.
参与人 1
正面
• 考虑参与人1可能的混合策略
r
背面
1-r
参与人2
正面
背面
q
1-q
-1, 1 1, -1
1, -1 -1, 1
– 令 (r, 1- r) 为参与人1混合策略(以概率 r 出正面,以概率1-r出背面); – 对任意 [0,1] 上的q,计算r的值, 用 r*(q)表示。因此, 参与人2选择混
件会出现.我们可以判断哪些事件有可能出现,并且能 判断每一个事件出现的可能性大小.
• 概率
–事件的概率是对一次随机试验中该事件出现的可能性 的度量
–如果对可能性的度量以某种客观规律或物质属性为基 础, 我们就用“概率”一词
–如果对可能性的度量以个人经验、主观判断为基础, 就用“主观概率”、“信念”、“置信度”等术语
12/19/2019
张醒洲,大连
9
概率的公理化定义
• 概率测度
样本空间Ω上的一个概率测度是Ω的子集的一个函数P( ·) ,它
满足三条公理:
• 公理(1) 0≤P(E) ≤1, 对任一事件E
02个人理性
2 理性人的行为
所有社会科学都是有关人的行为的科学,但不同 学科的方法、假设、着眼点不同; 经济学:从个人到社会(from micro to macro) 社会学:从社会到个人(from macro to micro ) 个人是社会制度的反应 心理学:用观察、实验的方法看人们实际上是怎 么行为的。(行为科学) 经济学也是行为科学,是不同学科的融合;社会 学借鉴经济学,经济学借鉴社会学案例。
B
靠左行 靠右行
A
靠 左 行
靠 右 行
1,1
-1,-1
-1,-1
1,1
协调与预测
• 协调问题的核心是预测(prediction),即 预测他人会如何行动 ; • 预测必须遵守规则;预测依赖于信息 • 信息:too little knowledge;too much knowledge;fail to use the knowledge;no knowledge can help
应用:分工效率
• 如果两个人同时生产两样产品(面包和牛奶), 每人的产量为(50,50),总产量为(100, 100); • 如果A专业化于生产面包,产量可以达到150;B专 业化于生产牛奶,产量可以达到140,那么分工与 不分工比较就是一个帕累托改进,因为总产量达 到(150,140)。 • 绝对优势与比较优势。 • 经济增长很大程度上来自分工效率。
理性与博弈论
理性与博弈论Joseph Malkevitch关键词:博弈论, 应用数学引言如果你得到一千元,不附带任何条件,你可能会拿钱,然后跑走?如果金额不是一千元,而是一万元,不附带任何条件,你可能会拿钱,而且跑得更快。
但是,如果你在大街上看到一张100元的钞票,而你最近背部已经疼痛难忍,虽然当时你的痛苦减轻了很多,但你可能不会弯腰把它捡起来。
当然,对一毛硬币更不值得弯腰。
经济学家和数学家在解释有关经济行为并提供建议时,会调用“理性”行为的论据来解释人们应该采取什么样的行动。
然而,正如上面的例子所显示的,如果决策者比观察者有更多的信息(比如背部状态),那么观察到的行为和可预期的行为可能不一样。
冯·诺伊曼摩根斯特恩由数学家约翰·冯·诺伊曼(1903-1957)和经济学家奥斯卡·摩根斯特恩(1902-1977)首创的博弈论,提供了许多发人深省的例子,其中逻辑上行得通的行为与实际上看到的行为之间的区别有着天壤之别。
因此,博弈论提供了数学家、心理学家、政治学家、哲学家、经济学家和其他学者一个令人兴奋的舞台,来探索位于他们各自学科核心处的迷人思想并获得探测各种各样的问题的工具。
如果以数学建模的角度来看博弈论,其中博弈论的部分用来提供“现实世界”中的行为表示,则涉及博弈的试验不仅提供了改善我们对人类行为洞察力的方式,而且对博弈论本身也开发出新的方法和思路。
那些熟悉博弈论的读者,可以只略读下一节,它是关于博弈论的一些比较出名的方面。
这个预备材料的目的是对某些博弈进行“标准”博弈理论和实际操作之间的对比。
博弈论的基础知识博弈论已经发展成为一个复杂而多分支的学科。
其基本思想是:有一群人(通常被称为玩家)相互交融,并存在他们希望解决的一些冲突。
为了简单起见,让我们考虑只有两个人(国家或企业)的玩家。
根据由玩家采取的行动或决策,对所涉及的两个人将产生不同的“回报”。
我们假设,该游戏是具有完美信息的博弈。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
综合I类与II类理性人的博弈策略两人零和博弈作为较归整的形式,在博弈论的早期研究中已经得到的深入讨论。
本文引入了I类理性与II类理性的概念,认为现实博弈中的参与人往往既可能从I类理性的角度采取战略,也可能是从II类理性人的角度出发,因此,构造了一个综合了I类和II类理性特征的支付矩阵,通过对一些常见的非零和博弈实例进行讨论,认为这一模型可以解决战略选择的不确定性问题。
但本文没有对此进行严格的数学证明。
ﻫﻫ
在经济学的博弈理论中,一般假设参与人(PLAYERS)具有理性人的特征,即总是寻求自身的最大化利益,选择能使个人利益最大化的策略。
在计算收益的时候,使用的是个人所得。
这是一个“绝对量”,而现实中,也存在着另外一种情况,也就是参与者之间除了考虑自己的所得之外,也很关心对方的所得,并比较相互间的差异,采取使“相对”所得最大化的策略。
我们不妨把以追求相对所得最大化的行为人称为II 类理性人,并从博弈论的角度对他们的行为模式进行研究。
ﻫﻫ具有II类理性特征的现象在很多方面都有存在。
比如,我们在人际交往中确实会碰到一些“损人利己”的人,也会见到“损人不利己”的人,从我们观点看来,他们是非理性的,但是进行换位思考就会发现,其实他们的行事原则是相对来说,总要让自己占便宜或者自己吃得亏比对方少,至于别人是否会
吃亏,不是他们考虑的因素,这也是一种“理性”行为,也有出于心理层面的考虑,认为自己所得相对较少或者自己损失较大是一种不公平,并从自己的角度出发进行策略选择。
在激烈的市场角逐中,竞争双方在短期内有时会不计代价地采取大出血的策略而欲先致对手于死地,希望对手先被淘汰而自己会坚持到最后。
如果做不到这点,也要最大程度地削弱对手力量,使其一蹶不振而不会对自己再构成威胁。
这种商场竞争,并期望自己能笑到最后的思维,也是“理性”的。
有研究表明,国际关系中这样的II类理性的例子更不少见。
这些虽然是比较极端的例子,现实生活中,更多的可能是,每个人或组织都会考虑自己的所得,并期望自己的所得比别人的大。
关键是对两种所得在考虑时的权数是随情况不同而变化的。
如果否定在策略选择中的II类理性因素,可能会对一些现象无法解释。
尽管从道德角度讲不值得提倡,而且从价值评判上总是受到谴责, 但作为一种存在的现象,仍然有必要加以研究。
但本文从II类理性个体的博弈战略开始,并过渡到一个综合了I类和II类理性行为的博弈模型,对例中设计的参与人的战略选择,只进行经济学分析而不做道义上的衡量。
ﻫ
当博弈参与者是II类理性人时, 此时收益矩阵的取值有一定的规律。
假设两个参与人甲和乙都是II类理性人时,对比在I类理性的得益矩阵(图1)ﻫﻫ
乙。