博弈论笔记
博弈论读书笔记
1、 人面对自然物时如何行为?寻找人类如何最大化的使用自然物的途径,主要借鉴自然科学所积累的知识及其提升的工具理性。
2、 人面对着他人或社会时如何行为?探究如何充分运用人的理性以及实现社会需求的最大化,需啊哟分析具体环境下人的行为方式和偏好。
3、 博弈思维的联合理性就具有双重特性:一是相互依存,即博弈中的任何博弈方都受到其他博弈方行为的影响;二是理性行为,即博弈方的决策必定建立在预测其他博弈方的行动之上。
4、 非合作的纳什均衡存在以下问题:纳什均衡的非唯一性;不考虑博弈方的策略选择如何影响对手的策略;允许不可信威胁的存在。
5、 完美信息是指一个博弈方对其他博弈方的行动都有准确的了解,即么个信息集只包含一个值。
完全信息则是指自然不首先行动和自然地初始行动被所有博弈方准确观察到,即没有事前的不确定性。
不完全信息意味着不完美信息,但不完美信息并不意味着不完全信息。
6、 在不完全信息博弈中,首先行动的是“自然”,“自然”决定了博弈方以多大的可能性采取某种行动,由“自然”决定的每个博弈方以多大的可能性采取某种行动的情况只有每个博弈方个人知道,其他博弈方都不知道。
确定博弈是指不存在由“自然”作出行动的博弈,否则就是不确定博弈。
7、 严格占优均衡是指无论对手选择何种策略,均衡状态时的策略都是博弈方的最好选择;纳什均衡则是指在对手不改变当前策略的条件下,均衡状态时的策略是博弈方的最好选择。
8、 在对策G 中,如果策略组合1(,,)n s s **是一个纳什均衡,那么它的严格占优策略在重复剔除过程中就不会被剔除掉。
如果策略组合是剔除的严格占优策略均衡,那么他一定是一个纳什均衡。
9、 一般地,要使得任何有限博弈都存在纳什均衡这一命题,就必须有个前提条件:允许博弈方选择混合策略,即博弈方以一定的概率选择某种策略。
设想在多次反复博弈中,博弈方的最终收益状况可以从平均得益上表现出来。
一般地,如果一个策略规定博弈方在每个给定的信息情况下只选择一种特定的行动,就称该策略为纯策略;相反,如果一个策略规定博弈方在每一个给定的信息情况下以某种概率分布随机地选择不同的行动,就称为混合策略。
博弈论读书笔记
博弈论读书笔记博弈论,简单来说,就是研究在互动情境中,人们如何做出决策以及这些决策会带来怎样结果的学问。
最近读了关于博弈论的相关书籍,深受启发,也有了不少思考。
博弈论中的一个核心概念是“策略”。
参与者需要根据自身的目标和对其他参与者行为的预期,来选择最优的策略。
比如在“囚徒困境”这个经典的博弈模型中,两个犯罪嫌疑人被分别审讯,如果两人都保持沉默,那么各自可能只会被轻判;但如果其中一人供出对方,而对方保持沉默,那么供出的一方将获得减刑,而沉默的一方将受到重罚。
在这种情况下,从个体角度看,供出对方似乎是最优策略,但如果两人都这样想,最终的结果却是两人都受到较重的惩罚。
这就引出了一个重要的问题:个体的最优策略不一定能带来整体的最优结果。
另一个有趣的概念是“纳什均衡”。
它指的是一种状态,在这种状态下,任何一方单方面改变策略都不会使自己的情况变得更好。
比如在商家竞争的例子中,假设两家公司 A 和 B 都在考虑是否降价促销。
如果 A 降价而 B 不降价,A 会获得更多市场份额;如果 B 降价而 A 不降价,B 会获得更多份额;如果两家都降价,利润都会减少;如果两家都不降价,利润维持在一个相对稳定的水平。
在这种情况下,两家都不降价就是一个纳什均衡,因为任何一家单方面降价都不会带来更好的结果。
博弈论在现实生活中的应用非常广泛。
在商业领域,企业之间的竞争就是一场博弈。
比如在市场份额的争夺中,企业需要考虑竞争对手的策略来制定自己的营销策略、定价策略等。
又比如在谈判中,双方都在揣摩对方的底线和期望,以争取最有利的结果。
在国际关系中,博弈论也有着重要的地位。
国家之间在贸易、军事、外交等方面的互动都可以用博弈论来分析。
例如,在核裁军谈判中,各国需要权衡自身的安全需求和国际压力,做出相应的决策。
在日常生活中,博弈论同样无处不在。
比如在和朋友玩游戏时,我们会思考对方可能的行动来决定自己的下一步;在分配家务时,家庭成员之间也存在着某种程度的博弈。
《博弈论基础》读书笔记(一)博弈标准式与纳什均衡
《博弈论基础》读书笔记(⼀)博弈标准式与纳什均衡在之前⼀个⽼师的安利下,还是开了这个博弈论的坑。
书是:这本书本⾝写的⾮常棒,⽽且很易懂,强烈安利。
顺便⾃⼰记录下读书的笔记和⼀些想法,同时也把书中⽐较难理解的地⽅⽤⾃⼰的理解说⼀下,希望能帮到⼤家。
第⼀章 1完全信息静态博弈在本章,我们来讨论如下简单形式的博弈(包含如下特点):1. 静态博弈:所有游戏的参与者同时选择⾏动,然后根据⾏动每个参与者得到各⾃的结果2. 完全信息博弈:即每⼀个参与者的收益函数在所有参与者之间是共同知识,即不存在信息的不对称性,也就是说每个参与者对游戏规则以及游戏演化机理完全明⽩。
关于本章的结构:在1.1节中我们先会介绍两个问题:1. 如何描述⼀个博弈问题2. 如何求得博弈问题的解在1问题中我们定义了博弈的标准式表述和严格劣战略的概念,在2问题中我们根据前⾯的介绍引出了纳什均衡的概念。
在1.2节中我们会运⽤前⾯的⼯具来分析古诺(Cournot,1838)的不完全竞争模型,使⽤纳什均衡的⽅式对之进⾏求解,之后我们将重回理论知识,我们将会定义混合战略,它可以理解为⼀个参与者并不能确定其他参与者会如何⾏动时应该选的战略,之后会引出纳什定理。
1.1节博弈的标准式和纳什均衡1.1.A 博弈的标准式表述⾸先举⼀个⼤家都⽐较熟悉的、很经典的例⼦:囚徒困境警⽅逮捕甲、⼄两名嫌疑犯,但没有⾜够证据指控⼆⼈⼊罪。
于是警⽅分开囚禁嫌疑犯,分别和⼆⼈见⾯,并向双⽅提供以下相同的选择:若⼀⼈认罪并作证检控对⽅(相关术语称“背叛”对⽅),⽽对⽅保持沉默,此⼈将即时获释,沉默者将判监10年。
若⼆⼈都保持沉默(相关术语称互相“合作”),则⼆⼈同样判监1年。
若⼆⼈都互相检举(相关术语称互相“背叛”),则⼆⼈同样判监8年。
对于这个博弈我们可以来使⽤如下矩阵来进⾏描述对于这个矩阵,其横纵轴分别为囚徒1、2所对应的选择。
⽅框⾥的值第⼀项代表在此选择下,囚徒1 的收益情况,第⼆项代表囚徒2的收益情况。
博弈论前四章笔记整理
博弈论前四章笔记整理第一章:博弈论基础概念。
- 博弈的定义与要素。
- 博弈是指在一定的规则下,多个参与者(至少两个)进行策略选择并得到相应结果(收益)的过程。
- 要素包括参与者(局中人)、策略(每个参与者可选择的行动方案)、收益(每个参与者在不同策略组合下的所得)。
例如在“囚徒困境”中,两个囚犯是参与者,坦白或不坦白是他们的策略,不同策略组合下的刑期长短就是收益。
- 博弈的分类。
- 按参与者数量可分为两人博弈和多人博弈。
- 按策略空间是否有限分为有限博弈和无限博弈。
如猜硬币是有限博弈(正面或反面两种策略),企业的产量竞争(产量可在一定范围内连续取值)可能是无限博弈。
- 按收益情况分为零和博弈(一方的收益就是另一方的损失,总和为零,如赌博)、常和博弈(收益总和为常数)和非零和博弈(收益总和不为零,如企业合作共同开拓市场,双方都可能获利)。
第二章:完全信息静态博弈。
- 策略式表述(标准式表述)- 通常用一个矩阵来表示,行代表一个参与者的策略,列代表另一个参与者的策略,矩阵中的元素是对应的收益组合。
以“性别战”为例,丈夫和妻子选择看电影或看球赛,就可以构建一个2×2的收益矩阵。
- 占优策略均衡。
- 占优策略是指无论其他参与者选择什么策略,该策略都是某个参与者的最优策略。
如果每个参与者都有占优策略,那么由这些占优策略组成的策略组合就是占优策略均衡。
例如在“囚徒困境”中,每个囚徒的占优策略都是坦白,所以(坦白,坦白)是占优策略均衡。
- 纳什均衡。
- 纳什均衡是指在一个策略组合中,每个参与者的策略都是对其他参与者策略的最优反应。
即给定其他参与者的策略,没有参与者有动机单方面改变自己的策略。
与占优策略均衡不同,纳什均衡并不要求每个参与者都有占优策略。
例如在“性别战”中,(看电影,看电影)和(看球赛,看球赛)都是纳什均衡。
第三章:完全信息动态博弈。
- 扩展式表述。
- 包括博弈树的构建,节点表示参与者的决策点,树枝表示可选择的策略,终端节点表示博弈的结果并标有相应的收益。
博弈论的读书笔记
博弈论的读书笔记博弈论,一门看似高深莫测,实则与我们日常生活息息相关的学问。
通过对相关书籍的研读,我对这一领域有了更深入的理解和思考。
博弈论研究的是在相互影响的决策环境中,理性决策者如何做出最优选择。
简单来说,就是当你的决策会受到他人决策的影响,同时他人的决策也会受到你的决策影响时,如何才能做出对自己最有利的决策。
书中提到的“囚徒困境”是一个经典的博弈案例。
假设有两个嫌疑人被警察抓住,分别关在不同的房间审讯。
如果两人都保持沉默(合作),那么每人可能只会被判入狱 1 年;如果一人坦白而另一人沉默(背叛),坦白者会被释放,沉默者则要入狱10 年;如果两人都坦白,那么每人入狱 5 年。
从个体角度看,坦白似乎是最优选择,因为无论对方如何选择,坦白都能让自己的刑期更短。
但如果两人都这样想,最终结果就是都入狱 5 年,这并不是整体的最优结果。
这个例子深刻地揭示了个体理性与集体理性之间的冲突。
在现实生活中,“囚徒困境”的例子比比皆是。
比如商家之间的价格战,每家都想通过降价来吸引更多顾客,提高自己的市场份额。
但如果所有商家都降价,最终大家的利润都会受损。
再比如在环境保护方面,如果每个国家都只考虑自己的短期利益,不愿意为减少污染付出努力,那么最终地球的生态环境会恶化,所有人都会受到影响。
另一个有趣的概念是“纳什均衡”。
以“斗鸡博弈”为例,两个司机驾车相向而行,谁先转向避让谁就输了面子。
如果都不避让,就会发生碰撞,两败俱伤。
存在一个策略组合,即一方避让,另一方不避让,这就是纳什均衡。
在这个均衡点上,任何一方改变策略都不会让自己的情况变得更好。
“纳什均衡”在很多场景中都有体现。
比如在就业市场上,求职者和招聘企业之间的选择也可能形成纳什均衡。
求职者希望找到待遇好、发展前景广阔的工作,企业希望招聘到能力强、忠诚度高的员工。
当市场达到一定的平衡状态时,双方的选择就形成了一种稳定的局面。
博弈论还让我思考了人与人之间的互动和策略选择。
博弈论笔记
耶鲁公开课—博弈论笔记第一节、名词解释优势策略(Dominant strategy ):不论其他局中人采取什么策略,优势策略对一个局中人而言都是最好的策略。
即某些时候它胜于其他策略,且任何时候都不会比其他策略差。
注:1、“优势策略”的优势是指你的这个策略对你的其他策略占有优势,而不是无论对手采用什么策略,都占有优势的策略。
2、采用优势策略得到的最坏的结果不一定比采用另外一个策略得到的最佳的结果略胜一筹。
严格劣势策略(strictly dominated strategy):被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
弱劣势策略:原来不是严格劣势策略,但是经过剔除严格劣势策略后,这个策略就成了严格劣势策略。
例:囚徒困境囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。
就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。
背叛是两种策略之中的支配性策略。
因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
例:协和谬误20世纪60年代,英法两国政府联合投资开发大型超音速客机,即协和飞机。
该种飞机机身大、装饰豪华并且速度快,其开发可以说是一场豪赌,单是设计一个新引擎的成本就可能高达数亿元。
难怪政府也会被牵涉进去,竭力要为本国企业提供更大的支持。
项目开展不久,英法两国政府发现:继续投资开发这样的机型,花费会急剧增加,但这样的设计定位能否适应市场还不知道;但是停止研制也是可怕的,因为以前的投资将付诸东流。
随着研制工作的深入,他们更是无法做出停止研制工作的决定。
博弈论读书笔记
博弈论读书笔记博弈论,简单来说,就是研究人们在各种策略互动中的决策行为和结果的一门学问。
它不仅在经济学中有着广泛的应用,在政治、军事、社会等领域也发挥着重要的作用。
最近读了一些关于博弈论的书籍,让我对这一领域有了更深的理解和感悟。
博弈论的核心概念是“博弈”,它指的是参与者之间的策略互动。
在一个博弈中,每个参与者都有自己的目标和策略选择,而他们的决策会相互影响,最终决定整个博弈的结果。
例如,在“囚徒困境”这个经典的博弈模型中,两个犯罪嫌疑人面临着坦白或抵赖的选择。
如果两人都坦白,他们都会被判刑;如果两人都抵赖,他们都会受到较轻的处罚;但如果一人坦白一人抵赖,坦白的人会被从轻发落,抵赖的人则会受到重罚。
在这种情况下,每个嫌疑人都需要考虑对方的可能选择,从而做出自己的决策。
博弈论中有许多不同的类型,如零和博弈、非零和博弈、完全信息博弈、不完全信息博弈等。
零和博弈是指一方的收益必然等于另一方的损失,总和为零。
比如下棋就是一种零和博弈,一方赢另一方就输。
而非零和博弈则可能存在双赢或双输的结果,比如合作做生意,双方可以通过合作实现共同的利益增长,也可能因为合作不当而共同遭受损失。
完全信息博弈是指参与者对彼此的策略和收益都有完全的了解,而不完全信息博弈则存在信息的不对称。
在现实生活中,大多数博弈都是不完全信息博弈,这就增加了决策的难度和复杂性。
比如在商业谈判中,双方往往并不清楚对方的底线和真实意图,需要通过各种手段来获取信息和推测对方的策略。
博弈论中的策略选择也是非常关键的。
常见的策略有纯策略和混合策略。
纯策略是指参与者确定地选择某一种行动,而混合策略则是按照一定的概率选择不同的行动。
在一些博弈中,混合策略可能比纯策略更有效。
例如在“猜硬币正反面”的游戏中,如果一方总是选择正面或反面,那么很容易被对方猜到,而采用随机选择正面或反面的混合策略则能增加获胜的机会。
博弈论还涉及到均衡的概念。
均衡是指在给定其他参与者的策略下,每个参与者都没有动机改变自己的策略。
《博弈论》读书笔记
《博弈论》读书笔记博弈论1、博弈论的四要素:(1)、参与人或局中人(2)、参与方争夺有利资源和利益(3)、参与者有自主选择的策略(4)、参与者拥有一定量的信息2、懒惰而又聪明的人:适合担当领导职务,因为他的决策力不会因为琐碎的小事而打扰,不会因为勤奋而导致神经性紧张。
勤奋而又聪明的人:适合担当参谋职务。
懒惰而又愚蠢的人:,不会产生危害,可以委以小任。
勤奋而又愚蠢的人:必须开除,因为这种人会在错误的道路上一路狂奔。
3、正和博弈,负和博弈,零和博弈。
正和博弈:正和博弈亦称为合作博弈,是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加。
负和博弈:负和博弈,是指双方冲突和斗争的结果,是所得小于所失,就是我们通常所说的其结果的总和为负数,也是一种两败俱伤的博弈,结果双方都有不同程度的损失。
零和博弈:指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作的可能。
4、对手和自我同等重要。
只有强大的对手才会让你变得更加优秀。
5、冯诺依曼(用黑板擦证明定理的人):冯·诺依曼(John vonNeumann,1903~1957),20世纪最重要的数学家之一,在现代计算机、博弈论和核武器等诸多领域内有杰出建树的最伟大的科学全才之一,被称为“计算机之父”和“博弈论之父”。
6、博弈论的经济价值:(1)、从博弈双方的合作与否分为:合作博弈、非合作博弈。
(2)、从时间的序列性可分为:有序进行的称动态博弈、同时进行的称静态博弈。
(3)、从信息的暴露程度上分为:完全信息博弈和不完全信息博弈7、纳什均衡:Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。
博弈论知识点总结完整版
博弈论一:基本知识1.1定义:博弈论;又称对策论;是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论;是研究竞争的逻辑和规律的数学分支..即;博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用;以及不同决策主体之间的均衡..1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数;是博弈最重要的基本要素..1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论..两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议binding agreement..倘若不能;则称非合作博弈Non-cooperative game..合作博弈强调的是集体主义;团体理性;是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大;强调个人理性、个人最优决策;其结果有时有效率;有时则不然..目前经济学家谈到博弈论主要指的是非合作博弈;也就是各方在给定的约束条件下如何追求各自利益的最大化;最后达到力量均衡..博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息;是否了解两个角度进行..把两个角度结合就得到了4种博弈:a、完全信息静态博弈;纳什均衡;Nash1950b、完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾1965c、不完全信息静态博弈;贝叶斯纳什均衡;海萨尼1967-1968d、不完全信息动态博弈;精炼贝叶斯纳什均衡;泽尔腾1975 Kreps; Wilson1982 Fudenberg; Tirole19911.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述 Strategic form; 扩展式表述Extensive form1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略;一个参与人的某个策略给他带来的支付值始终高于其他策略;或至少不劣于其他策略;则称该策略为该参与人的严格占优策略或占优策略..对于所有的s-i; si称为参与人i的严格占优战略;如果满足:uisi;s-i>uisi';s-is-i; si' sib、占优均衡:一个博弈的某个策略组合中;如果对应的所有策略都是各参与人的占优策略;则称该策略组合为该博弈的一个占优均衡..1.7重复剔除严劣策略均衡:a、“严劣”和“弱劣”的含义:设 s i’和s i’’是参与人i可选择的两个策略;若对其他参与人的任意策略组合s-i; 均成立u i s i’; s-i < u i s i’’; s-i; 则说策略s i’严劣于策略s i’’ ..上面式子中;若将“<”改为“≤”;则说策略s i’弱劣于策略s i’’ ..b、定义:重复剔除严格策略就是各参与人在其各自策略集中;不断剔除严劣策略…如果最终各参与人仅剩下一个策略;则该策略组合就被称为重复剔除严劣策略均衡..二:纳什均衡Nash Equilibrium2.1纳什均衡定义:对于一个策略式表述的博弈G= {N;S i; u i; i ∈N}; 称策略组合s=s1; …s i; …; s n是一个纳什均衡;如果对于每一个i ∈N; s i是给定其他参与人选择s-i={s1; … ;s i-1; s i+1; … ;s n} 情况下参与人i的最优策略经济理性策略;即:u i s i; s-i≥ u i s i; s-i; 对于任意的s i∈S i ;任意的i∈N均成立..通俗定义:纳什均衡是一种策略组合;给定对手的策略;每个参与人选择自己的最优策略..纳什均衡是一种稳定的策略组合:当所有参与人的选择公开以后;每个人都满意自己作出了正确的选择;没有人能得到更好的结果了..在博弈论中这种结果被称为纳什均衡NE..2.2定理:Nash在1950年证明:任何有限博弈;都至少存在一个NE——Existence of Nash Equilibrium..即在一个有n个参与人的策略式博弈G={S1;…;Sn; u1;…;un}中;如果n是有限的;且Si是有限集i=1;…;n;则该博弈至少存在一个纳什均衡在混合策略意义下Wilson1971证明;几乎所有有限博弈;都存在有限奇数个NE;包括纯策略NE和混合策略NE..——Oddness Theorem2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理 a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡;但反过来不一定成立;定理 b 纳什均衡一定不能通过重复剔除严劣策略方法剔除..2.4划线法先找出自己针对其他博弈方每种策略或策略组合对多人博弈的最佳对策;即自己的可选策略中与其他博弈方的策略或策略组合配合;给自己带来最大得益的策略这种相对最佳策略总是存在的;不过不一定唯一;然后在此基础上;通过对其他博弈方策略选择的判断;包括对其他博弈方对自己策略判断的判断等;预测博弈的可能结果和确定自己的最优策略..这就是划线法..2.5箭头法箭头法对于理解博弈关系很有好处;是寻找相对稳定性策略组合的分析方法..对博弈中的每个策略组合进行分析;考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益..如能;则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组..最后综合对每个策略组合的分析情况;形成对博弈结果的判断..划线法和箭头法的结果是一致的;可以相互替代..三:混合策略Mixed Strategies 纳什均衡3.1定义:混合策略的定义:在博弈G={N; Si; ui; i∈N}中;假设参与人i的纯策略构成的策略集合为Si={si1;…; sik};若参与人i 以概率分布pi=pi1;…; pik 在其k 个可选策略中随机选择“策略”;称这样的选择方式为混合策略..这里;0≤pij ≤ 1;对于j=1 ;…; k 都成立;且有; pi1+…+ pik=1..纯策略可看成特殊的混合策略..上述定义是在有限博弈前提下进行的..3.2混合策略意义下策略组合的表述{x1∈X1; …; xn∈Xn};其中Xi ; i =1; …; n表示参与人i所有纯策略生成的概率空间;xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为{1/2; 1/2;1/2; 1/2}3.3VNM效用函数Von Neumann and Morgenstern冯·诺依曼和摩根斯坦如果某个随机变量X以概率Pi 取值xi;i=1;2;…;n;而某人在确定地得到xi时的效用为uxi;那么;该随机变量给他的效用便是: UX =P1ux1 + P2ux2 + ... + Pnuxn表示关于随机变量X的期望效用..因此UX称为期望效用函数;又叫做冯·诺依曼——摩根斯坦效用函数VNM函数..3.4基于混合策略意义下的博弈策略式表述定义:基于v-N-M效用的策略式博弈由 a、参与人集合 b、每个参与人有一个纯策略集合 c、对于每一个参与人来说;由所有参与人纯策略组合构成的风险结果空间;存在一个v-N-M效用3.5混合策略意义下的纳什均衡定义:对于博弈G= {N; Si; ui; i∈N};基于v-N-M效用的混合策略组合α是一个纳什均衡;若对于每一个i; 以及i的任意一个混合策略αi;α对应的期望支付至少和αi;α-i 的期望支付一样大换句话说;称混合策略组合α是一个纳什均衡;如果没有一个参与人通过偏离策略αi 实现支付的增加3.6一个定理对于N-人静态博弈问题;设混合策略纳什均衡对应的策略组合为Xi ; X –i ..对于任意的i ;若最优混合策略为Xi= {x1;…;xl;0…0}不失一般性;假设前l个分量严格大于0;记分量xk k=1;…; l 对应的纯策略sk;则对于参与人i而言;sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值;等于纳什均衡混合策略组合 Xi; X –i 的收益值..即ui sk; X –i = ui Xi; X –i 成立 ; k=1;…; l3.7方法:a、求解混合策略均衡可以用期望收益等值法b、2×2双矩阵博弈的图解法:反应函数的三个交点即是纳什均衡四:多重纳什均衡解及其分析4.1 帕雷托占优均衡帕雷托占优均衡的含义是:在多个纳什均衡中;若存在一个纳什均衡;其支付结果针对每个参与人而言都严格优于其它纳什均衡;则该纳什均衡是帕雷托占优纳什均衡..4.2风险占优均衡risk-dominant equilibrium参与人对风险占优均衡的选择倾向;有一种强化的机制..当部分或所有参与人选择风险占优均衡的可能性增强的时候;任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小;而这又使得帕雷托占优均衡策略的支付更小;从而形成一种选择风险占优均衡策略的正反馈机制;并使其出现的概率越来越大..当参与人数目增加时;选择合作的风险将会更大;可借助该点考虑招标机制如何减少投标方勾结问题..上述问题是我们知道建立诚信机制社会的重要意义..上述问题引出一个博弈相关分支为协调博弈coordination game4.3聚点均衡由实际问题抽象出来的博弈模型中;更多的一类问题是:多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系;如夫妻爱好问题的两个纯策略均衡..这时如何预测哪一个纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例;在实际中往往二人很默契地知道如何进行博弈;双方往往知道怎么进行选择策略;且能够相互了解这里面排除了互相协商后达成的一致实际博弈中参与人往往会利用博弈模型以外的信息;实现对特定博弈均衡一致关注的“聚点”这些信息如:参与人共同的文化背景或规范;共同的知识;具有特定意义事物的特征;某些特殊的数量、位置关系等聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性;但因为涉及因素太多;对于一般博弈模型很难总结普遍规律;只能具体问题具体分析聚点:人们通常会协调彼此的行为..你弱他就强;先例产生的影响远大于逻辑或者法律效力;人们总是乐于安守现状或接受自然形成的界线三八线4.4相关均衡correlated equilibrium实际上;在现实中遇到选择困难时;特别是在长期中反复遇到相似选择难题时;常会通过收集更多信息;形成特定的机制和规则;为某种形式的制度安排等主动寻找思路..相关均衡就是这样的一种均衡选择机制..对于实际中比较复杂的博弈问题;参与人是否有能力设计这种机制;并且有足够能力理解、信任这种机制;是有一定疑问的..相关均衡作为社会经济制度创新的一种解释也许更有意义..4.5防共谋均衡coalition-proof equilibrium 定义:如果一个博弈的某个策略组合满足a、没有任何单个参与人的“串通”会改变博弈的结果;即单独改变策略无利可图该策略组合是纳什均衡..b、给定选择偏离的参与人有再次偏离的自由时;没有任何两个参与人通过“串通”改变博弈的结果..c、依此类推;直到所有参与人都参加的串通也不会改变博弈的结果..满足上述要求的均衡策略组合称为“防共谋均衡”在有多个参与人的博弈中;若部分参与人通过某种形式的默契或串通形成小团体;可能得到比不串通个大的支付..这就是多人博弈的共谋问题..防共谋均衡是指这样的一个纳什均衡;在该均衡局势下;少数参与人集合不能通过均衡策略的偏离;实现更好的局部利益..防共谋均衡是两个以上参与人参加的博弈中;参与人在帕雷托占优均衡中进行合作思想的扩展..五:动态博弈5.1特点一类博弈行为通常需要参与人多步决策才能完成;具有明显的阶段性..博弈的结局、各参与人的收益由多阶段决策结果确定..各参与人的决策有一定的顺序..由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性;通常用扩展式extensive form表述法描述这些信息..5.2博弈的扩展式表示参与人集合:i=1; … ;N..用N表示虚拟参与人“自然”;自然的含义是某些外生的客观概率分布事件参与人的行动顺序the orderof moves:描述各参与人在什么时候行动;参与人的行动空间actionset:在每次行动时;参与人可选择的行动集合;参与人的信息集information set:每次行动时参与人知道什么;参与人的收益函数:在行动结束之后;每个参与人得到些什么..自然选择的概率分布假定自然状态是共同知识..对于有限博弈;博弈树是常用的表述方式..5.3博弈树a若动态博弈是有限博弈;则可用博弈树表示该博弈..这里有限的含义是:各阶段各参与人的行动数目有限;博弈的阶段数有限..b博弈树的基本结构为结点nodes..包括决策结及终点结..决策结是参与人采取行动的时点;终点结是博弈行动路径的终点..枝branches..从一个决策结到它的直接后续结的连线;每一个枝代表参与人的一个行动选择..信息集..是决策结集合的一个子集..将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集..注:每个决策结都是同一个参与人的决策结..该参与人知道博弈进入该集合的某个决策结;但不知道自己究竟出于哪一个决策结若该信息集有两个或两个以上元素..5.4对于有限动态博弈;若参与人对彼此在各决策结点的行动集合;彼此的效用函数;历史的行动有着完全的了解;则称这样的博弈为完全信息动态博弈..如果博弈树的所有信息集都是单元素集;称该博弈为完美信息博弈game of perfectinformation..上述两个定义的差别在于对自然行动信息的描述..5.5动态博弈的策略式表述a相机选择contingent play动态博弈中参与人的策略是各自预先设定的;在博弈的各阶段;针对各种情况做出相应决策..即“等待”博弈到达自己的信息集包含一个或多个决策结后再决定如何行动..在策略式表述博弈中;参与人似乎是博弈开始之前就制定出了一个完全的相机选择;即“如果……发生;我将选择……”..b从扩展式表述构造战略式表述若把B的信息集从左到右排列;上述四个纯策略可以简单记为{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}..上面四个纯策略含义:当A选择开发时;B选择大括号中前面的策略;当A选择不开发时;B选择大括号中后面的策略..B的纯策略为:{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}A的纯策略为:SA=开发;不开发于是可以写成策略式表述形式;为开发;开发开发;不开发不开发;开发不开发;不开发开发-3;-3-3;-31;01;0不开发0;10;00;10;0在扩展式表述博弈中;所有n个参与人的一个纯战略组合s=s1;…;sn决定了博弈树上的一个路径..比如开发;{不开发;开发}决定了博弈的路径为A 开发 B 不开发1;05.6完全信息动态博弈纳什均衡存在性定理如果有限博弈是完美信息博弈;他还有一个纯战略纳什均衡Zermelo;1913..5.7逆向归纳法:a逆向归纳法求解策略:从动态博弈的最后一个阶段出发;对该参与人采用经济理性原则进行分析;逐步到推回前一个阶段相应参与人的行动选择;一直到第一阶段的分析方法..b逆向归纳法是求解完美信息动态博弈的经典方法..逆推归纳法是完美信息动态博弈分析中使用最普遍的方法..c与策略式分析比较:如果A选择U;那么B的信息集不能达到;我们说B的信息集不在均衡路径上out-of-equilibrium path.. 此种情况下;B的选择对A没有什么影响..因此;纳什均衡对一个参与人在非均衡信息集上的选择没有限制..但是;一个参与人在非均衡信息集上的战略可以影响其他参与人在均衡信息集上的选择..d逆向归纳法实质上是重复剔除劣战略法在扩展式博弈中的应用..逆向归纳法适不用于无限博弈和不完美信息博弈..逆向归纳法剔除了“非理性”的均衡策略5.8子博弈完美均衡子博弈精炼纳什均衡①子博弈概念:一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结Tx组成;它满足下列条件:x是一个单结信息集;即hx={x};对于所有的Tx中的x’;如果x’’与x’同属于一个信息集;则x’’也在Tx中..需要说明的是;G本身是自己的一个子博弈..②子博弈完美纳什均衡子博弈精炼纳什均衡扩展式博弈的一个战略组合s=s1;…;s i;…;s n是一个子博弈完美纳什均衡;如果它是原博弈的纳什均衡..它在每一个子博弈上都是纳什均衡③纳什均衡与子博弈精炼纳什均衡的关系前面分析说明;一个特定的纳什均衡决定了原博弈树上唯一的一条路径;这条路径称为“均衡路径”equilibrium path..相对该纳什均衡;其他路径称为非均衡路径out-of-equilibrium path..在每一个子博弈上给出纳什均衡意味着;构成子博弈纳什均衡的战略不仅在均衡路径的决策结上是最优的;同时在非均衡路径的决策结上也是最优的..对于有限完美信息博弈;前面介绍的逆推归纳法得出的纳什均衡即是子博弈精炼纳什均衡..六多阶段静态博弈6.1该类模型中至少在某个阶段参与人同时选择其决策..这类模型实质上就是完美信息动态博弈;因此仍然可以采用逆推归纳法进行分析..因为存在同时选择;因此每个阶段不再是单人优化问题;而是一个静态博弈..6.2前向归纳法:前面已经说明;完美信息动态博弈的经典求解方法为逆序归纳法..还有一种分析方式;就是前向归纳法forward induction..前向归纳法由科尔博格和莫顿斯1986提出..这里不进行严格的数学描述;仅通过一个例题进行说明..6.3重复博弈重复博弈repeated game的定义指同样结构的博弈重复多次;其中的每次博弈称为“阶段博弈stage game”..如两个多次犯罪的“囚徒问题”..由于动态博弈是相机行动;反映到重复博弈中;就是可以使自己在某个阶段的博弈选择依赖于其他参与人过去的行动历史..影响重复博弈均衡结果的主要因素是博弈重复次数和信息的完备性completeness..重复次数对参与人可能会有的影响是:参与人为了获得长远利益而牺牲眼前利益的策略成为可能..关于完备性;简单地说;但一个参与人的支付函数不为其他参与人所知时;该参与人可能有积极性建立一个“好”的声誉reputation以换取长远利益..在社会行为中;经常可以看到本质不好的人在相当长的时期内干好事的原因..定理:令G是阶段博弈;GT是G重复T次的重复博弈T<∞..那么;如果G有唯一的纳什均衡;重复博弈GT的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次即每个阶段博弈出现的都是一次性博弈的均衡结果..上述定理说明;只要博弈的重复次数是有限的;重复本身并不改变囚徒困境的均衡结果..上述定理中“唯一性”是一个重要条件..如果纳什均衡不是唯一的;上述结论就不一定成立..当博弈有多个纳什均衡时;参与人可以使用不同的纳什均衡惩罚前面阶段的不合作行为或奖励第一阶段的合作行为..(七)不完全信息静态博弈不完全信息静态贝叶斯博弈贝叶斯纳什均衡海萨尼转换拍卖理论八合作博弈可传递效用 transferableutility合作博弈的特征函数合作的分配可行分配核心的定义 Shapley 值。
博弈论读书笔记
博弈论-读书笔记
期望越高,失落的机会也就越大。
如果某件事情存在变坏或者导致灾难的可能,那么无论这种可能性多小,最终都会发生。
博弈类型:零和博弈、正和博弈、负和博弈。
零和博弈:一方得到收益的同时,另外一方遭受损失,博弈双方收益和损失总和为零。
正和博弈:一方利益增加,另外一方至少不受损害,整体上得到了增加。
利人利己的双赢局面。
负和博弈:双方存在不可协调的矛盾,互不相让,损失带来的比收益多,两败俱伤,损人不利己。
破窗效应:窗户不是我打破的,别人能打,那我也能打。
麦穗理论:定好标准,什么样算大,什么样算中,什么样算小,理性分析,选择相对算大的目标,才是最优解。
一切决策都是折中,当时的最佳可选方案。
最优策略:尽量选择优势策略。
劣势策略:排除劣势策略。
马太效应:资源越多的人得到越多,资源少的人会失去仅有的。
红白脸策略:唱白脸的人表现咄咄逼人,态度强硬。
唱红脸的人表现态度温和,谦逊有度。
小要求开始,逐步提高要求。
贝勃定律:一种社会心理学效应,简单来说,就是人经历了某种刺激之后,情感情绪会受到很大的影响,第二次施予刺激的时候,反应就没有那么大了。
利用权威提升影响力
不对称竞争优势,田忌赛马。
多劳多得,不劳不得。
国之利器不可以示人;不到万不得已,不亮底牌。
征服大多数人中的重要几个,才会有话语权。
倾听、总结归纳。
博弈论的读书笔记
博弈论的读书笔记最近读了关于博弈论的书,可真是让我大开眼界!博弈论,乍一听这名字,感觉特别高深莫测,好像是那种只有超级聪明的人才能搞懂的东西。
但真正读进去之后,发现它其实就在我们的生活中无处不在。
就拿我前段时间和朋友打牌来说吧。
那可不是普通的打牌,而是一场充满了策略和心理较量的“战斗”。
那天,阳光正好,微风不燥。
我和几个好友聚在一起,准备好好玩几局牌放松放松。
牌局一开始,气氛还算轻松,大家有说有笑。
可随着牌一张张出,局势逐渐紧张起来。
我手里捏着牌,眼睛不停地观察着其他人的表情。
坐在我对面的小李,每次出牌都显得特别果断,眉头微微皱着,好像在向大家宣告他的牌有多好。
我心里就犯嘀咕了:这家伙是真有好牌还是在虚张声势呢?旁边的小王则一直面带微笑,不紧不慢地出牌,让人摸不透他到底在想啥。
我开始分析局势,如果我出这张牌,小李可能会压我,小王说不定会趁机捡漏;要是我不出,又怕错过机会。
这时候,博弈论的知识就在我脑子里打转了。
我想起书中说的“信息不对称”,在这个牌局里,大家都不清楚别人手里到底是什么牌,只能通过表情、动作和出牌的方式来猜测。
于是,我决定先试探一下。
我出了一张不大不小的牌,观察着他们的反应。
小李果然毫不犹豫地压了上来,小王还是那副淡定的样子。
我心里暗暗叫苦,觉得自己可能失策了。
但转念一想,也许这正是小李的圈套,他故意表现得很强势,想让我退缩。
就在我纠结的时候,突然发现小王的眼神有一丝不易察觉的变化。
他似乎对小李的出牌有点意外。
这一个小小的细节让我瞬间有了新的想法,也许小王的牌并没有那么好,他只是在故作镇定。
我决定冒险一搏,出了一张大牌。
这时候,小李犹豫了一下,小王的笑容也变得有点僵硬。
哈哈,我感觉自己好像摸到了门道。
接下来的几轮,我根据他们的反应不断调整策略,时而保守,时而激进。
这场牌局打得那叫一个惊心动魄,每一张牌的出法都像是在走钢丝。
有时候,为了迷惑对手,我还故意露出一副苦恼的表情,让他们误以为我牌很差。
博弈论读书笔记
博弈论读书笔记博弈论,听起来似乎是一个高深莫测的概念,但实际上,它在我们的日常生活中无处不在。
从下棋打牌到商业竞争,从人际关系处理到国家之间的政治博弈,都有着博弈论的影子。
博弈论的核心在于研究决策主体在相互作用时的决策以及这种决策的均衡问题。
简单来说,就是当我们在做决策时,需要考虑到其他人可能的反应和决策,而其他人也在同样考虑着我们的可能行动,这就形成了一种相互影响的局面。
比如在玩石头剪刀布的游戏中,我们的选择并不是随意的。
如果我们一直出石头,对手很可能会猜到并且出布来克制我们。
所以我们需要不断地变换策略,试图猜测对手的想法,同时防止自己的想法被对手轻易识破。
这虽然只是一个简单的小游戏,但已经体现了博弈论的基本思想。
再来看一个商业中的例子。
假设市场上有两家竞争的公司 A 和 B,都在考虑是否要降低产品价格来吸引更多的客户。
如果 A 公司降价,而 B 公司不降价,那么 A 公司可能会获得更多的市场份额;但如果 B公司也降价,那么两家公司的利润可能都会受到影响。
在这种情况下,A 公司在做决策时就必须考虑 B 公司的可能反应,反之亦然。
这就是一种典型的商业博弈。
博弈论中有几个重要的概念。
一个是“纳什均衡”,指的是一种策略组合,在这种组合中,每个参与者的策略都是对其他参与者策略的最优反应。
也就是说,在纳什均衡状态下,任何一个参与者如果单方面改变自己的策略,都不会得到更好的结果。
另一个重要概念是“占优策略”。
如果对于某个参与者来说,无论其他参与者选择什么策略,某一种策略对他来说始终是最优的,那么这种策略就是占优策略。
博弈的类型也多种多样。
有“零和博弈”,在这种博弈中,一方的收益必然等于另一方的损失,总和为零。
比如赌博就是一种典型的零和博弈。
还有“非零和博弈”,在这种博弈中,各方的收益和损失之和不为零,可能是正和,也可能是负和。
在日常生活中,我们也经常会遇到各种各样的博弈场景。
比如在和朋友分配任务时,如何分配才能让大家都满意,同时保证任务能够高效完成,这就是一种博弈。
博弈论笔记
博弈论1.在一场博弈中,你必须考虑对方的选择,以确定你自己的最优选择,而对方也必须考虑你的选择来确定他的最优选择。
2.赢利:在博弈中所得到的。
3.博弈最本质的特征:行动及相互影响又相互依赖。
4.博弈:所谓博弈,就是策略性的互动决策。
5.弱者努力去维持一个稳定的三角结构,即于次强者联盟,但却不愿意消灭真正的强者。
6.既然是兔死狗烹,那么最好的策略就是不要让兔子全死掉。
7.博弈论的应用领域:信息经济学,其基本模型是逆向选择和信息甄别。
8.显性歧视,即根据外在特征进行歧视。
9.一个博弈至少包括三个要素:局中人,局中人可选的行动,局中人的盈利。
10.应当随时考虑别人的利益,条件是不这样做自己的利益就会受到损害。
11.优势策略与劣势策略。
如果两个人都选择其优势策略而达到的均衡称为优势策略纳什均衡。
12.搭便车行为的产生很大程度上与缺乏产权界定或产权配置的无效率有关。
13.纳什均衡:在该状态下每个参与人所采取的策略都是对于其他参与人的策略的最优反应。
14.最优反应:给定对手选定一个策略,则我选择一个策略比选择其他策略都要好。
15.相关均衡;如果博弈的参与人可以根据某个共同观测到的信号采取行动,就可能出现相关均衡。
16.分析许冠博弈的一个重要思路:向前展望,向后推理,即面向未来,思考现在,站在未来的立场上来确定现在的最优行动。
17.所谓均衡路径,即指在每一个决策阶段,没有人会偏离这条路径。
这条路径所代表的策略均衡被称作子博弈完美均衡。
18.逆向归纳的步骤:首先,从最后阶段行动的参与人决策开始考虑。
然后,考虑次后阶段行动的人。
19.博弈中,威胁和承诺是否可信,不应听对手说了什么,而应看他做了什么。
20.。
博弈论读书笔记
博弈论读书笔记博弈论,这一听起来颇为高深的学科,实际上与我们的日常生活息息相关。
通过对博弈论的学习和思考,我仿佛打开了一扇洞悉人类互动与决策的新窗口。
博弈论的核心在于研究决策主体在相互作用时的决策以及这种决策的均衡问题。
它并非仅仅是关于数学公式和复杂模型的堆砌,而是试图揭示人们在各种情境下如何做出选择,以及这些选择如何相互影响。
在博弈中,参与者的策略选择至关重要。
参与者需要考虑对手可能的行动,并据此来制定自己的最优策略。
以“囚徒困境”为例,两个犯罪嫌疑人被分别审讯,如果两人都保持沉默,那么他们可能只会受到较轻的惩罚;但如果一方坦白而另一方沉默,坦白的一方将获得从轻处罚,沉默的一方则会受到重罚。
在这种情况下,从个体角度出发,坦白似乎是最优选择,但最终的结果却是双方都坦白,从而导致了并非最优的整体结果。
这个简单的例子清晰地展示了个体理性与集体理性之间的冲突。
另一个经典的博弈模型是“斗鸡博弈”。
想象两只公鸡相向而行,如果双方都不肯退让,那么就会两败俱伤;如果一方退让,另一方前进,那么前进的一方获得胜利,退让的一方则会显得“懦弱”。
在这种情况下,双方都在揣摩对方的心思,试图预测对方的行动,以决定自己是进还是退。
博弈论中的“零和博弈”和“非零和博弈”概念也具有重要意义。
零和博弈意味着一方的收益必然等于另一方的损失,比如下棋、赌博等。
而在非零和博弈中,参与者之间有可能实现双赢或者双输的局面,比如合作创业、国际贸易等。
理解这两种博弈类型,有助于我们判断在不同情境下应采取的策略。
在现实生活中,博弈论的应用无处不在。
比如在商业竞争中,企业之间的价格战就是一种博弈。
如果一家企业降低价格以吸引更多的客户,其他企业可能会跟进降价,从而导致整个行业的利润下降。
但如果企业能够通过创新、提高产品质量等非价格手段来竞争,就有可能实现差异化,避免陷入恶性的价格博弈。
在人际关系中,博弈论也同样适用。
例如在与朋友或家人的相处中,对于资源的分配、责任的承担等问题,都存在着一定程度的博弈。
耶鲁大学公开课博弈论笔记(博弈论24讲)
博弈论作业(博弈论24讲)数应专业一、1、理性人:指代这一类人,他们只关心自己的利益。
2、如果选择a的结果严格优于b,那么就说a相对于b来说是一个严格优势策略。
结论:不要选择严格略施策略。
3、理性人的理性选择造成了次优的结果4、举例:囚徒困境、宿舍卫生打扫问题、企业打价格战等5、协和谬误收益很重要,“如欲得之,必先知之”6、要学会换位思考,站在别人的立场上看别人会怎么做,在考虑自己受益的同时,要注意别人会怎么选择二、1、打渔问题、全球气候变暖与碳排放问题2、博弈的要素:参与人、策略集合、收益3、如果策略a严格劣于策略b,那么不管他人怎么选择,b总是更好的选择4、军队的入侵与防卫问题5、所有人都从1到100中选个数字,最接近所有人选的数字的均值的2/3者为胜,这个数字是多少呢?作为理性人,每个人都会选择67(100*2/3)以下的数,进一步假设你的对手也是理性的,你会选择45(100*4/9)以下的数……依据哲学观点,如果大家都是理性程度相当的,那么最后数字将为1,然而结果却是9,这说明博弈的复杂性6、共同知识与相互知识的区别三、1、利用迭代剔除法领悟中间选民问题2、迭代剔除法就是严格下策反复消去法,不断地把劣势策略剔除出去,最后只剩下相对优势的策略3、中间选民问题就是,在两党制中,政党表述施政纲领要吸引位于中间位置的选民,他们认为在选举中处于中间标度可以吸引左右两边的选民,并以此获得胜利。
4、中间选民问题理论成立的条件是有两个参与人;政治立场能使选民相信。
5、由此延伸出来的还有加油站选址问题,两家加油站不是在不同的路口选址,而是在不确定哪个位置较佳的时候会选在同一处,这也是“中间选民定理”的凸显6、在迭代剔除法不能运用时,比如说该博弈中博弈方1和2均没有严格下策,可以用二维坐标系画出选择策略之后的收益分布四、1、罚点球:一个经过模型简化的点球模型:罚球者可以选择左路,中路,右路3种路线去踢点球,门将可以选择向左扑救或者向右扑救(门将没有傻站着不动的option)。
博弈论读书笔记
博弈论读书笔记最近读了一本关于博弈论的书,哎呀,可真是让我大开眼界!博弈论,这名字听起来挺高大上的,一开始我还以为会是那种特别枯燥、满是复杂公式和图表的书。
没想到,读进去之后,发现它其实和咱们的日常生活息息相关。
书里提到了一个特别有意思的概念——“囚徒困境”。
说的是两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里审讯。
警察告诉他们:如果两人都坦白,各判刑 8 年;如果一人坦白一人抵赖,坦白的放出去,抵赖的判刑 10 年;如果两人都抵赖,各判刑 1 年。
这可把两个嫌疑犯难住了,他们在心里开始了一场激烈的博弈。
从嫌疑犯 A 的角度想,要是 B 坦白了,我抵赖就得判 10 年,坦白就 8 年,那还是坦白好;要是B 抵赖,我坦白能被放出去,抵赖才判1 年,还是坦白划算。
所以怎么看,坦白对自己都更有利。
B 估计也是这么想的,结果两人都坦白了,各判刑 8 年。
看到这儿的时候,我就忍不住联想到了生活中的好多事儿。
比如说,我和朋友约好了一起减肥。
我们说好了互相监督,不许偷吃甜食。
可当我面对一块美味的巧克力蛋糕时,我心里就开始琢磨了:要是朋友忍住没吃,我吃了,那我能享受这一时的快乐;要是朋友没忍住吃了,我不吃多亏啊,还不如一起吃。
结果很可能就是我俩都没忍住,减肥计划泡汤。
这可不就是现实版的“囚徒困境”嘛!还有一个让我印象深刻的例子是“智猪博弈”。
假设猪圈里有一头大猪和一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮。
按一下按钮会有 10 个单位的猪食进槽,但谁按按钮就会首先付出 2 个单位的成本。
如果大猪先到槽边,大猪吃到 9 个单位,小猪只能吃到1 个单位;若同时到槽边,大猪吃7 个单位,小猪吃3 个单位;若小猪先到槽边,大猪吃 6 个单位,小猪吃 4 个单位。
那这两只猪会怎么选择呢?小猪想啊,自己去按按钮,消耗了 2 个单位,就算和大猪同时到槽边,也才吃到 3 个单位,不划算,还不如等着大猪去按。
博弈论的读书笔记
博弈论的读书笔记博弈论,一门看似高深莫测却又与我们日常生活息息相关的学问。
在接触博弈论之前,我从未想过我们在生活中的种种决策和互动,都可以用一种系统的理论来解释和分析。
当我深入研读相关的书籍后,更是被其中蕴含的智慧所折服。
博弈论的核心在于研究决策主体在相互作用时的决策以及这种决策的均衡问题。
简单来说,就是当我们在做一个决定时,不仅要考虑自身的利益,还要考虑到其他人可能做出的反应,以及这些反应会如何反过来影响我们的利益。
在博弈论中,有一个非常经典的例子——“囚徒困境”。
两个犯罪嫌疑人被警察分别审讯,如果两人都保持沉默,那么他们都只会被判处较轻的刑罚;如果一人坦白而另一人沉默,坦白的人将获得从轻处罚,而沉默的人则会受到重罚;如果两人都坦白,那么他们都会受到中等程度的处罚。
在这种情况下,从个体的角度来看,坦白似乎是最优选择,因为无论对方如何选择,坦白都能让自己的处境相对更好。
但从整体的角度来看,如果两人都保持沉默,结果会更好。
这个例子深刻地揭示了个体理性与集体理性之间的冲突。
还有一个有趣的例子是“智猪博弈”。
在一个猪圈里,一头大猪和一头小猪。
猪圈的一头有一个猪食槽,另一头安装着控制猪食供应的按钮。
按一下按钮会有 10 个单位的猪食进槽,但谁按按钮就会首先付出2 个单位的成本。
若大猪先到槽边,大猪吃到 9 个单位,小猪只能吃到1 个单位;若同时到槽边,大猪吃 7 个单位,小猪吃 3 个单位;若小猪先到槽边,大猪吃6 个单位,小猪吃4 个单位。
那么,在这种情况下,小猪选择等待,让大猪去按按钮是最优策略。
这个例子让我们看到,在某些情况下,弱者并非没有生存之道,只要善于利用形势,也能获得一定的利益。
博弈论不仅仅存在于这些简单的模型中,它在我们的现实生活中也有着广泛的应用。
比如在商业竞争中,企业之间的价格战就是一种博弈。
如果一家企业降低价格,可能会吸引更多的客户,但也会降低利润。
其他企业可能会选择跟进降价,也可能选择保持价格不变,通过提高产品质量或服务来竞争。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
活学活用博弈论威胁,承诺与序惯博弈1 要使威胁与承诺可信的方法:切断退路交出控制权切断联系建立起一致的诚实信用按顺序各个击破的威胁非理性的疯狂和精神失常。
2 重复博弈的长期性与多阶段对于背叛很有帮助。
3 可置信的问题总是使截止期限很难确定。
4 人们一旦受到伤害就很难恢复,不过如果继续与违背交往对于自己有所补偿的话,那么最好的做法就是宽恕。
但是那些被宽恕的人很可能在将来对你或者别人造成更大的伤害,所以法律对于那些伤害别人的人进行强制性制裁反而会降低对人们的伤害。
5 公司并购的毒丸:当并购者对标的公司的控股达到一定比例时,标的公司让原有股东(不包括并购者)拥有额外购股权或者发放红利给员工,以增加并购者的成本,确保自己的经营权。
6 阻止竞争对手进入的价格门槛:高于自己的成本同时低于对手的成本,让对手进入后没有利润而自己有微薄的利润。
7 连锁店悖论:第十个连锁店如果不会降价,那么第九个就不会降价,第九个不会降价,那么第八个也不会降价,如此类推:第一个连锁店也不会降价。
所以进入者不会对连锁店的降价威胁置信。
8 对于一个理性的竞争对手来说,他不会通过对你的印象来判断你所说的话,而是从你的威胁和承诺是否对于你的将来有利来判断你是否可信。
9 只关心自己的收益是否最大化,不要因为对手比自己赚的多而心生烦恼。
10 除非你选择退出游戏,否则不要考虑自己的沉没成本。
在有沉没成本的时候做的决策时考虑的成本有且只有自己的边际成本。
11 靠降价来阻止对手进入并非上策,因为价格易变。
价格竞争的危险1 要使报复有效,那么就要迅速做出反应并且采取切实的行动。
当对手相信你会全力以赴时他就会因为担心你的报复而不采取行动了。
2 采用复杂的定价策略可以有效的避免价格竞争。
3 如果采用价格竞争那么就会对服务打折,如果采用服务竞争那么就会避免价格竞争。
4 对于商家来说服务,品质,商品颜色,商标品牌都可以竞争,尽可能避免价格竞争。
但是即使没有价格竞争也会有竞争者进入从而引起价格竞争,此时对于商家来说把价格定得比较复杂可以避免价格竞争。
一次性博弈1 一次性博弈的目标也在于自己的利益最大化,不要在意对手得到多少。
2 一次性博弈时就应避免去想对手会做什么,而应该把注意力放在对手能做什么。
3 解决一次性博弈的最好办法是找出自己的严格优势策略。
所谓优势策略就是说对于自己的其他策略而言其中一个策略比较起来都会获得最大的收效或者不会比其他策略差。
4 严格劣势策略就是说比起其他策略来说获得的收效总是最小,它是严格优势策略的反面。
一次性博弈时应该考虑到对手会避免采用严格劣势策略,采用严格优势策略。
5 最优反应是指相对于对手的特定策略来说自己采用什么策略能够获得最大的收效的反应。
6 协调博弈时会有两个或两个以上对双方都有好处而且收效相当的均衡如(10,10)和(10,10),这时博弈中的人都希望你知道他会做什么以及履行自己的承诺对自己好处。
因此协调博弈的关键在于公开,诚信与信任。
7 信任博弈是指有两个均衡,其中一个比另一个的收效要大,但是收效小的那个均衡是比较安全的均衡。
也就是说自己可以采用冒险的策略得到大的收效,但是自己也有一个退路。
这时候的安全均衡也叫做有风险优势的均衡,就是说风险最小。
收益大的均衡叫做帕累托均衡。
8 对于信任博弈来说,明显的解决方法是让所有局中人都采取冒险策略。
一旦稍有怀疑冒险策略就不会是最好的解。
所以在信任博弈中,怀疑是致命的,即使是怀疑别人有怀疑之心也是会造成麻烦的。
9 协调博弈的反面就是猜硬币博弈,(猜硬币博弈中有两或两个以上的均衡,但是在每个均衡中总是对一方有利而对另一方不利。
这时局中人没有严格优势策略也没有严格劣势策略,不过拥有最优反应。
)这时对于局中的人来说,说谎是有利的,而能够摸清对手情况的竞争者会占上风。
所以在猜硬币博弈中隐藏自己的想法可以可以避免给自己造成损失。
10 对于协调博弈来说如果对手派出间谍,那么自己就要给出真实情报;对于猜硬币博弈来说,给出假情报是有利的。
11 猜硬币博弈的有效解决办法是增加自己策略的随机性的同时向有利于自己的均衡靠近。
12 斗鸡博弈也称胆小鬼博弈,博弈双方都希望对方能够采取避让策略从而使自己获利,于是就有两个均衡:(退,进),(进,退)。
在博弈中只要让对手相信自己决不后退就会获胜,所以斗鸡博弈的现实就是造成让对方相信自己决不退让的感觉13 多数博弈不会走向斗鸡博弈,只有在局中人的遭受到损害时才会走向斗鸡博弈。
比如搭便车博弈就会走向斗鸡博弈:一方工作另一方却不劳而获,这时双方都会希望避免这种情况出现。
于是双方都向对方发出自己不会工作的告诫,但是彼此又都怀疑对方说的是真的,因此结果就可能造成双方都不工作的不利后果。
对于这种现象的有效方法是分清责任。
14 斗鸡博弈的一个变种可以认为是搭便车博弈(此时博弈双方的情况是一强一弱或者一大一小):虽然一方对于自己的利益有一定的损害,但是并没有触及自己的底线,于是双方能够和平共处。
因此在博弈当中弱势一方需要特别注意对手的底线在哪里,以避免你死我活的局面出现。
15 斗鸡博弈中的打探:斗鸡博弈中如果对手知道你的策略并且你的策略是男子汉策略,那么你就应该欢迎对手来打探。
相反,如果你不欢迎对手的打探,那么对手就会对你的男子汉策略产生怀疑,于是对手就会采取男子策略,而你也可能采取同样的策略,最终造成双方都不希望出现的灾难性的后果。
16斗鸡博弈获胜的关键在于让对手相信自己会采取强硬策略,并且欢迎对手来打探(当然,即使对手不来打探你也要向对手传递自己采取强硬策略的决心,不过对手的打探比起自己单方面的传递信息效果可能更好。
)。
可是,如果你如果对手一定会硬干到底,那么自己最好的策略就是选择当个胆小鬼。
所以有时采取非理性的疯狂策略的一方在和理性一方在进行斗鸡博弈中获胜的可能性会相对比较大。
17 商战中烧钱的博弈智慧:现实中的企业可能采用烧钱战略来展示自己的男子汉策略,这是因为:这个时候博弈策略对于烧钱一方来说就分为两个部分:要不要烧钱,烧钱之后要不要当个胆小鬼。
一旦企业采取烧钱策略之后采取胆小鬼策略对于自己是个绝对愚蠢的策略,还不如不烧钱当个胆小鬼。
所以企业采取烧钱策略之后自己将别无选择,只能采取男子汉策略。
18 博弈可以根据获得利益来划分为固定和博弈与变化和博弈。
在固定和博弈中博弈双方不可能采取合作,因为彼此的利益是完全对立的,就好比两个人来分一个固定大小的蛋糕,一个人少了另一个人就必然多;而在变化和博弈中博弈双方可以采取合作态度,因为双方合作之后可以把蛋糕做的更大,之后每个人都获得更多。
19 总结:为了取胜,你自己必需了解自己的博弈环境。
不同的博弈需要不同的博弈策略,你的收益取决于局中人的利益组合。
所以在博弈之前不妨问一下自己:1)每个人是否有相同的目标?2)局中人采取欺骗我对于他们是否有利?3)博弈是固定和博弈还是变化和博弈?4)希望对手猜到我未来的行动吗?5)理智有利还是疯狂有利?大规模的协调博弈1 网络外部性:拥有一种产品的人越多,产品的价值越大。
比如电话的网络外部性就是如此,如果大家都有电话,那么你拥有一部电话对你来说是有利的,也就是说电话对你的价值越大。
2 在大规模协调博弈中,大部分人会模仿别人的策略,因此只要有一个大的有影响力的买主就会改变网络外部性。
3 大规模协调博弈决定了你的居所,大部分人都喜欢住在自己不是少数民族的地方,因此这些地方的民族结构的同一性非常高。
4 在营销网络外部性产品时,感觉就是现实。
因为如果大部分人相信你的产品会流行,那么你的就有很大的机会真的流行起来。
5 网络外部性其实就是一个赢家通吃的局面。
比如说尽管苹果的操作系统可能比微软要好的多,但是由于大部分人都使用微软的操作系统,结果苹果操作系统的市场现实中要小的多。
同在IT界的英特尔也是一样,尽管AMD的产品比起英特尔没有什么两样,但是使用英特尔的人比较多的现实造成AMD的产品尽管很有竞争力却没有多大的市场份额。
6 在参加大规模博弈的时候赔本以尽快打开销路是一个不错的选择。
纳什均衡1 纳什均衡:给定对方的选择,改变你的现行策略并不能使你获得额外收益(指如果改变策略情况可能会变得糟糕或者情况不好也不坏而中原来一样),你不会后悔你自己的选择2 如果你向新的均衡靠近,那么你就要首先明白它是不是纳什均衡,如果不是,均衡的结果是相当不稳定的,所以就会很难达到。
囚徒困境1 囚徒困境的含义在于博弈双方会由于自己的利益最大化而选择背叛。
2 军队中对于临阵脱逃者的军法从事也是一种避免出现囚徒困境的办法3 囚徒困境的形式:公用地悲剧核困境价格战有明确次数的博弈4 形成无限次博弈的重复博弈预期也是一个打破囚徒困境的不错选择。
5 妒忌是造成困境的一个重要因素6 针锋相对的策略在现实中是一个不错的防止背叛的策略。
7 采用有效的合同可以有效的避免出现囚徒困境8 一报还一报,让对手知道你是一个有仇必报的人,由于担心你的报复,对手采取合作的态度的可能性会大大增加9 管理听实践当中采取相对表现的评价机制是一个糟糕的选择,因为在职场当中人们面临的是一个长期的重复博弈,而集体懒惰是一个优势策略。
所以最好的办法就是制定出一个比较客观的奖罚标准,而不是根据自己的主观看法来决定赏罚。
10 最惠待遇意味着你给予客户的待遇不会比别人差,如果你对每个人都采取这样的策略,由于没有动机给个别人更好的优惠,那么你就成功避免了价格竞争的困境。
11 在一次性的博弈时你如果采取合作的态度,那就得让对手相信你能够看出对手会背叛,而对于背叛的行为你会给予严厉的惩罚。
逆向选择1 逆向选择当你做出选择,希望出现的结果没有出现而不希望的结果出现时就目是逆向选择。
所谓“逆向选择”应该定义为信息不对称所造成市场资源配置扭曲的现象。
经常存在于二手市场、保险市场。
虽然“逆向选择”的含义与信息不对称和机会主义行为有关,却超出了这两者所能够涵盖的范围之外,“逆向选择”是制度安排不合理所造成市场资源配置效率扭曲的现象,而不是任何一个市场参与方的事前选择。
2 逆向选择的原因通常有:信息不对称,门槛机制,多级委托和多重委托,相对评价机制。
3 对于门槛来说,达到或者超出标准的人可来也可不来,那些达不到标准的人则会着急来,并且会很多。
比如对于保险公司来说保费提高时那些达到保费标准的健康人可能不会来,相反那些健康状况比较差的人却会来。
所以对于那些过分表现出热心的人要小心,那很可能不是你想要的人。
4 信息不对称状况的典型表现则是二手市场,由于不清楚二手货的质量人们会选择掉头就走,这是因为人的心理是厌恶损失从而逃避风险的。
即使你愿意出价你也只出很低的价格,对于差的二手货当然价格会低,好的二手货当然不会是这个价同时人们也不会卖,这一点你是很明白的,同时卖主也明白这一点;所以二手市场的货物当然不是什么好货,还不如多花一些钱买个新。