数学建模讲座之博弈论(一)
博弈论PPT课件

这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
博弈论完整版PPT课件

2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
数学建模博弈模型

博弈模型在实际问题中的应用前景
政策制定
01
利用博弈模型分析政策制定中的利益关系和策略选择,为政策
制定提供科学依据。
企业竞争策略
02
利用博弈模型分析企业竞争中的策略选择和预期行为,为企业
制定合理的竞争策略。
国际关系
03
利用博弈模型分析国际关系中的利益关系和冲突解决机制,为
国际关系管理提供理论支持。
THANKS
猎鹿博弈
总结词
描述两个猎人合作与竞争的关系,揭示了合作与背叛的平衡。
详细描述
在猎鹿博弈中,两个猎人一起打猎,猎物可以平分。如果一个猎人选择合作而另一个选择背叛,则背叛者可以独 吞猎物。但如果两个猎人都不合作,则都没有猎物可吃。最佳策略是合作,但个体理性可能导致两个猎人都不合 作,造成双输的结果。
03
智猪博弈
总结词
描述大猪与小猪在食槽竞争中的策略,揭示了合作与竞 争的平衡。
详细描述
在智猪博弈中,一个大猪和一个小猪共同生活在一个猪 圈里。每天都有一桶食物放在食槽中,大猪和小猪需要 竞争才能吃到食物。如果大猪和小猪同时到达食槽,大 猪会因为体型优势占据更多食物。但如果小猪先到食槽 等待,大猪到来时已经没有食物可吃。最佳策略是小猪 等待,大猪先吃,然后小猪再吃剩下的食物。
博弈模型的基本要素
参与者
在博弈中作出决策和行动的个体或组织。
策略
参与者为达到目标而采取的行动或决策。
支付
参与者从博弈中获得的收益或损失。
均衡
在博弈中,当所有参与者都选择最优策略时,达到的一种稳定状态。
博弈模型的建立过程
策略空间
确定每个参与者的所有可能采 取的策略。
均衡分析
通过分析收益函数和策略空间 ,找出博弈的均衡点。
博弈论讲义完整PPT课件

如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页
博弈论的数学模型

博弈论的数学模型作者:竺可桢学院01混合班王大方何霈邹铭摘要博弈论现在得到了广泛的应用,涉及到人的决策问题都可以用博弈论的模型加以解释。
本文首先用数学的方法表述实际生活中的博弈行为,并导出一般情况下的博弈的结果,进而讨论一些不同的外部约束条件对博弈过程的影响。
我们用经济学中的垄断竞争现象作为博弈问题的一个实例,讨论生产者在不同状态下的决策,进而分析双方共谋的动机和可能性。
(一)基本博弈模型的建立一, 博弈行为的表述博弈的标准式包括:1.1.博弈的参与者。
2.2.每一个参与者可供选择的战略集。
3.3.针对所有参与者可能选择的战略组合,每一个参与者获得的利益在n人博弈中,用Si为参与者i的可以选择战略空间,其中任意一个特定的纯战略为s i,其中任意特定的纯战略为s i,s i∈Si,n元函数u i(s1,s2,……s n), 当n个博弈者的决策为s1,s2,……s n时,表示第I各参与者的收益函数。
二, 博弈的解当博弈进入一个稳定状态时,参与者选择的战略必然是针对其他参与者既定战略的最优反应,在此状态下没有人愿意单独背离当前的局势。
这个局势叫纳什均衡:在n个参与者标准式博弈,G={ S1,S2,……S n;u1,u2,……u n}中,若战略组合{s1*,s2*,……s n*}满足对每一个参与者i,s i*是针对{ s1*,s2*,……s i-1*,s i+1*……s n*}的最优反应战略,,目标战略组合{s1*,s2*,……s n*}为该博弈的纳什均衡。
即:u i { s1*,s2*,……s i-1*,s i*,s i+1*……s n*}≥u i { s1*,s2*,……s i-1*,s i,s i+1*……s n*},对一切s i∈Si均成立。
纳什于1950年证明在任何有限个参与者,且每个参与者可选择的纯战略为有限个的博弈中,均存在纳什均衡。
(包括混合战略)混合战略指认某种概率分布来取一个战略空间中的战略,在本文中不加讨论。
北京大学博弈论课件第1章-博弈论概述

两人在校门口集合,一起逛博物馆
❖ 博弈策略和结果
两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过
❖ 博弈双方策略相互依赖,不独立。
其他博弈实例
❖ 棋类比赛:象棋、围棋等。古人“对弈”。 ❖ 寡头市场:
❖ 2.非合作博弈(Non-cooperative games),纳什就读于普林斯 顿大学数学系的博士毕业论文,1950年。
❖ 3.讨价还价问题(The bargaining problem)。计量经济学杂志 (Econometrica)18: 155 – 162,1950年。
❖ 4.非合作博弈(Non-cooperative games)数学年报(Annals of Mathematics),54: 286 – 295,1951年。
❖ 5.两人合作博弈(Two-person cooperative games)。计量经 济学杂志(Econometrica),21: 128 – 140,1951年。
本章小结
❖ 本章给出了博弈的基本定义 ❖ 通过现实实例分析了博弈的基本内涵和主要思想 ❖ “囚徒困境”是博弈理论中的经典案例 ❖ 博弈的构成要素主要包括:
20 世纪 70 年代,约翰 ·海萨尼(John Harsanyi)和莱因 哈德 ·泽尔腾(Reinhard Selten)等将不完全信息理论融入 到博弈论的研究中。
20 世纪 90 年代之后,博弈论作为一种方法被普遍运用到经济 学、政治学、生物学、军事学、统计学等领域中。
博弈理论已成为当代经济学理论不可分割的重要组成部分。
博弈论概述 POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
博弈论最全完整ppt 讲解

完全信息
纳什均衡(NE)
子博弈完美纳什 均衡(SPNE)
不完全信息
贝氏纳什均衡 (BNE)
完美贝氏纳什均衡 (PBNE)及序贯均 衡(SE)
静态博弈与动态博弈
(static games and dynamic games)
同时决策或者同时行动的博弈属于静态 博弈;先后或序贯决策或者行动的博弈, 属于动态博弈
如果一个博弈在所有各种对局下全体参 与人之得益总和总是保持为一个常数, 这个博弈就叫常和博弈;
相反,如果一个博弈在所有各种对局下 全体参与人之得益总和不总是保持为一 个常数,这个博弈就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
导论
四、主要参考文献
博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
如何在“博弈”中获胜?
日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。 策略是为了获胜所需要的一种智力的技巧。
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英国
2001年诺贝尔经济学奖获得者
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进 行分析”领域做出了重要贡献。
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
博弈论最全完整-讲解课件

• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
数学建模博弈论

博弈论的概念博弈论又被称为对策论(Games Theory),是研究具有斗争或竞争性质现象的理论和方法,它既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博弈论是个非常重要的理论概念。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的的学科。
博弈论的基本概念博弈要素(1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
(2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
(3)得失:一局博弈结局时的结果称为得失。
每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。
数学建模优秀讲座课件之博弈论

,
Page 20
囚徒困境可以用来说明许多现象。
• 广告战
两个公司互相竞争,二公司的广告互相影响,即一 公司的广告较被顾客接受则会夺取对方的部分收入。但 若二者同时期发出质量类似的广告,收入增加很少但成 本增加。但若不提高广告质量,生意又会被对方夺走。
此二公司可以有二选择:
互相达成协议,减少广告的开支。(合作)
Page 14
纳什均衡的定义
• 纳什均衡简单说就是,一策略组合中,所有的参与 者面临这样的一种情况:当其他人不改变策略时, 他此时的策略是最好的。也就是说,此时如果他改 变策略,他的支付将会降低。 在纳什均衡点上,每一个理性的参与者都不会有单 独改变策略的冲动。
Page 15
•寻找纳什均衡的方法———条件策略下画线法
Page 17
假设有两个小偷A和B联合犯事、私入民宅 被警察抓住。警方将两人分别置于不同的两个 房间内进行审讯,对每一个犯罪嫌疑人,警方 给出的政策是:如果两个犯罪嫌疑人都坦白了 罪行,交出了赃物,于是证据确凿,两人都被 判有罪,各被判刑8年;如果只有一个犯罪嫌 疑人坦白,另一个人没有坦白而是抵赖,则以 妨碍公务罪(因已有证据表明其有罪)再加刑 2年,而坦白者有功被减刑8年,立即释放。如 果两人都抵赖,则警方因证据不足不能判两人 的偷窃罪,但可以私入民宅的罪名将两人各判 入狱1年。
-3y+2(1-y)=2y+(-1)*(1-y)
解的:
y=3/8,
而美女每次的期望收益则是2(1-y)-3y=1/8元。
Page 28
由以上结果可知,在双方都采取最优策略的情 况下,平均每次美女赢1/8元。其实只要美女采取 了(3/8,5/8)这个方案,不论你再采用什么方案,都 是不能改变局面的。
数模-博弈论

• 从应用数学的发展趋势来说,应用数学正迅速地从 传统的应用数学进入现代应用数学的阶段。现代应 用数学的一个突出的标志是应用范围的空前扩展, 从传统的力学、物理等领域扩展到生物、化学、经 济。金融、信息、材料、环境、能源……等各个学 科和种种高科技乃至社会领域。传统应用数学领域 的数学模型大都是清楚的,且已经是力学、物理等 学科的重要内容,而很多新领域的规律仍不清楚, 数学建模面临实质性的困难。因此,数学建模不仅 凸现出其重要性,而且已成为现代应用数学的一个 重要组成部分。同学们接受数学建模的训练,和你 们学习数学知识一样,对于今后用数学方法解决种 种实际问题,是一个必要的训练和准备,这是你们 成为社会需要的优秀人才必不可少的能力和素养。
怎样撰写数学建模的论文? 1、摘要:问题、模型、方法、结果 2、问题重述 3、模型假设 4、分析与建立模型 5、模型求解 6、模型检验 7、模型推广 8、参考文献 9、附录
实例
返回
博弈模型
第一部分、博弈论基本概念
一、引言
宇宙间处处存在矛盾、冲突、争斗、合作、共生等 现象,这些现象很很早就引起各类学者的重视。哲学家 们对此作过深刻讨论,毛泽东的《矛盾论》便是其中的 代表。另一方面,数学被认为是科学的语言,能否用数 学语言描述各种带有矛盾因素的模型或现象?博弈论便 是这样一种处理各类带有矛盾因素的模型的数学工具, 现在已被数学、经济学、社会学、军事学、生物学等专 家广泛应用于讨论各类带有冲突、矛盾、合作、竞争、 进化等问题及相关模型之中。博弈论已成为人们分析复 杂系统与作重大决策时的有力工具。
2、什么是数学建模?
数学建模是利用数学方法解决实际问题的一种 实践。即通过抽象、简化、假设、引进变量等处 理过程后,将实际问题用数学方式表达,建立起 数学模型,然后运用先进的数学方法及计算机技 术进行求解。
数学建模博弈论

数学建模博弈论在前一讲中,我们讨论了决策论,其中决策者面对的结果和支付只依赖于他本人的决策,而不依赖一个或者多个其他参与者的决策。
决策论最后决定的结果可能存在机会和风险,但不会与另一个参与者的决策有关系。
比如假定两个国家在军备竞赛而希望裁军,如果一方裁军,这个国家的结果不仅依赖于该国的决策,也依赖于第二个国家的决策。
如果只依赖于一个参与者,我们把这类决策模型称为决策论;如果结果依赖于多于一个参与者的决策,我们把这类决策模型称为博弈论;10.1:博弈论:完全冲突:按照参与者之间的冲突是完全冲突还是部分冲突对博弈论进行分类。
进一步把完全冲突的博弈按照最优策略是纯策略还是混合策略进行分类。
举例1:一个有纯策略的完全冲突博弈:例如有两家连锁店,都同时想在两个城市开连锁店,假设为A,B两地,如图所示是两个连锁店所占的市场份额:从上图可以发现两家连锁店其中一家每得到一点份额都是需要另一家失去一点份额,而市场总额是1,并且两家连锁店的决策结果不仅取决于自身还取决与对手的策略。
这个博弈是完全冲突的。
定义:纯策略是参与者可采取的行动的集合,每个参与者选定的策略共同决定博弈的结果以及每个参与者的花费。
通过图中数据我们也可以发现,无论甲连锁店开在何处,乙连锁店只需要开在A地就可以始终占优。
占优策略:定义:策略A占优与策略B,是指策略A的每一个结果至少和B的对应结果一样好,并且至少A的某一个结果严格优于B的对应结果。
占优原理:在严格冲突博弈中,一个理性的参与者应该永远不要采用被占优的策略。
同时也可以发现结果(A,A)即两个连锁店都开在A地时,此时没有任何一个参与者可以单方面改变策略而使得自己获得改善,这种情况我们称为纳什均衡:表示这样一个结果,任何一个参与者都不能通过单方面更改策略而获得好处。
同时由于这些每个结果和是1,完全冲突博弈也称作常数和博弈:如果对每一个可能的结果,每个参与者的支付之和是同一个常数,这个博弈称为完全冲突博弈。
博弈模型-数模

* * * s s ( s , s 优战略是 =坦白。因此,囚徒困境问题的解是 1 2 ) =(坦白,坦白)。
* 2
注释:这正是囚徒困境的“困境”两个字的体现,如果用经济学中的“有效” 的术语的意思来讲,(沉默,沉默)是一个有效结局。有效结局并不是囚 徒问题的博弈解。这体现了个人利益和全体利益的矛盾。
现在,让我们试问一下,这个传教徒告诉了这些丈夫们他们所不知 道的什么?每个丈夫都已经知道了99个不贞的妻子,故这对任何人来 说都不是新闻。但“这个传教徒对所有男人做了一个声明”是共同知 识,从而这个传教徒所声明的内容,即有一个不贞的妻子,也就成了 所有男人中间的共同知识。在传教徒宣告之前,每个形如“(每个丈 夫知道)有一个不贞的妻子”的判断对于99都是正确的,但对100就 不正确了。
(3)收益函数
在博弈论中,收益指的是在一个特定的战略组合下参与者得到的确定效 用或期望效用。效用通常表现为博弈结果中输赢、得失、盈亏。效用必 须能用数值刻画其大小。收益是博弈参与者真正关心的问题 。 注释:博弈论的一个基本特征是一个参与者的收益不仅取决于自己的战略选 择,而且取决于所有参与者的战略选择。或者说,收益是所有参与者各选 定一个战略形成的战略组合的函数。 在博弈论中,通常用ui表示参与者i的收益,一个战略组合是,每个参与者 的收益可以表示为
* * * * s ( s , , s , , s 的解,则战略组合 1 i n ) 称为博弈 G 的一个解或纳什均
衡。
注释:研究博弈问题就是建立博弈模型,求解博弈的纳什均衡,下面我们用实例来说明我们的理论及应用
信息
博弈论与数学模型PPT教案

对两人非零和有限博弈,双方收益需用两个矩阵表示,称为双矩 阵博弈(bimatrix game)。
1960年,Lemke和Howson给出了求解双矩阵博弈解的算法,但该 算法是指数时间的。
第22页/共67页
John Forbes Nash
EconomicBehavior》出版,这是博弈论正式形成的标志。 Princeton Press,1944
第2页/共67页
博弈论的发展简史
1950-1953年,Nash先后发表四篇论文,提出了Nash均衡,讨价还 价等一系列重要概念。
二十世纪六七十年代起,经济学、社会学和生物学领域开始大量 应用博弈论,并逐渐在经济学界取得重要地位。
• 1994年,三位博弈论研究者Nash,Harsanyi,Selten获诺贝尔经 济学奖,博弈论开始走入大众视野。
第3页/共67页
博弈的要素
参与者(player) :参与博弈的决策主体。 行动(actions):参与者可以采取的行动(策略)方案的全体;
所有参与者采取各自的行动后形成的状态称为局势(outcome)。 收益(payoff):各个参与者在不同局势下获得的利益。 规则(rule):对参与者行动的先后顺序、参与者获知信息的多少
第41页/共67页
Hotelling 模型
第42页/共67页
最优反应函数
第43页/共67页
Nash均衡
(1/2,1/2)是Nash均衡,两家快餐店开在同一 地点,平分所有的客源。
该模型可推广为居民住址服从任意连续分 布的情形。若分布的中位数m为,则Nash 均衡为(m,m)。
第44页/共67页
数学建模博弈模型

λ↑,报童利润↑ ,报社利润↓ 利润的任意分配比例都可达到
回收协议模型
模型一 回收价格协议 回收价b (p>w>b>v) 整体最优
pw F (Qr ) p b
原订货量
pw F (Qr ) pv
pc F (Q ) pv
*
达到协调
pc pw p v p b
cv w wb (b) b ( p b) pv
• 双方总能成交吗?(效率估计)
模型假设与建立
• 卖方知道物品对自己的价值,但买方不知道. • 买方知道物品对自己的价值,但卖方不知道. • 双方都知道(如猜出)对方价值的分布信息. 卖方价值vs, 买方价值vb, 均服从 [0,1] 上的均匀分布
卖方报价ps, 买方报价pb, pb ≥ ps时成交价p= (pb+ps)/2 成交效用:卖方U1=p- vs, 买方U2= vb –p; 不成交: 0
0 0
xF ( x) |0 F ( x)dx Q (1 F (Q )) Q F ( x)dx
期望存货量
I (Q) Q S (Q) F ( x)dx
0
Q
期望利润 G(Q) pS(Q) vI (Q) wQ ( p v)S (Q) (w v)Q 最优订购量Qr
pc 假设报社与报童联合,整体利润最大 F (Q ) pv pw *>c Q (w*) <Q* F (Qr ) 一般w r pv 整体利润有损失 能否改善(协调)?
*
价格折扣协议模型
折扣方案wd(Q) 下,报童效用(期望利润)
U r ( wd (Q)) ( p v)S (Q) ( wd (Q) v)Q
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(五)最大最小策略
不管其他决策者如何做,确保在可能 的最坏结果中得到最好的结果。——风险 厌恶型策略
企业2
无新产品 有新产品 企业1最小
无新产品 4,4
3,6
3
企业1 有新产品
6,3
2,2
2
企业2最小 3
2
纳什均衡:3,6 或6,3 该策略均衡 4,4
(六)混合策略
当不存在纯策略时,不等于局中人就不进
中石油面临的市场需求为:
Q-1/4Q=3/4Q
P
G
P1
D=f(P)
MR
中石油O 的决策为Q1:
Q
生产1/2*3/4Q需求=3/8Q的石油;
由1/2Q到3/8Q产量减少了1/8Q
中石化面临的市场需求为:
1- 3/8Q =5/8Q
P
D=f(P)
MR
F
P2
O
中石化的决策为:
Q2
Q
生产1/2* 5/8Q需求=5/16Q的石油;
(一)占优策略(上策dominant stratege)
无论其他博弈者采用何种策略,该博弈者 的策略总是最好的。
(二)占优均衡(dominant equilibrium )
在两个博弈者都采用占优策略时,称这种结果为 占优均衡。
支付矩阵
一个 单元
B
正常价格
低价格
正常价格 C $10 $10 E -$10 -$100 A
解决的问题:请你用博弈论的观点帮助两家巨头 分析一下,两家公司如何决策会使得各自的收益 最大
P D=f(P)
P1
F
MR
O
Q1
Q
中石油的决策为: 生产1/2Q需求的石油;
中石化面临的市场需求为: Q- 1/2Q需求=1/2Q
P D=f(P)
MR
P2
G H
中石化的O 决策为:
Q2
Q
生产1/2*1/2Q=1/4Q需求的石油;
由1/4Q到5/16Q产量增加了1/16Q
中石油面临的市场需求为:
1- 5/16Q =11/16Q
博弈结果
中石油的均衡产量为: Q(1/2―1/8―1/32―……)=1/3 Q
中石化的均衡产量为: Q(1/4+1/16+1/64+……)=1/3 Q
行业的均衡总产量为: 1/3 Q+1/3 Q=2/3 Q
博 弈 论(Game Theory)
博弈论主讲内容
对博弈论的认识 完全静态博弈 博弈论几个经典例子 博弈论的应用(寡头垄断模型)
长街上的超市
细心的我们肯定会发现在不少的街上一些超市似乎总“喜欢” 拥挤在一起。有人指责这属于“资源浪费”现象,因为他们在 想,如果把超市均匀的设在长街各处,无疑对远离中心的居 民提供极大的方便。 为什么会出现这种拥挤的现象呢?
非合作性均衡 1. 一个纳什均衡 2. 二个纳什均衡 3. 没有纳什均衡
一个纳什均衡
高价格
B 正常价格
高价格 C $100 $200 E -$20 $150
A
正常价格 D $150 -$30 F $10 $10
A占优策略,B没有—— 一个纳什均衡
两个纳什均衡
U 局中人1
D
局中人2
L
R
9,9
0,8
结论:当中石油和中石化的产量均为市场总 需求的1/3时,两个石油公司的收益最大
与博弈论相关的赛题
2010年国际赛B题——预测犯罪 地点 2010年东三省A题——企业的营 销管理问题
(一)利润最大化的决策原则
1. 数学证明
T TR TC dT dTR dTC
dQ dQ dQ
Tπ:总利润 TC:总成本 TR:总收益
dT 0时,利润最大,从而有
dQ
MR MC MR:边际收益 MC:边际成本
利润最大化条件:MR=MC即当MR=MC=0时厂 商的利润最大,当MR=0时,厂商的利润达到最 大。
一 博弈概述
(一)指导思想
在一定时间内,事物之 间矛盾的对立和统一性, 推动事物达到一种良好 的状态。即假设你现在 正面对着你的对手或你 的合作伙伴,你怎样做 才能达到你的利益最大 化。
一 博弈概述
(二)博弈论概念
博弈即一些理性个人、团队或者是组织,面对一
定的环境条件,在一定的规则下,同时或者先后,
个单位;若小猪先到,大猪吃6个单位,小猪吃4
个单位。
表 3 智猪博弈支付矩阵
小猪
按
等待
大按
5, 1
4, 4
猪 等待 9, -1
0, 0
(四)寡头垄断模型
1、假设: (1)两个厂商生产同样的产品,知道市 场需求总量并且需求曲线是线性的。 (2)两厂商都是在已知对方产量的情况 下,各自确定能够给自己带来最大利润的 产量。 (3)边际成本MC=0
二 博弈的分类
博弈的分类和均衡
信息次序
静态
动态
信息
完全信息
纳什均衡 纳什
子博弈精练纳什 均衡
泽尔腾
不完全信息
贝叶斯均衡 海萨尼
精炼贝叶斯均衡 泽尔腾等
三 完全信息静态博弈
所谓完全信息静态博弈指的是各博弈方 同时决策,或者决策行动虽有先后, 但后行动者不知道先行动者的具体行 动是什么且各博弈方对博弈中各种策 略组合情况下所有参与人相应的得益 都完全了解的博弈。
(二)收益函数
1. 总收益TR 企业售出产品的价格(P)与数量(Q)的乘积。
TR=P Q 如果 P=a-bQ 则 TR=P Q
=(a- bQ)Q = a Q- bQ^2
2. 平均收益AR
平均每件产品给企业带来的销售收入, 是企业在一定产量水平上售出的产品的市 场价格。
AR TR aQ bQ2 a bQ =P
不坦白 D -8
-5 E -1 -8
-1 F -2
-2
例二,智猪博弈
猪圈里圈两头猪,一头大猪,一头小猪。猪
圈的一头有一个猪食槽,另一头安装一个安钮,
控制着猪食的供应。按一下按钮会有10单位的猪
食进槽。但谁按按钮谁就需要支付2个单位的成
本。若大猪先到,大猪吃到9个单位,小猪只能
吃1个单位;同时到,大猪吃7个单位,小猪吃3
Q
Q
3. 边际收益MR 增加一件产品给企业带来的销售收入增
加量
MR dTR a 2bQ dQ
P
O a/2b
a/b
Q
MR
MR=0时的产量是当时市场总需求产量的一半, 所以厂商都会把产量定在1/2*Q需求
(三)双寡头模型(duopoly model)
中石油和中石化是我国石油行业的两大巨头, 现已将中国的石油资源全部垄断。那么如果这两 个厂商不考虑市场需求只想着我多卖多赚钱,从 而盲目生产,这样不仅不能获得最大得益还有可 能为负值。那么在什么时候这两个厂商才能不打 价格战使收益最大呢?
2
期望盈利为:
u1( 1, 2)
1 (0 3
4
Hale Waihona Puke 1 251 2
6)
(局中人1取U时的期望盈利( 1 U))
(六)混合策略
1 (0 2 1 8 1 3)
3
2
2
(局中人1取M时的期望盈利( 1 M))
1 (0 3 1 9 1 2)
3
2
2
(局中人1取D时的期望盈利(1 D))
11
8,0
7,7
局中人1、2都没有占优策略——存在两个纳什 均衡
没有纳什均衡
上 A
下
B
左
右
00
0
-1
10
-1
3
(四)被支配策略
不管别的决策者如何决策,某策略的收益 比其他一些策略收益都低。——排除法 橄榄球:
防守策略
拦截带球 撤回线卫 突袭
进攻 带球
2
策略 传球
8
6
14
7
10
突袭是最差的决策——排除
决策主体(可以是个人,也可以是团体);
2.得益:参与人在博弈结束后从博弈中获得的效
用,一般是所有参与人的策略或行动的函数,这 是每个参与人最关心的东西;(在混合策略中为 期望盈利)
3.信息:参与人在博弈中所知道的关于自己以及
其他参与人的行动、策略及其得益函数等知识;
一博弈概述
4.策略:指参与人选择行动的规则,即在博弈进程
U 4,3 5, 1 6,2
局中人1 M 2 , 1 D
3,0
8, 4 3,6 9, 6 2,8
(六)混合策略
若局中人1的混合策略取为
(
1
(U
),
1
(M
)
1
(
D))
(
1 3
,
1 3
,
1) 3
而局中人2的混合策略取为
(
2
(L),
2
(M
),
2
(
R))
(0,
1 2
,
1 2
)
那么在混合策略剖面(
1,
)下局中人1的
6
(六)混合策略
类似地,我们可以求得该情况下局中人2的 期望盈利为:
u2
(
1
,
2)
0
1 2
(
1 3
1
1 3
4
1 3
6)
1 (1 2 1 6 1 8) 27
23 3 3
6
三、博弈论中几个著名的例子
例一,囚徒困境(prisoners’ dilemma)
囚犯B
坦白
不坦白
囚犯A
坦白 C -5
一次或者多次,从各自允许选择的行为或者策略