数学建模博弈模型
数学建模第十讲博弈模型演示教学
显然, Hi(s)是局势s的函数,称之为第i局中人的 赢得函数。
10.1 二人零和对策
1﹒二人有限零和对策: 是指有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择,在任一局势 下,两个局中人的赢得之和总等于零。
数学建模第十讲博弈模型
问题二:囚徒困境
甲乙两个嫌疑犯因同一罪行被逮捕,如果双方均 坦白,则各获刑3年,如果双方均不坦白,则各获刑 2年,如果其中一人坦白,另一人不坦白,则坦白一 方宽大释放,另一方获刑5年,两个嫌疑犯各自应采 取什么策略才能使自己的刑期最短。
问题分析:问题中所涉及的要素
(1)决定者—甲、乙嫌疑犯两人; (2)可用的决定—坦白、不坦白;
的完整的行动方案,称为一个策略。设i为局中人,i 的所有策略构成的集合Si称为i的策略集。
3﹒赢得函数(支付函数)
局势: 在一局对策中,各局中人所选定的策略形 成的策略组称为一个局势。即若设si是第i个局中人的 一个策略,则n个局中人的策略组s={s1, s2,…, sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔 乘积表示,即S=S1× S2×… × Sn
因此局中人Ⅱ的策略应为β 2 。 总之,局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ,β 2。
4﹒矩阵对策的解 定义1 设G={S1 , S2;A}为矩阵对策,其中
S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , A= (aij)m×n
若等式
max
i
min
j
aij=minj
am1 am2 …amn 局中人Ⅱ的赢得矩阵为﹣A。
数学建模博弈模型
博弈模型在实际问题中的应用前景
政策制定
01
利用博弈模型分析政策制定中的利益关系和策略选择,为政策
制定提供科学依据。
企业竞争策略
02
利用博弈模型分析企业竞争中的策略选择和预期行为,为企业
制定合理的竞争策略。
国际关系
03
利用博弈模型分析国际关系中的利益关系和冲突解决机制,为
国际关系管理提供理论支持。
THANKS
猎鹿博弈
总结词
描述两个猎人合作与竞争的关系,揭示了合作与背叛的平衡。
详细描述
在猎鹿博弈中,两个猎人一起打猎,猎物可以平分。如果一个猎人选择合作而另一个选择背叛,则背叛者可以独 吞猎物。但如果两个猎人都不合作,则都没有猎物可吃。最佳策略是合作,但个体理性可能导致两个猎人都不合 作,造成双输的结果。
03
智猪博弈
总结词
描述大猪与小猪在食槽竞争中的策略,揭示了合作与竞 争的平衡。
详细描述
在智猪博弈中,一个大猪和一个小猪共同生活在一个猪 圈里。每天都有一桶食物放在食槽中,大猪和小猪需要 竞争才能吃到食物。如果大猪和小猪同时到达食槽,大 猪会因为体型优势占据更多食物。但如果小猪先到食槽 等待,大猪到来时已经没有食物可吃。最佳策略是小猪 等待,大猪先吃,然后小猪再吃剩下的食物。
博弈模型的基本要素
参与者
在博弈中作出决策和行动的个体或组织。
策略
参与者为达到目标而采取的行动或决策。
支付
参与者从博弈中获得的收益或损失。
均衡
在博弈中,当所有参与者都选择最优策略时,达到的一种稳定状态。
博弈模型的建立过程
策略空间
确定每个参与者的所有可能采 取的策略。
均衡分析
通过分析收益函数和策略空间 ,找出博弈的均衡点。
bertrand博弈模型
bertrand博弈模型
摘要:
1.简介
2.博弈模型的基本概念
3.bertrand 博弈模型的特点
4.bertrand 博弈模型的应用
5.我国对bertand 博弈模型的研究
6.结论
正文:
博弈论是研究决策制定和结果影响的数学理论。
在博弈论中,博弈模型是一种理论工具,用于描述参与者在特定情况下做出的决策。
bertrand 博弈模型是博弈模型中的一种,被广泛应用于经济学、社会学等领域。
2.博弈模型的基本概念
博弈模型是一种理论工具,用于描述决策者在特定情况下做出的决策。
在博弈模型中,决策者被称为“玩家”,每个玩家都有多个可选策略。
玩家的目标是最大化自己的利益,而游戏的结果是由所有玩家的策略决定的。
3.bertrand 博弈模型的特点
bertrand 博弈模型是一种特殊的博弈模型,它的特点是每个玩家都有一定的生产成本,并且每个玩家都可以选择生产数量。
在bertrand 博弈模型中,玩家的目标是最大化自己的利润,而游戏的结果是由所有玩家的生产决策决定的。
4.bertrand 博弈模型的应用
bertrand 博弈模型被广泛应用于经济学、社会学等领域。
例如,它可以用于研究市场竞争、价格制定、政策制定等问题。
5.我国对bertand 博弈模型的研究
我国对bertrand 博弈模型的研究主要集中在经济学领域。
学者们利用bertrand 博弈模型研究了市场竞争、价格制定等问题,并提出了一些有价值的结论。
6.结论
bertrand 博弈模型是一种重要的博弈模型,被广泛应用于经济学、社会学等领域。
数学建模博弈模型
λ↑,报童利润↑ ,报社利润↓ 利润的任意分配比例都可达到
回收协议模型
模型一 回收价格协议 回收价b (p>w>b>v) 整体最优
pw F (Qr ) p b
原订货量
pw F (Qr ) pv
pc F (Q ) pv
*
达到协调
pc pw p v p b
cv w wb (b) b ( p b) pv
• 双方总能成交吗?(效率估计)
模型假设与建立
• 卖方知道物品对自己的价值,但买方不知道. • 买方知道物品对自己的价值,但卖方不知道. • 双方都知道(如猜出)对方价值的分布信息. 卖方价值vs, 买方价值vb, 均服从 [0,1] 上的均匀分布
卖方报价ps, 买方报价pb, pb ≥ ps时成交价p= (pb+ps)/2 成交效用:卖方U1=p- vs, 买方U2= vb –p; 不成交: 0
0 0
xF ( x) |0 F ( x)dx Q (1 F (Q )) Q F ( x)dx
期望存货量
I (Q) Q S (Q) F ( x)dx
0
Q
期望利润 G(Q) pS(Q) vI (Q) wQ ( p v)S (Q) (w v)Q 最优订购量Qr
pc 假设报社与报童联合,整体利润最大 F (Q ) pv pw *>c Q (w*) <Q* F (Qr ) 一般w r pv 整体利润有损失 能否改善(协调)?
*
价格折扣协议模型
折扣方案wd(Q) 下,报童效用(期望利润)
U r ( wd (Q)) ( p v)S (Q) ( wd (Q) v)Q
博弈模型的结果解释_解释说明以及概述
博弈模型的结果解释解释说明以及概述1. 引言1.1 概述博弈模型是研究不同决策者在特定情境中进行策略选择的数学框架,它广泛应用于经济学、社会科学以及其他相关领域。
通过分析各方的利益和行为方式,博弈模型可以帮助我们理解决策者之间的相互作用和最终结果。
本文旨在探讨博弈模型的结果解释,即如何对博弈模型得出的结果进行解读与说明。
通过深入研究博弈模型,我们可以更好地理解其运作机制,并从中获得有价值的见解。
1.2 文章结构本文主要包括以下几个部分:引言、博弈模型的结果解释、解释说明以及概述、结论和参考文献。
在引言部分,我们将首先对博弈模型进行概述,介绍其基本原理和应用领域。
随后,我们会详细阐述本文的目的和主要内容,并提供一个全面的文章结构框架。
1.3 目的本文旨在探讨博弈模型的结果解释方法和技巧,并提供一些实例分析。
通过这样做,我们希望能够帮助读者更好地理解博弈模型的结果,以及如何有效地解释和说明这些结果。
在深入探讨解释说明的重要性和方法技巧之后,我们将进一步介绍如何汇总和概述研究结果。
最后,我们将总结本文的主要发现和贡献,并展望博弈模型结果解释领域未来的研究方向。
通过本文的阐述与探讨,读者将能够更好地应用博弈模型,并准确地解释和说明其得出的结果。
2. 博弈模型的结果解释:2.1 博弈模型介绍:在博弈论中,博弈模型是用来描述参与者行为和可能结果的数学框架。
它由参与者、策略和支付函数组成。
参与者根据自己的理性选择策略,并得到相应的支付。
2.2 结果解释方法论:当我们得到了博弈模型的结果后,我们需要对这些结果进行解释和分析。
结构化且系统性地解释模型结果对于深入理解博弈过程、预测参与者行为以及制定合适决策具有重要意义。
在进行结果解释时,我们可以采用以下方法论:首先,需要对博弈模型中所使用的各种概念和符号进行定义和解释,确保读者对模型基本原理有清晰直观的认识。
其次,通过分析参与者之间的相互作用和选择行为,阐述模型所揭示出来的策略均衡点或优势策略。
博弈论与数学模型PPT教案
对两人非零和有限博弈,双方收益需用两个矩阵表示,称为双矩 阵博弈(bimatrix game)。
1960年,Lemke和Howson给出了求解双矩阵博弈解的算法,但该 算法是指数时间的。
第22页/共67页
John Forbes Nash
EconomicBehavior》出版,这是博弈论正式形成的标志。 Princeton Press,1944
第2页/共67页
博弈论的发展简史
1950-1953年,Nash先后发表四篇论文,提出了Nash均衡,讨价还 价等一系列重要概念。
二十世纪六七十年代起,经济学、社会学和生物学领域开始大量 应用博弈论,并逐渐在经济学界取得重要地位。
• 1994年,三位博弈论研究者Nash,Harsanyi,Selten获诺贝尔经 济学奖,博弈论开始走入大众视野。
第3页/共67页
博弈的要素
参与者(player) :参与博弈的决策主体。 行动(actions):参与者可以采取的行动(策略)方案的全体;
所有参与者采取各自的行动后形成的状态称为局势(outcome)。 收益(payoff):各个参与者在不同局势下获得的利益。 规则(rule):对参与者行动的先后顺序、参与者获知信息的多少
第41页/共67页
Hotelling 模型
第42页/共67页
最优反应函数
第43页/共67页
Nash均衡
(1/2,1/2)是Nash均衡,两家快餐店开在同一 地点,平分所有的客源。
该模型可推广为居民住址服从任意连续分 布的情形。若分布的中位数m为,则Nash 均衡为(m,m)。
第44页/共67页
数学建模-博弈模型
数学研究的方法是从大量的同类现象中抽象出基 本要素,进步构造出能描述这类现象的模型。许多冲 突模型在游戏中就存在,博弈论早期就是由研究国际 象棋开始的,所以被命名为Game Theory。人们很 快认识到此种理论可用于经济、政治、军事等领域, 所谓“世事纷争一棋局”,正说明其中一些道理。 1944年冯· 诺曼(John,Von Neumann)和奥· 摩根 斯特恩(Osker Mor-gentern)合著的《竞赛论与 经济行为》(Theory Of GSmes and Economic Behavior)问世,总结了初期研究成果,奠定了博 弈论的基础。由于该理论主要讨论在复杂的矛盾冲突 等活动中,局中人(Player)采取何种合理的策略 (strategy)而能处于“优越”的地位,以便取得较 好效益,所以将它译为博弈论。
常见的游戏如棋类,两人对奕,此两人便称为 局中人,他们各有一套棋路,或善于用马,或长于 用炮。在每次轮到一方走子时,他可能有许多走法, 这些走法依赖于当时棋局形势以及棋手想要达到的 目的,以及他惯用的走法,从而形成他走棋的指导 思想。对奕时指导棋手行动的思想便称为策略。对 局终了可能有三种结局:甲胜;乙胜;和局。如果 用数量表示各种结局,例如胜家赢得彩金若干(设 所得彩金由输家付给,则输家当然失去若干),和 局时都不能取得彩金,此种表示结局的数称为支付 (payoff)。局中人、策略、支付是博弈论中常见 的基本概念。
在这个博弈中,大猪与小猪都有两种战略选择: 拱、不拱。在这个例子中可以发现,不论大猪选择拱 还是不供,小猪的最优选择总是不拱。这是因为,如 果大猪去拱开关,小猪不拱(等在猪食槽旁边)比拱 后再跑回去争食要划算(5>1.5);如果大猪不去拱 开关,小猪不拱顶多都不得食,而去拱就要白白消耗 能量,不划算(0>-0.5)。所以,不拱是小猪的占优 战略。给定小猪总是选择不拱,大猪的最优选择总是 拱。这样,智猪争食问题的博弈论解是战略组合(拱, 不拱)。
讨价还价博弈模型推导
讨价还价博弈模型推导
讨价还价博弈模型是一种经济学中常用的博弈模型,用于研究双方在交易过程中的策略选择。
其基本假设是,买方和卖方都追求自己的最大利益,同时也考虑对方的利益。
在这种情况下,双方将相互讨价还价,以达成一个合理的交易。
讨价还价博弈模型的推导可以通过数学建模实现。
首先,需要定义买方和卖方的策略集合和收益函数。
买方的策略集合为{b1,
b2, ..., bn},表示买方在交易中可以选择的不同出价。
卖方的策略集合为{s1, s2, ..., sm},表示卖方可以选择的不同要价。
收益函数f(b, s)表示在买方出价为b,卖方要价为s的情况下,双方的收益。
接下来,可以利用博弈论中的纳什均衡来求解该模型。
纳什均衡是指在一个博弈中,每个玩家都选择了最优的策略,而且这些策略互相支持,没有任何玩家能够通过改变自己的策略来获得更多的收益。
在讨价还价博弈模型中,可以通过求解双方的最优策略来找到纳什均衡。
具体来说,可以采用迭代深化和回溯算法,逐步找到双方的最优策略。
最终,通过比较所有可能的策略组合,可以得到纳什均衡点。
总之,讨价还价博弈模型是一种常用的经济学研究方法,可以帮助我们了解交易过程中双方的策略选择和收益情况。
其推导过程需要建立数学模型,并利用博弈论中的纳什均衡求解方法。
- 1 -。
数理模型 博弈模型
数理模型博弈模型标题:博弈模型下的决策之旅第一章问题的提出在我们的生活中,我们常常面临各种决策问题。
无论是选择吃什么、去哪里旅行,还是在工作中做出重要的决策,我们都需要考虑各种因素并做出最佳选择。
这些决策问题可以被看作是一个博弈模型,其中我们是参与者之一,而其他人、环境等则是其他参与者。
第二章博弈模型的基本概念博弈模型是一种数理模型,用于描述参与者之间的决策和行为。
在博弈模型中,每个参与者都会根据自己的利益和目标来做出决策,而其他参与者也会做出相应的决策。
这种相互影响的决策过程可以用博弈论来研究和分析。
第三章博弈模型的应用领域博弈模型在各个领域都有广泛的应用。
在经济学中,博弈论被用来研究市场竞争、价格战略等问题。
在政治学中,博弈模型被用来研究选举、外交等问题。
在生物学中,博弈模型被用来研究进化、合作等问题。
博弈模型的应用领域非常广泛,几乎涵盖了所有社会科学领域。
第四章决策的影响因素在博弈模型中,决策的结果往往受到各种因素的影响。
这些因素包括参与者的理性程度、信息的不对称性、策略的选择等。
理解这些因素对决策结果的影响,对于做出明智的决策非常重要。
第五章决策的策略分析在博弈模型中,决策的策略选择是非常关键的。
每个参与者都希望通过选择最佳策略来实现自己的目标。
而选择最佳策略需要考虑其他参与者的行为和可能的反应。
通过分析各种策略的利弊,我们可以找到最优的决策策略。
第六章博弈模型的局限性尽管博弈模型在解决决策问题中有着广泛的应用,但它也存在一些局限性。
博弈模型往往基于一些假设,而这些假设并不总是符合现实情况。
此外,博弈模型也无法完全预测参与者的行为,因为人的行为往往是复杂和不确定的。
结语博弈模型为我们解决决策问题提供了一种理论框架。
通过了解博弈模型的基本概念、应用领域以及决策的影响因素和策略分析,我们可以更好地理解决策问题,并做出明智的选择。
然而,我们也要认识到博弈模型的局限性,不可盲目依赖它。
在实际应用中,我们需要综合考虑各种因素,灵活运用博弈模型来指导我们的决策。
数学建模-博弈模型-2
的战略组合 s = ( s1 , L , si , L , sn ) ,收益函数 ui ( s1 ,L , si ,L , sn ) 均可取一个确定的值。 均可取一个确定的值。
由于混合战略是纯战略空间的一个概率分布, 由于混合战略是纯战略空间的一个概率分布, 合战略是纯战略空间的一个概率分布 这 就使得与参与者对战略选择的不确定性(随机性) 就使得与参与者对战略选择的不确定性(随机性)相 伴的是收益的不确定性。 概率论提供的平均意义上的 伴的是收益的不确定性。 期望值的概念可以用来衡量混合战略的效果, 构造期 期望值的概念可以用来衡量混合战略的效果, 望收益函数就可以比较两个不同混合战略的优劣。 望收益函数就可以比较两个不同混合战略的优劣。 设 p = ( p1 ,L , pn ) 是 一 个 混 合 战 略 组 合 , 其 中
为了区分,s 就称为纯战略。 为了区分 i 就称为纯战略。对完全信息静态博弈 来说, 来说, 一个参与者的纯战略就是他可以选择的一种特定 的行动。例如在猜硬币博弈中,每个人的战略空间 Si 的行动。例如在猜硬币博弈中, 中含有两个纯战略, 分别是“正面 正面”和 背面 一个参与 背面”。 中含有两个纯战略, 分别是 正面 和“背面 。 者的混合战略就是规定他以某种概率分布随机去选择 不同的行动。 例如在猜硬币博弈中, 不同的行动。 例如在猜硬币博弈中, 参与人 1 的一个混 为出正面的概率, 合战略是概率分布 ( p,1 − p) ,其中 p 为出正面的概率, 战略是概率分布 而且可以看到, 战略是概率分布 (q ,1 − q ) , 且 0 ≤ q ≤ 1 。而且可以看到, 混合战略( )表示参与人的一个纯战略,即选择“正 混合战略(1,0)表示参与人的一个纯战略,即选择 正 背面”的纯战 面”。类似地,混合战略(0,1)表示选择 背面 的纯战 。类似地,混合战略( )表示选择“背面 略。
数学建模博弈论
数学建模博弈论在前一讲中,我们讨论了决策论,其中决策者面对的结果和支付只依赖于他本人的决策,而不依赖一个或者多个其他参与者的决策。
决策论最后决定的结果可能存在机会和风险,但不会与另一个参与者的决策有关系。
比如假定两个国家在军备竞赛而希望裁军,如果一方裁军,这个国家的结果不仅依赖于该国的决策,也依赖于第二个国家的决策。
如果只依赖于一个参与者,我们把这类决策模型称为决策论;如果结果依赖于多于一个参与者的决策,我们把这类决策模型称为博弈论;10.1:博弈论:完全冲突:按照参与者之间的冲突是完全冲突还是部分冲突对博弈论进行分类。
进一步把完全冲突的博弈按照最优策略是纯策略还是混合策略进行分类。
举例1:一个有纯策略的完全冲突博弈:例如有两家连锁店,都同时想在两个城市开连锁店,假设为A,B两地,如图所示是两个连锁店所占的市场份额:从上图可以发现两家连锁店其中一家每得到一点份额都是需要另一家失去一点份额,而市场总额是1,并且两家连锁店的决策结果不仅取决于自身还取决与对手的策略。
这个博弈是完全冲突的。
定义:纯策略是参与者可采取的行动的集合,每个参与者选定的策略共同决定博弈的结果以及每个参与者的花费。
通过图中数据我们也可以发现,无论甲连锁店开在何处,乙连锁店只需要开在A地就可以始终占优。
占优策略:定义:策略A占优与策略B,是指策略A的每一个结果至少和B的对应结果一样好,并且至少A的某一个结果严格优于B的对应结果。
占优原理:在严格冲突博弈中,一个理性的参与者应该永远不要采用被占优的策略。
同时也可以发现结果(A,A)即两个连锁店都开在A地时,此时没有任何一个参与者可以单方面改变策略而使得自己获得改善,这种情况我们称为纳什均衡:表示这样一个结果,任何一个参与者都不能通过单方面更改策略而获得好处。
同时由于这些每个结果和是1,完全冲突博弈也称作常数和博弈:如果对每一个可能的结果,每个参与者的支付之和是同一个常数,这个博弈称为完全冲突博弈。
博弈模型-数模
* * * s s ( s , s 优战略是 =坦白。因此,囚徒困境问题的解是 1 2 ) =(坦白,坦白)。
* 2
注释:这正是囚徒困境的“困境”两个字的体现,如果用经济学中的“有效” 的术语的意思来讲,(沉默,沉默)是一个有效结局。有效结局并不是囚 徒问题的博弈解。这体现了个人利益和全体利益的矛盾。
现在,让我们试问一下,这个传教徒告诉了这些丈夫们他们所不知 道的什么?每个丈夫都已经知道了99个不贞的妻子,故这对任何人来 说都不是新闻。但“这个传教徒对所有男人做了一个声明”是共同知 识,从而这个传教徒所声明的内容,即有一个不贞的妻子,也就成了 所有男人中间的共同知识。在传教徒宣告之前,每个形如“(每个丈 夫知道)有一个不贞的妻子”的判断对于99都是正确的,但对100就 不正确了。
(3)收益函数
在博弈论中,收益指的是在一个特定的战略组合下参与者得到的确定效 用或期望效用。效用通常表现为博弈结果中输赢、得失、盈亏。效用必 须能用数值刻画其大小。收益是博弈参与者真正关心的问题 。 注释:博弈论的一个基本特征是一个参与者的收益不仅取决于自己的战略选 择,而且取决于所有参与者的战略选择。或者说,收益是所有参与者各选 定一个战略形成的战略组合的函数。 在博弈论中,通常用ui表示参与者i的收益,一个战略组合是,每个参与者 的收益可以表示为
* * * * s ( s , , s , , s 的解,则战略组合 1 i n ) 称为博弈 G 的一个解或纳什均
衡。
注释:研究博弈问题就是建立博弈模型,求解博弈的纳什均衡,下面我们用实例来说明我们的理论及应用
信息
博弈论建模
博弈论建模
博弈论是研究人类社会、政治、经济相互作用的科学,具有广泛的应用。
在博弈论中,建模是指将现实问题转化为数学模型,用已有的理论和方法分析问题并提出解决方案。
博弈论建模包括以下步骤:
1.确定博弈参与者:确定博弈中的参与者,如个人、企业、政
府等。
2.确定博弈目标:确定博弈的目标,如赚钱、获利、维护利益等。
3.选择博弈策略:确定博弈中的策略,如合作、竞争等。
4.模拟博弈过程:模拟博弈过程并记录博弈结果,如赢或输、
赢得多少等。
5.分析博弈结果:分析博弈结果,包括参与者行为分析、策略
优化、稳定性分析等。
6.提出解决方案:根据分析结果提出相应的解决方案。
博弈论建模可以应用于多个领域,如社会科学、物理学、数学等。
其重要性在于:它可以帮助人们理解人类行为中的策略选择和决策过程,从而为人类行为进行控制和优化提供参考意见。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
-是否能达到协调 -协议执行成本有多高
-是否能任意分配利润
11.3 ―一口价”的战略
背景 • ―讨价还价”很浪费买卖双方的宝贵时间.
• 为了节省“讨价还价”时间,考虑“一口价” 模式. • 双方同时报价:若买价≥卖价,则以均价成交;
否则不成交.
问题
• 双方应如何报价?
买方:
具体战略(函数)形式不同,均衡就可能不同.
单一价格战略
x , vs x p s ( vs ) 1, vs x
x, vb x pb (vb ) 0, vb x
双方战略互为最优反应,所以构成贝叶斯纳什均衡!
单一价格战略
对给定的(vs, vb),当vs<vb时称交易是有利的; 交易给双方带来的效用之和(即vb–vs)称为交易价值.
第十一章
博弈模型
11.1 进攻与撤退的抉择
11.2 让报童订购更多的报纸
11.3 ―一口价”的战略
11.4 不患寡而患不均 11.5 效益的合理分配 11.6 加权投票中权力的度量
决策问题(Decision Problem)
单一决策主体
三要素
多个决策主体 博弈模型 合作博弈
决策变量 目标函数 约束条件 决策主体的决策 行为发生直接相 互作用 (相互影响) 非合作博弈
•占优(dominate):盟军的行动2占优于1 (前面的非常数和博弈M’类似)
•混合策略似乎不太可行! 但概率可作为参考. ----现实:盟军让预备队原地待命(行动2),而德军 没有选择撤退(行动2),结果德军大败. • 博弈规则至关重要的,如参与人决策的时间顺序、 决策时拥有哪些信息等. •多人(或非常数和)博弈问题,一般不能用上面的线性 规划方法求解,而通过纳什均衡的定义求解.
(1 ) Q
F ( x)dx
U r ( w, , Q) pS (Q) wI1 (Q) vI 2 (Q) wQ Q Q F ( x)dx ( p v) (1 )Q F ( x)dx ( p w) (1 )Q 0
U r ( w, , Q) 0 Q Qr
盟军的混合战略集
S1={p=(p1, p2, p3) | 0 pi 1, pi 1}
i 1 2
3
德军的混合战略集
S2={ q=(q1, q2) | 0 qi 1, qi 1 }
i 1
期望收益
U 1 ( p, q ) pMqT pi mij q j
i 1 j 1
pw F (Qr ) pv
Qr(w)
问题
假设报社报纸成本价为c,w≥c>v
Max ( w c)Qr ( w) (w c) F 1 p w
w c
pv
w*
完全信息动态博弈:常称Stackelberg Game (两阶段) 子博弈完美均衡: (w*,Qr(w))
3
2
U 2 ( p, q ) U 1 ( p, q )
•盟军
max pMq
pS1
T
•德军
min pMqT
qS 2
完全信息 有限博弈 零和博弈
静态博弈 矩阵博弈 (2人) 常数和博弈
模型求解
max pMq
pS1
T
min pMqT
qS 2
理性推理:不管自己怎么做,另一方总是希望使自 己得分尽量低. (二人零和博弈,完全竞争) 从一个给定的战略中期望得到的赢得,总是 采用该策略时他们可能得到的最坏的赢得! 盟军可以用min pM来衡量策略p的好坏 德军可以用max MqT来衡量策略q的好坏 •盟军 •德军
pc 假设报社与报童联合,整体利润最大 F (Q ) pv pw *>c Q (w*) <Q* F (Qr ) 一般w r pv 整体利润有损失 能否改善(协调)?
*
价格折扣协议模型
折扣方案wd(Q) 下,报童效用(期望利润)
U r ( wd (Q)) ( p v)S (Q) ( wd (Q) v)Q
东进
原地 待命
盟 军 (美三)
双方应该如何决策 ?
模型假设
• 博弈参与者为两方(盟军和德军) • 盟军有3种使用其预备队的行动:强化缺口,原地 待命,东进;德军有2种行动:向西进攻或向东撤退. • 博弈双方完全理性,目的都是使战斗中己方获得 的净胜场次(胜利场次减去失败场次)尽可能多.
德军 盟军 强化缺口 原地待命 东进 向西进攻 盟军胜1场 盟军胜2场 盟军败2场 向东撤退 无战斗 无战斗 盟军胜1场
• 双方总能成交吗?(效率估计)
模型假设与建立
• 卖方知道物品对自己的价值,但买方不知道. • 买方知道物品对自己的价值,但卖方不知道. • 双方都知道(如猜出)对方价值的分布信息. 卖方价值vs, 买方价值vb, 均服从 [0,1] 上的均匀分布
卖方报价ps, 买方报价pb, pb ≥ ps时成交价p= (pb+ps)/2 成交效用:卖方U1=p- vs, 买方U2= vb –p; 不成交: 0
0 0
xF ( x) |0 F ( x)dx Q (1 F (Q )) Q F ( x)dx
期望存货量
I (Q) Q S (Q) F ( x)dx
0
Q
期望利润 G(Q) pS(Q) vI (Q) wQ ( p v)S (Q) (w v)Q 最优订购量Qr
回收协议模型
模型二 回收数量协议
I1 (Q)
(1 ) Q 0
按批发价回收,比例为α
Q (1 ) Q
报社回收 报童回收 报童利润
Qf ( x)dx
0
(Q x) f ( x)dx
Q
(1 ) Q
F ( x)dx
I 2 (Q) I (Q) I1 (Q)
单向改变战略不能 提高自己效用.
贝叶斯纳什均衡
模型假设与建立
卖方:
均衡条件
ps E[ pb (vb ) | pb (vb ) ps ] vs * Pr{ pb (vb ) ps } max 2 ps
pb E[ ps (vs ) | pb ps (vs )] max vb * Pr{ pb ps (vs )} 2 pb
给定战略组合,能够实际发生的交易的期望价值与有利 的全部交易的期望价值的比值称为该战略的交易效率.
vb
1 交易 x vb=vsLeabharlann 单一价格战略效率为
1
x
x 0 1 vb
(vb vs )dvs dvb (vb vs )dvs dvb
3x(1 x) 3 / 4
0 0
x=0.5
max U1(p) = min pM
min U2(q) = max MqT
p2*=3/5,p3*=2/5 线性 规划 q1*=1/5,q2*=4/5 最优值均为2/5
(p*, q*): 混合(策略)纳什均衡(Mixed NE)
模型评述
0 0 M 1 0 1 1
小结:博弈模型的基本要素
• 参与人
• 行动空间(及战略空间) • 效用函数
理性假设 纳什均衡 参与者完全理性(最大化效用) 单向改变战略不能提高自己效用
其他因素
• 行动顺序(静态、动态)
• 信息结构(完全、不完全)
11.2 让报童订购更多的报纸
报 订购价w,零售价p,处理价v(p>w>v>0) 童 需求量:密度函数f(x)、分布函数F(x), F(0)=0 模 型 订购Q份报纸,期望销售量为 Q 回 S (Q) xf ( x)dx Qf ( x)dx 0 Q 顾 Q Q Q
M {mij }3 2
1 0 2 0 2 1
1,1 1,1 ' M 2,2 2,1 2,2 1,1
非常数和 博弈(双矩 阵表示)
不存在(纯)NE
(纯)NE: a*=(a1*, a2*) =(2, 2)
混合战略(策略:Strategy)
( p w)[1 F (Qr )] (w v)(1 ) F ((1 )Qr ) 0
( p w)[1 ( p c) /( p v)] ( w v)(1 ) F ((1 )Q* )
pc F (Q ) pv
*
达到协调 α↑,报童利润↓, 报社利润↑; 利润任意分配都可达到
博弈的解的概念:纳什均衡 (NE: Nash Equilibrium) Nash: 1994年获诺贝尔经济学奖
NE: 单向改变战略不能提高自己效用,即每一方的战略 对于他方的战略而言都是最优的, 称为最优反应.
* * * u1 (a1 , a2 ) u1 (a1 , a2 ), a1 {1,2,3}, (纯战略)纳什均衡 * * * u2 (a1 , a2 ) u2 (a1 , a2 ), a2 {1,2}.
w wq ( ) v
( p v)(c v) (c v) ( p v)(1 ) F ((1 )Q* )
模型评述
•协议参数的确定: 不能单方决定 双方谈判(合作博弈)
•一种更简单的协议
批发价w=成本c
收取一定加盟费
•还有很多其他类型的协议,也可以达到协调
假设报社与报童联合,整体期望利润
U s r (Q) ( p v) S (Q) (c v)Q
达到协调
U r ( wd (Q)) U s r (Q)
wd (Q) c (1 )[v ( p v) S (Q) / Q]