博弈论与数学模型
博弈论的数学原理
博弈论的数学原理博弈论是一门研究决策制定和策略选择的学科,它运用数学模型和分析方法来研究各种冲突和合作情境下的决策问题。
博弈论的数学原理是博弈论研究的基础,它包括博弈的定义、博弈的分类、博弈的解和博弈的应用等方面。
一、博弈的定义博弈是指在一定的规则下,两个或多个决策者通过制定策略来达到自己的目标的冲突或合作过程。
在博弈中,每个决策者都会根据自己的利益和对其他决策者行为的预期来选择策略。
博弈的目标是通过制定最优策略来获得最大的利益。
二、博弈的分类根据博弈参与者的数量和决策者的信息情况,博弈可以分为以下几类:1. 零和博弈:零和博弈是指博弈参与者的利益完全相反,一方的利益的增加必然导致另一方的利益的减少。
在零和博弈中,参与者的利益总和为零,即一方的利益的增加必然导致另一方的利益的减少。
2. 非零和博弈:非零和博弈是指博弈参与者的利益不完全相反,一方的利益的增加不一定导致另一方的利益的减少。
在非零和博弈中,参与者的利益总和不为零,即一方的利益的增加不一定导致另一方的利益的减少。
3. 完全信息博弈:完全信息博弈是指每个决策者都完全了解其他决策者的策略和利益情况。
在完全信息博弈中,每个决策者都能够准确地预测其他决策者的行为和利益变化。
4. 不完全信息博弈:不完全信息博弈是指每个决策者只能了解部分其他决策者的策略和利益情况。
在不完全信息博弈中,每个决策者只能根据自己的信息和对其他决策者行为的预期来选择策略。
三、博弈的解博弈的解是指通过数学模型和分析方法来确定最优策略和最终结果的过程。
博弈的解可以分为以下几种方法:1. 纳什均衡:纳什均衡是指在博弈中,每个决策者都选择了最优策略,而且没有动机再改变自己的策略。
在纳什均衡下,每个决策者的策略是最优的,没有其他策略可以使其获得更大的利益。
2. 极小化最大值:极小化最大值是指在博弈中,每个决策者都试图最小化其他决策者可能获得的最大利益。
在极小化最大值下,每个决策者的策略是最优的,其他决策者无法通过改变自己的策略来获得更大的利益。
9博弈论方法及其模型
江西财经大学 信息学院 2007-2008
3
经济数学模型与计算机仿真
囚徒的困境(Prisoners’ Dilemma) 博弈论中最著名的模型,1950年图克(Tuker)提出 囚徒A的战略: 坦白或抵赖 囚徒B的战略: 坦白或抵赖
囚徒B 坦白 囚徒A 坦白 抵赖
(8,8) (10,0)
(0,10) (1,1)
江西财经大学 信息学院 2007-2008
6
经济数学模型与计算机仿真
完美信息动态博弈和不完美信息动态博弈 “完全信息”指的是每一个参与人都对其他所有参与人 的特征、战略空间及支付组合(主要是支付组合)有准 确的知识;否则,称为“不完全信息”. “完美信息”指动态博弈中轮到行动的参与人对之前的 博弈进程完全了解的知识.
画线法:针对对手的每一
战略,找到自己的最优战略, 并在其支付值下面画线,最 后,双方同时画线的战略组 合就是纳什均衡
U 参与人A C D
L
参与人B M
R
(2,12)
(0,12) (0,12)
(1,10)
(0,10) (0,10)
(1,12)
(0,11) (0,13)
江西财经大学 信息学院 2007-2008小猪源自稳定的结果: 大猪按,小猪不按
大猪 按 不按
按
不按
(5,1) (9,1)
(4,4) (0,0)
江西财经大学 信息学院 2007-2008
5
经济数学模型与计算机仿真
静态博弈、动态博弈和重复博弈 博弈的次序也是博弈很重要的因素,有些博弈中的所有参 与人是同时选择战略的,但更多博弈中的参与人是先后选择战 略的,也有的博弈是反复或重复进行的. 静态博弈是指在博弈中所有的参与人同时选择战略,或者 虽然不是同时选择战略,但是后选择的参与人不知道先选择的 参与人的战略的博弈. 动态博弈是指在博弈中各参与人是按某种规则分先后行 动,并且后行动者知道先行动者的战略的博弈.
数学建模-博弈模型
就是在文化娱乐方面,也能运用海滩占位的 博弈结论予以解释。如果把电视中高雅艺术节目 与较低档的节目比作海滩的两端,那么众多的电 视观众就可以看作是散布在海滩上的游客。电视 台常常将黄金时段的电视节目定位在中等档次, 以提高收视率。
例三 智猪争食 猪圈里喂养两头猪,一头大猪,一头小猪。猪圈的 一边有一个猪食槽,对面的一边装有控制开关。只要猪 用鼻头去拱控制开关,就会一次有6个单位的饲料流进 猪食槽。如果大猪和小猪都不去拱开关,那么它们都吃 不到饲料。如果小猪去拱开关,那么等它跑到另一边的 猪食槽时,大猪已将流出的饲料全部都吃光了。如果大 猪去拱开关,那么等它跑到猪食槽旁边,小猪差不多已 吃掉了5个单位的饲料,结果大猪只能吃到1个单位的饲 料。如果大猪、小猪一起去拱开关,再一起跑去吃食, 那么大猪可抢到4个单位的饲料,小猪也只能吃掉2个单 位的饲料。假定每拱一次开关需要消耗0.5个单位饲料 的能量。大猪和小猪长期在一起进食,上面所说的情况 (信息、知识)已为它们所掌握。仿照例一囚徒困境的 情形,就可以画出如图1-4所示的双变量矩阵。
博弈论囚徒困境问题提供的解是战略组合(坦白, 坦白)。严格的定义与详细的阐述留到第2章讨论。这 个战略组合是个占优战略组合,因为无论对方如何选 择,自己的最优选择都是坦白。如果囚徒2不坦白,囚 徒1坦白的话他就会马上获释,不坦白的话还得坐一个 月的牢,所以坦白比不坦白好;如果囚徒2坦白,囚徒 1坦白的话要判6个月,不坦白的话则要判9个月,这样 对囚徒1来说,还是坦白比不坦白好。因此坦白是囚徒 1的占优战略。同样的分析表明,坦白也是囚徒2的占 优战略。均衡的结果是每个囚徒都选择坦白,各判刑6 个月。
博弈模型
第一部分、博弈论基本概念
一、引言
宇宙间处处存在矛盾、冲突、争斗、合作、共生等 现象,这些现象很很早就引起各类学者的重视。哲学家 们对此作过深刻讨论,毛泽东的《矛盾论》便是其中的 代表。另一方面,数学被认为是科学的语言,能否用数 学语言描述各种带有矛盾因素的模型或现象?博弈论便 是这样一种处理各类带有矛盾因素的模型的数学工具, 现在已被数学、经济学、社会学、军事学、生物学等专 家广泛应用于讨论各类带有冲突、矛盾、合作、竞争、 进化等问题及相关模型之中。博弈论已成为人们分析复 杂系统与作重大决策时的有力工具。
数学建模-博弈模型
数学研究的方法是从大量的同类现象中抽象出基 本要素,进步构造出能描述这类现象的模型。许多冲 突模型在游戏中就存在,博弈论早期就是由研究国际 象棋开始的,所以被命名为Game Theory。人们很 快认识到此种理论可用于经济、政治、军事等领域, 所谓“世事纷争一棋局”,正说明其中一些道理。 1944年冯· 诺曼(John,Von Neumann)和奥· 摩根 斯特恩(Osker Mor-gentern)合著的《竞赛论与 经济行为》(Theory Of GSmes and Economic Behavior)问世,总结了初期研究成果,奠定了博 弈论的基础。由于该理论主要讨论在复杂的矛盾冲突 等活动中,局中人(Player)采取何种合理的策略 (strategy)而能处于“优越”的地位,以便取得较 好效益,所以将它译为博弈论。
常见的游戏如棋类,两人对奕,此两人便称为 局中人,他们各有一套棋路,或善于用马,或长于 用炮。在每次轮到一方走子时,他可能有许多走法, 这些走法依赖于当时棋局形势以及棋手想要达到的 目的,以及他惯用的走法,从而形成他走棋的指导 思想。对奕时指导棋手行动的思想便称为策略。对 局终了可能有三种结局:甲胜;乙胜;和局。如果 用数量表示各种结局,例如胜家赢得彩金若干(设 所得彩金由输家付给,则输家当然失去若干),和 局时都不能取得彩金,此种表示结局的数称为支付 (payoff)。局中人、策略、支付是博弈论中常见 的基本概念。
在这个博弈中,大猪与小猪都有两种战略选择: 拱、不拱。在这个例子中可以发现,不论大猪选择拱 还是不供,小猪的最优选择总是不拱。这是因为,如 果大猪去拱开关,小猪不拱(等在猪食槽旁边)比拱 后再跑回去争食要划算(5>1.5);如果大猪不去拱 开关,小猪不拱顶多都不得食,而去拱就要白白消耗 能量,不划算(0>-0.5)。所以,不拱是小猪的占优 战略。给定小猪总是选择不拱,大猪的最优选择总是 拱。这样,智猪争食问题的博弈论解是战略组合(拱, 不拱)。
数学与博弈论中的数学模型与博弈策略的研究
核心对称解的概念
01 核心对称解的定义
明确定义多人博弈中的核心解概念
02 多人博弈中的核心对称解计算
介绍计算核心对称解的方法和技巧
03 核心对称解的应用案例
展示核心对称解在实际情况中的应用场景
多人博弈中的数学建模
多人博弈树的构建 方法
构建多人博弈树是分析多 人博弈策略的重要手段之 一
多人博弈中的策略 空间定义
数学与博弈论中的数学模型 与博弈策略的研究
汇报人:XX
2024年X月
目录
第1章 简介 第2章 数学模型在零和博弈中的应用 第3章 数学模型在合作博弈中的应用 第4章 博弈中的均衡概念及求解方法 第5章 数学模型在多人博弈中的应用 第6章 总结与展望
● 01
第一章 简介
数学与博弈论的 关系
数学与博弈论有着密 切的关系。数学模型 在博弈论中扮演着重 要角色,帮助我们理 解博弈的规律。同时, 博弈策略的制定也依 赖于数学基础,通过 数学模型分析和预测 对手的策略,从而制 定最佳的决策。本研 究旨在探索数学与博
在数学与博弈论中, 数学模型的应用起着 至关重要的作用。通 过建立合适的数学模 型,可以更好地分析 博弈情境,预测可能 的结果,指导决策制 定。数学模型为博弈 策略的制定提供了理 论支持,为博弈参与 者提供决策依据。
博弈策略的数学基础回顾
01 博弈理论
博弈模型的基本概念
02 最优策略
博弈参与者的最佳选择
效用函数的建立
通过效用函数描述参与者 的收益偏好 有助于分析博弈结果
合作博弈中的最优 解求解
寻找使得各方收益最大化 的最优解 需要考虑协作策略和收益 分配
数学规划在合作博弈 中的应用
利用数学规划方法解决合 作博弈中的优化问题 提高合作博弈的效率与公 平性
数学建模讲座之博弈论(三)
合作博弈与非合作博弈所解决的 问题
(1)非合作博弈(纳什均衡)——
研究人们在利益相互影响的局势中如何选 决策使自己的收益最大,即策略选择问题。
(2)合作博弈(纳什谈判)——
研究人们达成合作时如何分配合作得到的 收益,即收益分配问题。
㈠纳什均衡定义
1:纳什均衡,从实质上说,是一种非合作 博弈状态。
灾区的效用函数与灾区所需物资最低低需 求量成正比,灾区间对一种物资进行两两 博弈得到下列公式:
fij -Uij Uij (i, n 130; j A, B, C, D, E, F, G) f(nj) -U nj U nj
最后得到结果:
f1 j : f2 j : f3 j : : fij U1 j :U 2 j :U3 j : :Uij
Π1NE
Π
NE 2
(a
c)2 9
q2 a-c
(a-c)/2 (a-c)/3
反应函数
反应函数
厂商1的产量:q1
R(q2 )
a
2
c
q2 2
厂商2的产量: q2
R(q1 )
a
2
c
q1 2
(q1*, q2*)
(a-c)/3 (a-c)/2
a-c
q1
垄断产量和垄断利润
由图可知得到垄断产量为:
a-c QM 2
两个厂商的均衡产量和均衡价格如何确定。
该博弈问题的标准式:
参与人——厂商1和厂商2 策略空间——每个企业可以选择的产量:
qi [0, ); (i 1,2)
收益——用利润额代表企业的收益
II1(q1, q2 ) q1 P(q1 q2 ) - c q1 q1 (a - c - q1 - q2 ) II(2 q1, q2) q2 P(q1 q2 ) - c q2 q2 (a - c - q1 - q2 )
数学建模博弈论
博弈论的概念博弈论又被称为对策论(Games Theory),是研究具有斗争或竞争性质现象的理论和方法,它既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博弈论是个非常重要的理论概念。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的的学科。
博弈论的基本概念博弈要素(1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
(2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
(3)得失:一局博弈结局时的结果称为得失。
每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。
数学建模优秀讲座课件之博弈论
,
Page 20
囚徒困境可以用来说明许多现象。
• 广告战
两个公司互相竞争,二公司的广告互相影响,即一 公司的广告较被顾客接受则会夺取对方的部分收入。但 若二者同时期发出质量类似的广告,收入增加很少但成 本增加。但若不提高广告质量,生意又会被对方夺走。
此二公司可以有二选择:
互相达成协议,减少广告的开支。(合作)
Page 14
纳什均衡的定义
• 纳什均衡简单说就是,一策略组合中,所有的参与 者面临这样的一种情况:当其他人不改变策略时, 他此时的策略是最好的。也就是说,此时如果他改 变策略,他的支付将会降低。 在纳什均衡点上,每一个理性的参与者都不会有单 独改变策略的冲动。
Page 15
•寻找纳什均衡的方法———条件策略下画线法
Page 17
假设有两个小偷A和B联合犯事、私入民宅 被警察抓住。警方将两人分别置于不同的两个 房间内进行审讯,对每一个犯罪嫌疑人,警方 给出的政策是:如果两个犯罪嫌疑人都坦白了 罪行,交出了赃物,于是证据确凿,两人都被 判有罪,各被判刑8年;如果只有一个犯罪嫌 疑人坦白,另一个人没有坦白而是抵赖,则以 妨碍公务罪(因已有证据表明其有罪)再加刑 2年,而坦白者有功被减刑8年,立即释放。如 果两人都抵赖,则警方因证据不足不能判两人 的偷窃罪,但可以私入民宅的罪名将两人各判 入狱1年。
-3y+2(1-y)=2y+(-1)*(1-y)
解的:
y=3/8,
而美女每次的期望收益则是2(1-y)-3y=1/8元。
Page 28
由以上结果可知,在双方都采取最优策略的情 况下,平均每次美女赢1/8元。其实只要美女采取 了(3/8,5/8)这个方案,不论你再采用什么方案,都 是不能改变局面的。
博弈模型-数模
博弈参与者集合一般表示为 {1,2, ,n}
精选可编辑ppt
5
(2)战略
战略是参与者如何对其他参与者的行动作出反应的行动规则,它规定 参与者在什么时候该选择什么行动。或者说。战略是参与者“相机行 动方案”。
博弈论中,常用小写 si 表示参与者 i 的一个战略,用大写 Si {si } 表 示参与者 i 的所有可选择的战略集合(又称为参与者 i 的战略空间)。 如果 n 个参与者每个选择一个战略,那么 n 维向量 S (s1, s2, , sn ) 称 为一个战略组合,其中 si 是参与者 i 选择的战略。
在一个有 n 个参与者的博弈中,参与者的战略空间为 S1, S2,
收益函数为 u1, u2 , , un ,标准式表述用
表示此博弈。
G {S1, S2 , , Sn;u1, u2, , un}
, Sn ,
精选可编辑ppt
8
(4)博弈的解—纳什均衡
在 n 个参与者标准式博弈 G={S1,…,Sn;u1,…,un}中,如果对于每一
精选可编辑ppt
9
信息
信息指的是参与者在博弈过程中能了解到和观察到的知识。这些知识包括 “自然”的选择,其他参与者的特征和行动等。信息对参与者是至关重要 的,因为一个参与者在每一次进行决策之前,必须根据观察到的其他参与 者的行动和了解的有关情况作出自己的最佳选择。
由于信息内涵的不同,派生出各种有关信息的概念将博弈论划分成不同的 类型,因此寻求博弈间的方法也不同。这里只就信息有关的两个基本的、 重要的概念进行讨论。
精选可编辑ppt
14
二、囚徒困境博弈模型分析
1、问题的提出
两个共同作案的犯罪嫌疑人被捕,并受到指控。除 非至少一个人招认犯罪,否则警方无充分证据将他们 按罪判刑。警方把他们关入不同的牢室,并对他们说 明不同行动带来的后果。如果两人都采取沉默的抗拒 态度,因警方证据不足,两人将均被判为轻度犯罪入 狱1个月;如果双方都坦白,根据案情两人将被判入 狱6个月;如果一个招供而另一个拒不坦白,招认者 因有主动认罪立功表现将立即释放,而另一人将被判 入狱9个月(所犯罪行判6个月,干扰司法加判3个月 )。
博弈论单人决策模型
博弈论单人决策模型博弈论是研究决策者之间相互影响关系的数学理论。
在博弈论中,单人决策模型是一种研究单个决策者在面对不同情况下如何做出最优决策的数学模型。
在这种模型中,决策者通常被称为“玩家”,他们的目标是最大化自身利益或最小化损失。
单人决策模型在实际生活中有着广泛的应用。
人们在面临各种选择时,往往需要进行思考和决策。
通过建立数学模型,可以帮助人们更好地理解自己的决策行为,并找到最优的解决方案。
在单人决策模型中,通常会涉及到对不同的决策情况进行分析,以及对不同决策结果的评估。
决策者需要根据不同情况下的各种选择权衡利弊,最终做出最优的决策。
在博弈论中,囚徒困境是一个经典的例子。
在这个例子中,两名囚徒分别被关押在不同的监狱,他们可以选择合作或者背叛对方。
如果两人都合作,则各自判刑3年;如果两人都背叛,则各自判刑5年;如果一人合作一人背叛,则合作的人判刑1年,背叛的人判刑8年。
在这种情况下,每个囚徒都需要考虑对方的选择,以便做出最优的决策。
除了囚徒困境之外,还有很多其他的单人决策模型。
例如,投资者在面临不同的投资项目时,需要考虑每个项目的风险和回报,以便选择最佳的投资组合;公司在面对市场竞争时,需要考虑定价策略、市场份额等因素,以制定最佳的营销策略。
单人决策模型的研究可以帮助人们更好地理解决策过程中的各种复杂因素,并帮助他们做出更好的决策。
通过建立数学模型,可以将抽象的决策问题转化为具体的计算问题,从而找到最优的解决方案。
在实际应用中,单人决策模型也被广泛应用于经济学、管理学、金融学等领域。
通过分析各种决策情况和结果,可以帮助人们更好地理解复杂的决策过程,并提高决策的效率和准确性。
总的来说,单人决策模型是博弈论中的重要内容,它可以帮助人们更好地理解决策过程中的各种因素,并帮助他们做出最优的决策。
通过建立数学模型,可以将复杂的决策问题转化为具体的计算问题,从而找到最佳的解决方案。
在实际应用中,单人决策模型有着广泛的应用前景,可以帮助人们在各种决策情况下做出更好的选择。
博弈模型-数模
这两个犯罪嫌疑 人是坦白还是拒 不坦白呢?
2、假设:两囚徒都是理性的和智能的。
3、问题分析
囚徒困境问题可以用图1-1所示的双变量矩阵的形式来描述。
囚徒 2 坦白 沉默 囚徒 1 坦白 沉默 -6,-6 -9, 0 图 1-1
注释:在此博弈中,每个囚徒有两种战略可供选择:坦白(或招认)、不坦白(或沉默)。图 1-1的矩阵中每一个 单元的两个数字表示一组特定的战略组合下两个囚犯的收益(或支付、效用,这里已经开始引用经济学的术 语了),其中第1个数字是囚徒1(习惯上是位于矩阵横行上的参与者)的收益,第 2个数字是囚徒2(位于竖 行上的参与者)的收益。如果囚徒1选择沉默,而囚徒2选择坦白,那么囚徒1的收益是-9(表示判刑9个月) ,囚徒2的收益为0(表示马上释放)。
(2)战略
战略是参与者如何对其他参与者的行动作出反应的行动规则,它规定 参与者在什么时候该选择什么行动。或者说。战略是参与者“相机行 动方案”。
博弈论中, 常用小写 s i 表示参与者 i 的一个战略, 用大写 Si { si } 表 示参与者 i 的所有可选择的战略集合(又称为参与者 i 的战略空间) 。 如果 n 个参与者每个选择一个战略,那么 n 维向量 S ( s1 , s2 ,, sn ) 称 为一个战略组合,其中 s i 是参与者 i 选择的战略。
G { S1 , S2 ,, Sn ; u1 , u2 ,, un }
表示此博弈。
(4)博弈的解—纳什均衡
在 n 个参与者标准式博弈 G={S1,…,Sn;u1,…,un}中,如果对于每一 个参与者 i(i = 1,2,…,n) , si* 是针对其他 n - 1 个参与者所选战略 (s1*,…,s*i-1, s*i+1,…,sn*)的最优反应战略,即
数学建模讲座之博弈论(一)
一个纳什均衡
高价格
B 正常价格
高价格 C $100 $200 E -$20 $150
A
正常价格 D $150 -$30 F $10 $10
A占优策略,B没有—— 一个纳什均衡
两个纳什均衡
U 局中人1
D
局中人2
L
R
9,9
0,8
2
期望盈利为:
u1( 1, 2)
1 (0 3
4
1 2
5
1 2
6)
(局中人1取U时的期望盈利( 1 U))
(六)混合策略
1 (0 2 1 8 1 3)
3
2
2
(局中人1取M时的期望盈利( 1 M))
1 (0 3 1 9 1 2)
3
2
2
(局中人1取D时的期望盈利(1 D))
11
二 博弈的分类
博弈的分类和均衡
信息次序
静态
动态
信息
完全信息
纳什均衡 纳什
子博弈精练纳什 均衡
泽尔腾
不完全信息
贝叶斯均衡 海萨尼
精炼贝叶斯均衡 泽尔腾等
三 完全信息静态博弈
所谓完全信息静态博弈指的是各博弈方 同时决策,或者决策行动虽有先后, 但后行动者不知道先行动者的具体行 动是什么且各博弈方对博弈中各种策 略组合情况下所有参与人相应的得益 都完全了解的博弈。
8,0
7,7
局中人1、2都没有占优策略——存在两个纳什 均衡
没有纳什均衡
上 A
下
B
左
右
00
0
-1
10
-1
博弈论的数学模型
博弈论的数学模型作者:竺可桢学院01混合班王大方何霈邹铭摘要博弈论现在得到了广泛的应用,涉及到人的决策问题都可以用博弈论的模型加以解释。
本文首先用数学的方法表述实际生活中的博弈行为,并导出一般情况下的博弈的结果,进而讨论一些不同的外部约束条件对博弈过程的影响。
我们用经济学中的垄断竞争现象作为博弈问题的一个实例,讨论生产者在不同状态下的决策,进而分析双方共谋的动机和可能性。
(一)基本博弈模型的建立一, 博弈行为的表述博弈的标准式包括:1.1.博弈的参与者。
2.2.每一个参与者可供选择的战略集。
3.3.针对所有参与者可能选择的战略组合,每一个参与者获得的利益在n人博弈中,用Si为参与者i的可以选择战略空间,其中任意一个特定的纯战略为s i,其中任意特定的纯战略为s i,s i∈Si,n元函数u i(s1,s2,……s n), 当n个博弈者的决策为s1,s2,……s n时,表示第I各参与者的收益函数。
二, 博弈的解当博弈进入一个稳定状态时,参与者选择的战略必然是针对其他参与者既定战略的最优反应,在此状态下没有人愿意单独背离当前的局势。
这个局势叫纳什均衡:在n个参与者标准式博弈,G={ S1,S2,……S n;u1,u2,……u n}中,若战略组合{s1*,s2*,……s n*}满足对每一个参与者i,s i*是针对{ s1*,s2*,……s i-1*,s i+1*……s n*}的最优反应战略,,目标战略组合{s1*,s2*,……s n*}为该博弈的纳什均衡。
即:u i { s1*,s2*,……s i-1*,s i*,s i+1*……s n*}≥u i { s1*,s2*,……s i-1*,s i,s i+1*……s n*},对一切s i∈Si均成立。
纳什于1950年证明在任何有限个参与者,且每个参与者可选择的纯战略为有限个的博弈中,均存在纳什均衡。
(包括混合战略)混合战略指认某种概率分布来取一个战略空间中的战略,在本文中不加讨论。
博弈论与数学模型
博弈论与数学模型
主要内容
• 上篇:数学理论 • 博弈论概说 • 矩阵博弈 • Nash均衡和
一头鹿需要所有人协力才能捕获,一只兔只要 单人努力即可捕获,所有人协力获得的猎物收 益由所有人平分。
所有人捕鹿或所有人捕兔是两个Nash均衡。
Nash 均衡的性质
Nash 均衡是理性参与者在动态决策过程 中可以预见的终极局势。
Nash 均衡具有稳定性,一经形成后不用 外力即可维持。
阵A来表示,乙的收益矩阵为-A。
极大极小原则
鞍点
矩阵博弈
纯策略和混合策略
若参与者每次行动都选择某个确定的策 略,我们称之为纯策略(pure strategy)。
若参与者行动时可以以一定的概率分布 选择若干个不同的策略,这样的策略称 为混合策略(mixed strategy)。
• 在混合策略意义下,参与者的收益实质 上表现为期望。
对给出男(女)方最优稳定婚姻的算法,男 (女)方不可能通过提供虚假偏好顺序获得更 好的一组稳定婚姻。
谢谢
矩阵博弈的解即为Nash 均衡,因此 Nash 均衡可视作矩阵博弈解的概念向非 零和、无限策略集、多人博弈的推广。
囚徒困境(Prisoner’s Dilemma)
双人博弈
Stag or Hare
n个猎人相约去打猎,猎场中有鹿和兔两种动 物,鹿的价值远大于兔的价值。每个猎人在打 猎时只能专注于一种猎物,猎到某猎物后他即 中止打猎。
mathematical解决博弈论
mathematical解决博弈论数学在解决博弈论中的应用博弈论是研究决策制定者在相互竞争的情况下如何做出最优决策的一门学科。
在博弈论中,数学起着重要的作用,通过数学模型和方法,可以帮助我们分析和解决各种博弈问题。
首先,数学提供了一种抽象和形式化的方法,将博弈问题转化为数学模型。
通过建立数学模型,我们可以将博弈问题中的各种因素和变量进行量化和描述,从而更好地理解和分析问题。
例如,博弈论中常用的博弈矩阵就是一种数学模型,它将博弈双方的策略和收益进行了清晰的表示,使得我们可以通过计算和推导来得出最优策略。
其次,数学提供了一系列的工具和方法,用于求解博弈问题。
博弈论中常用的数学方法包括最优化理论、线性规划、微分方程等。
这些方法可以帮助我们求解博弈问题中的最优策略和均衡解。
例如,通过最优化理论,我们可以确定在给定条件下,决策制定者应该采取的最佳策略,以最大化自己的收益或最小化对手的收益。
而线性规划则可以帮助我们找到博弈问题中的纳什均衡点,即使得双方都无法通过改变策略来获得更好收益的状态。
此外,数学还提供了一种分析和推理的方法,用于解决博弈问题中的不确定性和复杂性。
博弈论中的许多问题都存在不确定性因素,例如对手的行为、环境的变化等。
数学可以通过概率论和统计学的方法,对这些不确定性因素进行建模和分析,从而帮助我们做出更准确的决策。
同时,博弈论中的一些问题也非常复杂,例如多人博弈、动态博弈等。
数学可以通过建立复杂的数学模型和运用复杂的数学方法,对这些问题进行深入研究和分析,从而得出更深入的结论。
总之,数学在解决博弈论中起着重要的作用。
通过数学的抽象和形式化方法,我们可以将博弈问题转化为数学模型,从而更好地理解和分析问题。
同时,数学提供了一系列的工具和方法,用于求解博弈问题中的最优策略和均衡解。
此外,数学还可以帮助我们解决博弈问题中的不确定性和复杂性。
因此,数学在博弈论中的应用是不可或缺的,它为我们提供了一种科学的方法和思维方式,帮助我们做出更明智的决策。
数学建模博弈论
数学建模博弈论在前一讲中,我们讨论了决策论,其中决策者面对的结果和支付只依赖于他本人的决策,而不依赖一个或者多个其他参与者的决策。
决策论最后决定的结果可能存在机会和风险,但不会与另一个参与者的决策有关系。
比如假定两个国家在军备竞赛而希望裁军,如果一方裁军,这个国家的结果不仅依赖于该国的决策,也依赖于第二个国家的决策。
如果只依赖于一个参与者,我们把这类决策模型称为决策论;如果结果依赖于多于一个参与者的决策,我们把这类决策模型称为博弈论;10.1:博弈论:完全冲突:按照参与者之间的冲突是完全冲突还是部分冲突对博弈论进行分类。
进一步把完全冲突的博弈按照最优策略是纯策略还是混合策略进行分类。
举例1:一个有纯策略的完全冲突博弈:例如有两家连锁店,都同时想在两个城市开连锁店,假设为A,B两地,如图所示是两个连锁店所占的市场份额:从上图可以发现两家连锁店其中一家每得到一点份额都是需要另一家失去一点份额,而市场总额是1,并且两家连锁店的决策结果不仅取决于自身还取决与对手的策略。
这个博弈是完全冲突的。
定义:纯策略是参与者可采取的行动的集合,每个参与者选定的策略共同决定博弈的结果以及每个参与者的花费。
通过图中数据我们也可以发现,无论甲连锁店开在何处,乙连锁店只需要开在A地就可以始终占优。
占优策略:定义:策略A占优与策略B,是指策略A的每一个结果至少和B的对应结果一样好,并且至少A的某一个结果严格优于B的对应结果。
占优原理:在严格冲突博弈中,一个理性的参与者应该永远不要采用被占优的策略。
同时也可以发现结果(A,A)即两个连锁店都开在A地时,此时没有任何一个参与者可以单方面改变策略而使得自己获得改善,这种情况我们称为纳什均衡:表示这样一个结果,任何一个参与者都不能通过单方面更改策略而获得好处。
同时由于这些每个结果和是1,完全冲突博弈也称作常数和博弈:如果对每一个可能的结果,每个参与者的支付之和是同一个常数,这个博弈称为完全冲突博弈。
博弈模型-数模
* * * s s ( s , s 优战略是 =坦白。因此,囚徒困境问题的解是 1 2 ) =(坦白,坦白)。
* 2
注释:这正是囚徒困境的“困境”两个字的体现,如果用经济学中的“有效” 的术语的意思来讲,(沉默,沉默)是一个有效结局。有效结局并不是囚 徒问题的博弈解。这体现了个人利益和全体利益的矛盾。
现在,让我们试问一下,这个传教徒告诉了这些丈夫们他们所不知 道的什么?每个丈夫都已经知道了99个不贞的妻子,故这对任何人来 说都不是新闻。但“这个传教徒对所有男人做了一个声明”是共同知 识,从而这个传教徒所声明的内容,即有一个不贞的妻子,也就成了 所有男人中间的共同知识。在传教徒宣告之前,每个形如“(每个丈 夫知道)有一个不贞的妻子”的判断对于99都是正确的,但对100就 不正确了。
(3)收益函数
在博弈论中,收益指的是在一个特定的战略组合下参与者得到的确定效 用或期望效用。效用通常表现为博弈结果中输赢、得失、盈亏。效用必 须能用数值刻画其大小。收益是博弈参与者真正关心的问题 。 注释:博弈论的一个基本特征是一个参与者的收益不仅取决于自己的战略选 择,而且取决于所有参与者的战略选择。或者说,收益是所有参与者各选 定一个战略形成的战略组合的函数。 在博弈论中,通常用ui表示参与者i的收益,一个战略组合是,每个参与者 的收益可以表示为
* * * * s ( s , , s , , s 的解,则战略组合 1 i n ) 称为博弈 G 的一个解或纳什均
衡。
注释:研究博弈问题就是建立博弈模型,求解博弈的纳什均衡,下面我们用实例来说明我们的理论及应用
信息
数模博弈论2
2、阻滞增长模型(Logistic模型)
3、更复杂的人口模型 随机性模型、考虑人口年龄分布的模型等
可见数学模型总是在不断的修改、完善使之能 符合实际情况的变化。
2、椅子能在不平的地面上放稳吗?
把四只脚的椅子往不平的地面上一放,通常只有 三只脚着地,放不稳,然而有人认为只要稍挪动几次 ,就可以四脚着地,放稳了,对吗?
• 许多在实际工作中成功地应了数学,并取得相 当突出成绩的毕业生都有这样的体会:在工作 中真正需要用到的具体数学分支科,具体的数 学定理、公式和结论,其实并不很多,学校里 学过的一大堆数学知识很多都似乎没有派上么 用处,有的甚至已经淡忘,但所受的数学训练, 所领会的数学思想和精神,却无时无刻不在发 挥着积的作用,成为取得成功的最重要的因素。 因此,如果就事论事,仅仅将数学作为知识来 学习,而忽略了学思想对你们的熏陶以及你们 数学素质的提高,就失去了数学课程最本质的 特点和要求,失去了开设数课程的意义。 实
(一)、数学建模简介
名词解释
1、什么是数学模型?
数学模型是对于现实世界的一个特定对象,一个 特定目的,根据特有的内在规律,做出一些必要的假 设,运用适当的数学工具,得到一个数学结构。
简单地说:就是系统的某种特征的本质的数学表 达式(或是用数学术语对部分现实世界的描述),即 用数学式子(如函数、图形、代数方程、微分方程、 积分方程、差分方程等)来描述(表述、模拟)所研 究的客观对象或系统在某一方面的存在规律。
建模过程示意图
数学模型及其分类
模型
具体模型
直观模型 物理模型 思维模型
抽象模型
符号模型
数学模型的分类:
数学模型
数式模型 图形模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Nash 均衡的性质
Nash 均衡是理性参与者在动态决策过程 中可以预见的终极局势。 Nash 均衡具有稳定性,一经形成后不用 外力即可维持。 Nash 均衡从整体而言未必是最优局势, 也未必是每个参与者的最优选择。
Braess悖论
Braess悖论
Shapley 网络设计问题
现有一由若干节点和线路组成的通讯网 络,每个使用者可借此网络建立两点之 间的通讯联系,为此需向网络所有商购 买线路使用权。 每条线路价格不同。若多个使用者共同 使用某线路,费用由这些使用者分摊。
矩阵博弈的混合策略
甲、乙的混合策略集分别为
设甲、乙采用的混合策略分别为, 甲的期望收益为
Von Neumann定理
线性规划
历史回眸
双矩阵博弈
零和的要求限制了矩阵博弈在经济学中的应用, 也阻碍了非合作博弈向多人推广。 对两人非零和有限博弈,双方收益需用两个矩 阵表示,称为双矩阵博弈(bimatrix game)。 1960年,Lemke和Howson给出了求解双矩 阵博弈解的算法,但该算法是指数时间的。
Cournot 双头垄断
两家垄断企业生产同一产品,生产单位 产品的成本为常数C。 若市场上该产品供应量为Q,则产品销售 价格为a-Q,其中a为一常数。 两家企业应如何选择各自的产量可使自 身获益最大。 Antoine Augustin Cournot(1801- 1877)法国数学家、经济学家、哲学家
Hotelling 模型
现有两家快餐连锁店拟在一条街道上开设分店。 居民住宅在街道上均匀分布,每人都会选择距 他住址较近的一家快餐店就餐(若距离相等则 随机选择一家)。 两家连锁店应分别在何处选址才能吸引较多的 顾客。 Harold Hotelling(1895-1973)美国数学 家、经济学家、统计学家
博弈论的发展简史
1950-1953年,Nash先后发表四篇论文,提 出了Nash均衡,讨价还价等一系列重要概念。 二十世纪六七十年代起,经济学、社会学和生 物学领域开始大量应用博弈论,并逐渐在经济 学界取得重要地位。 • 1994年,三位博弈论研究者Nash, Harsanyi,Selten获诺贝尔经济学奖,博弈 论开始走入大众视野。
谢谢
非合作博弈的分类
根据参与者是否同时行动:静态博弈, 动态博弈 根据参与者掌握信息的多少:完全信息 博弈,不完全信息博弈
对策论v.s. 博弈论
数学v.s. 经济学
Hale Waihona Puke 博弈论和数学建模矩阵博弈
• 参与者为两人:甲、乙 • 每人的可行策略集为有限集: • 两人收益之和为零,博弈可用一矩阵、即甲的收益矩 阵A来表示,乙的收益矩阵为-A。
囚徒困境(Prisoner’s Dilemma)
双人博弈
Stag or Hare
n个猎人相约去打猎,猎场中有鹿和兔两种动 物,鹿的价值远大于兔的价值。每个猎人在打 猎时只能专注于一种猎物,猎到某猎物后他即 中止打猎。 一头鹿需要所有人协力才能捕获,一只兔只要 单人努力即可捕获,所有人协力获得的猎物收 益由所有人平分。 所有人捕鹿或所有人捕兔是两个Nash均衡。
极大极小原则
鞍点
矩阵博弈
纯策略和混合策略
若参与者每次行动都选择某个确定的策 略,我们称之为纯策略(pure strategy)。 若参与者行动时可以以一定的概率分布 选择若干个不同的策略,这样的策略称 为混合策略(mixed strategy)。 • 在混合策略意义下,参与者的收益实质 上表现为期望。
算法
最优性
称一组稳定婚姻是男方最优的,如果在 该组婚姻中,每位男士都认为其配偶不 比任何一组稳定婚姻中他的配偶来的差。 男方最优的稳定婚姻是唯一的,同时必 是女方最劣的。 “男士选择,女士决定”算法给出的总 ” 是一组“男方最优” 的稳定婚姻。 “ ”
稳定婚姻问题的应用
稳定婚姻(stable marriage)及衍生 问题在理论上具有重要的意义,在实践 中发挥了巨大的作用。 申请式学校录取 用人单位与求职者双向选择 选择不同类型的算法可满足保护不同群 体利益的要求。
Hotelling 模型
Hotelling 模型
Hotelling 模型
Hotelling 模型
最优反应函数
Nash均衡
(1/2,1/2)是Nash均衡,两家快餐店开在 同一地点,平分所有的客源。 该模型可推广为居民住址服从任意连续 分布的情形。若分布的中位数m为,则 Nash均衡为(m,m)。
美苏冷战
参与者:美国,苏联 行动集 美国:强硬、妥协 苏联:强硬、妥协 局势 美国强硬、苏联强硬 美国强硬、苏联妥协 美国妥协、苏联强硬 美国妥协、苏联妥协
两败俱伤、同归于尽 美国得益、苏联受损 苏联得益、美国受损 互不侵犯、和平共处
美苏冷战
收益:由于实际情况的复杂性,参与者的收益 很 难精确量化,因此收益多表现为偏好或序关系。 美方偏好排序 苏方偏好排序 负无穷④ 美国强硬苏联强硬 ④负无穷 1 ① 美国强硬苏联妥协 ③ -1 -1 ③ 美国妥协苏联强硬 ① 1 0 ② 美国妥协苏联妥协 ② 0
Cournot 双头垄断
最优反应函数
Nash均衡
联合
欺骗
Bertrand双寡头垄断
Bertrand双寡头垄断
最优反应函数
Nash均衡
稳定婚姻问题
稳定婚姻问题
算法
“男士选择,女士决定” ” 每位男士都选择他最钟爱的女士。 如果有女士被两位或者以上的男士选择,则这 几位男士中除了她最喜欢的之外,对其他男士 都表示拒绝。 被拒绝的那些男士转而考虑他(们)的除被拒 绝之外的最满意女士。如果存在冲突(包括和 之前选择某女士的男士发生冲突),则再由相 应的女士决定拒绝哪些男士。 以上过程持续进行,直至不再出现冲突为止。
博弈论的发展简史
• 古代文献中的朴素博弈论思想 • 田忌赛马(中国,春秋时代) • Talmud中的债务分摊原则(以色列,公元6世 纪前) • 自二十世纪二十年代起,von Neumann,Zermelo, Borel等数学家相继给出了若干博弈论结论。 • 1944年,von Neumann和Morgenstern著作 《Theory of Games and EconomicBehavior》出 版,这是博弈论正式形成的标志。 Princeton Press,1944
John Forbes Nash
Nash 均衡
完全信息静态博弈的某个局势称为Nash 均衡(Nash equilibrium),若每一个 理性的参与者都不会单独偏离它。即在 其他参与者的策略不变情况下,单独采 取其他策略,收益不会增加。 矩阵博弈的解即为Nash 均衡,因此 Nash 均衡可视作矩阵博弈解的概念向非 零和、无限策略集、多人博弈的推广。
三方竞争
选举
候选人政纲和选民主张均可抽象为一实 数。选举时选民投票给政纲距本人主张 最接近的候选人。获得最多选民支持的 候选人当选。 实行两党制的国家在竞选时两党的政纲 区别不大,旨在争取中间选民。实行多 党制的国家政党分分合合,政府更迭频 繁。
竞争上岗
每位选民都可以自荐为候选人,其政纲即为本 人主张。 参选需要支付成本b,当选可获得收益c。若未 b c 当选或未参选另有损失d, d表示其主张与当 选人政纲的距离。 Nash均衡为何?是否应该自荐为候选人? (和b,c大小以及本人观点与m 距离有关)
欺骗
机制设计
是否存在一种机制(算法),能鼓励参与者真 实表达意愿,即参与者不会因为虚假表达意愿 而获益。 给定任何一稳定婚姻问题的算法,参与者都可 以通过提供虚假偏好顺序而获得更好的一组稳 定婚姻。 对给出男(女)方最优稳定婚姻的算法,男 (女)方不可能通过提供虚假偏好顺序获得更 好的一组稳定婚姻。
美苏冷战
研究博弈的重要内容之一是分析每个局 势是否会出现、是否会稳定。 当参与者只有两个时,博弈可以用简洁 的形式表示。
美苏冷战
美国强硬、苏联妥协是稳定点 美国妥协、苏联强硬是稳定点
美苏冷战
美国强硬、苏联强硬不会出现,美国妥协、苏联妥协 不会出现 冷战时期,美苏在世界各地争夺霸权,曾多次出现紧 张局势,但最后都以一方的妥协而告终,上述模型较 好地解释了这一现象。
博弈的要素
参与者(player) :参与博弈的决策主体。 行动(actions):参与者可以采取的行动 (策略)方案的全体;所有参与者采取各自的 行动后形成的状态称为局势(outcome)。 收益(payoff):各个参与者在不同局势下获 得的利益。 规则(rule):对参与者行动的先后顺序、参 与者获知信息的多少等内容的具体规定。
Shapley 网络设计问题
Shapley 网络设计问题
Nash均衡的数学定义
最优反应函数
不动点定理
Nash 定理
(Nash 定理)设参与者数目有限,每位参与 者策略集均有限,收益函数为实值函数,则博 弈必存在混合策略意义下的Nash均衡。 Nash 定理的证明只是一个存在性证明,并没 有给出Nash均衡的求法。Nash均衡(或近似 Nash均衡)的算法与复杂性问题是近年来理 论计算机科学的关注热点。
博弈论与数学模型
主要内容
• 上篇:数学理论 • 博弈论概说 • 矩阵博弈 • Nash均衡和 Nash定理
• 下篇:数学模型 • Hotelling模型 • Cournot和Bertrand 模型 • 稳定婚姻问题
博弈与博弈论
• 博弈论(game theory):研究利益存 在冲突的决策主体在相互依赖的条件下, 如何选择适当的策略实施以获得最大利 益。 • 研究对象不是客观规律,而是带有主动 性的人的活动。 • 最优不是绝对的,而是现有主客观条件 下的理想结果。