博弈论绪论和纳什均衡部分
博弈论和纳什均衡
博弈论和纳什均衡博弈论是一门研究决策者在特定情境下进行策略选择的学科,它主要研究个体或团体之间的冲突与合作关系,并提供一种分析和解决这些问题的方法。
在博弈论中,纳什均衡是一个非常重要的概念,它被广泛应用于社会科学、经济学、政治学、生物学等领域。
一、博弈论的基本概念1. 博弈博弈是指在特定情境下,两个或多个决策者进行策略选择的过程。
每个决策者都有自己的目标和利益,他们通过选择不同的策略来达到自己的目标。
2. 策略策略是指在博弈中每个决策者可以采取的行动方案。
每个决策者根据自己的利益和目标选择最优的行动方案。
3. 支配策略支配策略是指在某种情况下,一个决策者采取某种行动方案时,其他所有决策者都会采取同样的行动方案。
这种情况下,该行动方案被称为支配策略。
4. 纳什均衡纳什均衡是指在博弈中,每个决策者都采取最优的策略,且没有任何一方可以通过改变自己的策略来获得更多的利益。
在纳什均衡下,每个决策者都做出了最优的选择,整个博弈过程达到了一个稳定状态。
二、纳什均衡的应用1. 社会科学在社会科学领域中,纳什均衡被广泛应用于研究人类行为和社会现象。
例如,在政治学中,研究政治家之间的竞争和合作关系时可以使用博弈论模型,并通过计算纳什均衡来预测政治家们可能采取的行动。
2. 经济学在经济学领域中,博弈论和纳什均衡被广泛应用于市场竞争分析、价格战、拍卖等问题。
例如,在拍卖中,参与者可以根据自己的信息和目标选择不同的出价策略。
通过计算纳什均衡,可以预测最终获胜者以及他所支付的价格。
3. 生物学在生物学领域中,博弈论和纳什均衡被用于研究动物之间的竞争和合作关系。
例如,在动物群体中,个体之间会存在资源的竞争和合作,通过使用博弈论模型并计算纳什均衡,可以预测不同类型的动物在不同情境下采取的行动。
三、纳什均衡的局限性虽然纳什均衡在博弈论中被广泛应用,并且在很多情况下能够提供准确的预测结果,但是它也存在一些局限性。
1. 纳什均衡不一定是唯一的在某些情况下,博弈模型可能存在多个纳什均衡。
博弈论和纳什均衡
博弈论和纳什均衡引言博弈论是一门研究决策制定者之间相互作用的学科。
纳什均衡是博弈论中的一个重要概念,表示在每个决策制定者根据自己的利益进行选择的情况下,不存在个体可以通过单独改变自己的策略来进一步获益的状态。
本文将介绍博弈论的基本概念和纳什均衡的理论,并探讨其在现实生活中的应用。
博弈论基本概念博弈论研究的对象是决策制定者之间的相互作用,其中包括两个或更多个决策制定者,每个决策制定者可以选择不同的策略。
博弈论的基本元素包括玩家、策略和收益。
玩家是决策制定者的角色,策略是玩家在每个决策点上可以采取的行动,收益是每个玩家在不同策略组合下所获得的利益。
博弈论中常见的博弈形式包括合作博弈和非合作博弈。
在合作博弈中,玩家之间可以进行合作并达成协议,而在非合作博弈中,玩家之间相互独立且没有协作的能力。
纳什均衡的概念纳什均衡是博弈论中的一个重要概念,由诺贝尔经济学奖得主约翰·纳什提出。
纳什均衡指的是在每个决策制定者根据自己的利益进行选择的情况下,不存在个体可以通过单独改变自己的策略来进一步获益的状态。
具体来说,在一个博弈中,如果每个玩家选择了一个策略组合,且任何一个玩家单独改变自己的策略都无法提高自己的收益,那么这个策略组合就是一个纳什均衡。
纳什均衡可以通过数学方法进行计算,其中最常用的方法是利用最优响应函数。
最优响应函数指的是一个玩家在其他玩家的策略给定时,可以最大化自己的收益的策略选择。
纳什均衡的特性纳什均衡具有以下几个重要的特性:1.独立于个体的理性决策:纳什均衡的形成不依赖于玩家之间的协商或合作,而是由每个玩家根据自己的利益进行独立的决策而达成的。
2.稳定性:在纳什均衡中,每个玩家都在最优响应下选择策略,没有动机或能力单独改变自己的策略来获得更好的结果。
这种稳定性使得纳什均衡成为一种理想的博弈状态。
3.不一定最优:纳什均衡并非一定是博弈的最优结果,即每个玩家获得的收益并不一定是最大化的。
纳什均衡是一种均衡状态,每个玩家在给定其他玩家的策略下无法获得更多的收益。
最新博弈论课件(绪论和纳什均衡部分)
公地悲剧
07:33 博弈论
注水简历
07:33 博弈论
写简历应该如实介绍还是夸大其词,也是囚徒 困境式的博弈。 不错 优秀
出类 拔萃
旷世 奇才
关税之战
07:33 博弈论
两个国家,在进口关税上都有两种选择: 提高关税,以保护本国同类商品。(背叛) 降低关税,以利各自商品的流通。(合作) 当一国独自提高关税时,另一国也会做出同样 反应,会引发关税战,两国商品均会失去对方的 市场,同时对本国经济也造成损害。 除了关税战,还有多种多样的非关税战。如以 保护环境、食品安全等名义,制定更高的环保标 准、技术标准和劳工标准,等。贸易保护的形式 和手段更加灵活多样,也更具隐蔽性。
军备竞赛
前苏联
07:33 博弈论
扩军 裁军 −2000亿 −∞ 扩 8000亿 美 军 −2000亿 国 裁 0 8000亿 军 −∞ 0 上策均衡:(扩军,扩军) 是囚徒困境式的博弈 扩军是两国的理性行为, 但是结果却显得不理性。
军备竞赛
07:33 博弈论
B国 扩军 小军备 零军备 −2000 −1500 −∞ 扩军 8000 −2000 −1600 删除下策,可得到上策均衡: −1600 −500 −∞ A 小军 (小军备,小军备) 国 备 −1500 9500 −500 上述博弈问题,都可以通过比较收益 8000 9500 0 零军 的大小找出局中人的上策,即局中人的 备 −∞ 0 −∞ 最佳策略,从而推测出博弈的结果。这 种分析方法可称为上策分析法。
现代博弈论主要研究非合作 苏宁 博弈。因为主导人们行为方式 高价 的主要还是个体理性而不是集 低价 体理性,竞争是一切社会经济 1200亿 1500亿 高 500亿 国 价 1200亿 关系的根本基础,不合作是基 本的,合作是有条件和暂时的。 美 低 500亿 900亿 另外,合作博弈比非合作博弈 如果双方通过某种协议 价 1500亿 900亿 难度大,非合作博弈理论可以 进行合作,共同采用高价 作为合作博弈理论的基础。 格,则称为合作博弈。否 (低价,低价)也是 则称为非合作博弈。 上策均衡,所以价格竞 争是囚徒困境式的博弈。
博弈论中的纳什均衡
博弈论中的纳什均衡纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。
其研究成果见于题为《非合作博弈》(1950)的博士论文。
该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。
纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。
他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。
该解概念后来被称为纳什均衡。
定义:纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
也就是说,此时如果他改变策略他的支付将会降低。
在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。
所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。
这一结果对局中人B亦是如此。
纳什均衡的经典范例就是囚徒博弈,但是研究博弈论常常会使人陷入一种只追求个人利益的误区,事实上我们应该明白所谓的博弈只是建立在参与者假定为古典经济学中的理性经纪人的条件下这只是一个假设,并不总能说明事实。
只是假定他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。
也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。
没有人会主动改变自己的策略以便使自己获得更大利益。
“囚徒的两难选择”有着广泛而深刻的意义。
个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。
博弈论-混合策略纳什均衡
政治学的案例分析
总结词:国际关系
详细描述:在国际关系中,混合策略纳什均衡可以用来解释 国家之间的竞争和合作。例如,两个国家可能会以一定的概 率选择不同的外交政策,例如结盟、中立或对抗,以达到各 自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中,混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如,捕食者 可能会采用追逐和放弃两种策略来捕猎猎物,而猎物也可能会采用逃跑和装死两种策略 来避免被捕食。最终,捕食者和猎物都以一定的概率随机选择不同的策略,以达到均衡
非合作博弈论
研究个体如何在不知道其 他个体如何行动的情况下 做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体, 可以是个人、组织或国
家。
行动
参与者根据给定的信息 所做出的决策。
信息
参与者在进行决策时所 拥有的数据、情报或知
识。
策略
参与者为达到最优结果 而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词:繁殖竞争
VS
详细描述:在生物种群中,不同个体 之间会存在繁殖竞争。为了最大化自 己的遗传贡献,个体可能会采用不同 的交配策略,例如追求高繁殖成功率 的策略或避免过度竞争的策略。混合 策略纳什均衡可以用来描述这种竞争 状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中,生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分 析繁殖过程的均衡结果,解释生物多样性的形成机制。
05 混合策略纳什均衡的案例 分析
经济学的案例分析
博弈论和纳什均衡
博弈论和纳什均衡关于博弈论和纳什均衡你应该知道这些美股腾讯财经[微博]2015-05-25 10:05我要分享139[摘要]纳什在与命运的博弈中找到均衡,纪念大师最好的方式就是尝试了解博弈论。
腾讯财经综合报道(风生)奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸,两人均不幸遇难。
事发当时,这辆出租车失控撞向栏杆,两人均被抛出车外。
约翰-纳什因发表两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。
他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。
不均衡人生中孕育出均衡论纳什于1928年在美国西弗吉尼亚州出生,曾在麻省理工学院任教,晚年为普林斯顿大学担任数学系教授,死前与82岁妻子艾丽西亚在普林斯顿居住。
纳什以研究博弈论闻名,1994年获颁诺贝尔经济学奖。
他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。
纳什在数学领域上取得多项突破,但他同时深受精神分裂症困扰,其生平故事在2001年被改编成电影《美丽心灵》,赢得包括最佳电影在内的4项奥斯卡奖项。
尽管西维亚-纳萨斯(Sylvia Nasars)广为人知的小说《美丽心灵》(A Beautiful Mind)和改编自该书的、由拉塞尔-克罗(Russell Crowe)主演的同名奥斯卡电影探究了纳什错综复杂的生平,但都没有深入挖掘他的数学思想。
他的数学成果依然不被大众所熟知。
在当今科学界,人们普遍认为,与牛顿和爱因斯坦的数学理论相比,纳什的数学理论触及到的学科更多。
牛顿和爱因斯坦的数学旨在处理物理问题,而纳什的数学却可以应用在生物学和社会学领域。
如若不是精神疾病的困扰,纳什今天可能已与那些科学伟人齐名。
尽管如此,他在几个数学领域的重要贡献大家有目共睹。
他最大的成就来自于经济学方面。
由于他在博弈论上的开创性成就,他与约翰海萨尼(John Harsanyi)和莱茵哈德-泽尔腾(Reinhard Selten)一起获得了1994年诺贝尔经济学奖。
博弈论(潜在博弈、纳什均衡
博弈论(潜在博弈、纳什均衡潜在博弈和纳什均衡是博弈论中的重要概念。
潜在博弈是指在博弈开始之前,参与者对博弈规则和结果的假设和预期。
纳什均衡是指在博弈中,各参与者都采取最优策略时所达到的结果。
在现实生活中,我们经常会遇到各种潜在博弈的情况。
比如,在一个拍卖会上,卖家和买家都会根据对市场的了解和对对方行为的预期来制定自己的策略。
卖家希望以最高的价格卖出物品,而买家则希望以最低的价格购买物品。
他们的策略取决于对对方行为的预期,以及对市场供求关系的判断。
在这种情况下,纳什均衡的概念就显得尤为重要。
纳什均衡是指在博弈中,各参与者都选择了最优策略,没有人可以通过改变自己的策略来获得更好的结果。
换句话说,纳什均衡是一种稳定的状态,参与者不会主动改变自己的策略。
然而,纳什均衡并不一定是最优解。
在某些情况下,博弈参与者可能会因为缺乏信息或信任问题而无法达到纳什均衡。
在这种情况下,博弈参与者可能会采取非最优策略,导致整个博弈结果下降。
潜在博弈和纳什均衡的概念不仅适用于经济学领域,也可以应用于其他领域。
比如在政治上,各国之间的战略决策也可以看作是一种博弈。
每个国家都会根据对其他国家行为的预期来制定自己的策略,以达到自己的最大利益。
而纳什均衡的概念则可以帮助我们理解为什么有些国家会选择合作,而有些国家会选择对抗。
潜在博弈和纳什均衡是博弈论中的重要概念,可以帮助我们理解各种博弈情况下参与者的策略选择和结果。
在现实生活中,这些概念也可以应用于经济学、政治学等领域,帮助我们分析和解决各种复杂的决策问题。
通过理解和应用潜在博弈和纳什均衡的原理,我们可以更好地把握博弈中的机会和挑战,做出更明智的决策。
博弈论的主要均衡概念及其比较
博弈论的主要均衡概念及其比较【摘要】均衡概念是构成整个博弈论的基石,对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。
本文首先将博弈划分为不同的类型,并对主要的均衡概念进行了数学描述,最后对不同的均衡概念进行了比较。
【关键词】博弈论;纳什均衡;重复博弈博弈论在现代经济学中占据着相当重要的位置,在微观经济学的本科教学环节中,如果将博弈论这一部分排除在外,那么教学内容是不完整的,并且和现代微观经济学的发展严重脱节。
但是由于课时以及学生接受能力的限制,对博弈论的内容进行全面深入地讲解难以做到,因此,将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。
在博弈论的基本概念当中,最重要的当属博弈均衡的概念,这些概念的掌握有助于学生把握博弈论的整体框架,并对博弈论的后续学习至关重要。
因此,本文将主要的博弈均衡概念进行分类和表述,并对不同的博弈概念进行比较,以期对博弈论的教学有所助益。
一、博弈的主要类型博弈构成的基本要素包括:1、参与人(1~N);2、各个参与人各自可选择的行动集合Ai={ai};3、参与人i的策略Si,给定信息集,该策略决定在博弈的每一阶段他选择的行动;4、参与人的收益Ui (S1,S2…SN)。
依据不同的分类标准,博弈可以被划分为不同的类型。
1、静态博弈、动态博弈和重复博弈博弈各方同时选择策略的博弈称为静态博弈,如猜硬币、投标等,静态博弈一般可以用支付矩阵来表达。
动态博弈是指博弈各方按照一定的先后次序进行策略的选择,典型的例子如对弈,动态博弈一般可以用“博弈树”来表达。
Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。
重复博弈是指同一个博弈(静态或动态)反复进行所构成的博弈过程,如体育比赛中的多局赛制等。
2、完全信息和不完全信息博弈完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈,不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。
博弈论与纳什均衡——论理性人的婚姻法则
博弈论与纳什均衡——论理性人的婚姻法则博弈论与纳什均衡——论理性人的婚姻法则随着时代的变迁,人们对婚姻的期望也在发生变化,越来越多的人追求爱情、自由和平等的结合方式,婚姻关系也逐渐从传统的家族联姻转向基于个人选择和自主决策的结合方式。
然而,婚姻关系的稳定性和持久性仍然是婚姻学研究的热门话题。
博弈论被视为一种解决决策方案的数学方法,已经开始被应用于研究人类行为领域。
本文将探讨博弈论和纳什均衡在研究婚姻关系稳定性方面的应用,以及论理性人的婚姻法则。
提纲:I. 介绍A. 博弈论和纳什均衡基本概念B. 研究婚姻关系稳定性的必要性II. 博弈论应用于婚姻关系A. 纳什均衡和稳定性的关系B. 婚姻市场模型C. 基于博弈论的婚姻关系稳定性分析III. 纳什均衡和离婚率A. 离婚率和博弈论B. 纳什均衡和离婚率C. 博弈论分析离婚率的原因IV. 纳什均衡和婚姻满意度A. 婚姻满意度和博弈论B. 纳什均衡和婚姻满意度的关系C. 基于博弈论的婚姻满意度分析V. 论理性人的婚姻法则A. 博弈论和理性人决策B. 理性人的婚姻选择C. 理性人的婚姻关系维持VI. 基于博弈论的婚姻咨询A. 博弈论在婚姻咨询中的应用B. 婚姻咨询的目标和原则C. 基于博弈论的婚姻咨询案例分析VII. 未来展望A. 博弈论在研究婚姻问题中的局限性B. 婚姻关系研究的未来发展方向C. 博弈论在未来婚姻研究中的应用前景VIII. 结论A. 本文的主要贡献和局限性B. 未来研究的方向和建议C. 结论和总结I. 介绍本篇论文的第一部分主要是为读者引入本文的研究对象:博弈论和婚姻关系稳定性,并对这两个概念做基本的解释和说明,为接下来的探讨提供基础。
II. 博弈论应用于婚姻关系本文的第二部分主要集中在博弈论的应用方面,重点考察婚姻市场模型,探究基于博弈论的婚姻关系稳定性分析,以及纳什均衡和稳定性的关系。
III. 纳什均衡和离婚率本文第三部分主要集中在离婚率问题上,首先解释离婚率和博弈论的关系,然后重点探究纳什均衡和离婚率之间的关系,分析博弈论在理解离婚率的原因和趋势中的应用。
(完整版)博弈中纯策略纳什均衡点
《博弈论及其应用》 (汪贤裕) 9
完全信息静态博弈三要素
完全信息静态博弈就是在上述三要素的基础上,分 析各局中人为实现自身利益最大化的策略行为分析。
简记为: G [N ,{Si },{Pi }]
《博弈论及其应用》 (汪贤裕) 10
§2.1.2 占优均衡
(s
||
s
(i h
)
)
(2.1.1)
i 则称,局中人 的策略 sk(i) 严格占优策略 sh(i),或称策略 sh(i)相
对于sk(i)是严格劣策略。
《囚徒困境》中、犯罪嫌疑人A和B策略(承认)就是一个严
格占优策略。
《博弈论及其应用》 (汪贤裕) 12
定义2.1.2 占优均衡
在博弈G [N,{Si},{Pi}]中,若每一个局中人 i
定理2.2.1
在n 人非合作博弈 G [N ,{Si },{Pi }] 中:
若, s
都存在一个策略
s
' i
Si
, (i
N
)
,使得
si'占优于
Si \ {si' }
中任何策略,那么策略组合
s'
(
s1'
,
s
' 2
,
sn' )
称为 G 的占优策略均衡,简称占优均衡。对应的
{Pi (s') | i N} 称为占优均衡结果。
《博弈论及其应用》 (汪贤裕) 13
定义2.1.2 占优均衡(续)
《博弈论及其应用》 (汪贤裕) 17
§2.2.1 纯策略纳什均衡
定义2.2.1 纯策略纳什均衡点和均衡结果 定理2.2.1 重复剔除占优均衡与纯策略纳什均衡 ※ 纳什均衡点与多目标规划求解比较
博弈论 启发式算法和纳什均衡-概述说明以及解释
博弈论启发式算法和纳什均衡-概述说明以及解释1.引言1.1 概述博弈论是一门研究决策和策略的数学理论,它以个体或组织在面对冲突和竞争时的互动行为为研究对象。
在现实生活中,博弈论可以应用于各种领域,如经济学、政治学、社会科学等。
启发式算法是一种基于经验和规则的问题解决方法,它通过不断试错和搜索最优解的过程,逐步逼近问题的解。
启发式算法可应用于各种优化问题、组合问题以及决策问题等。
本文旨在探讨博弈论、启发式算法和纳什均衡之间的关系。
博弈论的基本概念将会被介绍,包括博弈的类型、参与者的策略选择、收益与支付等因素。
启发式算法的原理和应用将会被解释,以展示它们在解决博弈论问题中的潜力。
本文的结论将会重点探讨纳什均衡的概念和特点。
纳什均衡是指在博弈中,每个参与者根据其他参与者的策略选择下的最佳响应策略。
此外,还将探讨博弈论、启发式算法和纳什均衡之间的联系,以揭示它们在实际问题中的应用潜力和相互作用关系。
通过本文的阅读,读者将对博弈论、启发式算法和纳什均衡有更深入的理解,并能够将它们应用于实际问题的解决中。
本文的目的是为读者提供一种全面的视角,以便能够更好地理解和应用这些概念和方法。
1.2 文章结构文章结构:本文主要分为引言、正文和结论三个部分。
在引言部分,将对博弈论、启发式算法和纳什均衡进行简要概述,并介绍文章的目的。
正文部分将着重阐述博弈论的基本概念以及启发式算法的原理和应用。
最后,在结论部分将探讨纳什均衡的概念和特点,并深入讨论博弈论、启发式算法和纳什均衡之间的关系。
本文旨在通过对博弈论、启发式算法和纳什均衡的研究,探索博弈论在实际问题中的应用,并探讨启发式算法与纳什均衡的关联性,从而提供对博弈论和启发式算法的理解和应用以及对纳什均衡的深入认识。
1.3 目的本部分将重点介绍本文的目的。
通过阅读本文,读者将能够深入了解博弈论、启发式算法和纳什均衡之间的关系。
我们将首先简要介绍博弈论的基本概念,包括博弈的定义和元素,以及博弈论在经济学、政治学和计算机科学等领域的应用。
纳什均衡理论与博弈论的经济解释
纳什均衡理论与博弈论的经济解释导语:在经济学领域中,纳什均衡理论与博弈论是两个非常重要的概念,它们为我们解决各种经济问题提供了有力的工具。
本文将通过对纳什均衡理论和博弈论的解释,探讨它们在经济学中的应用和影响。
第一部分:纳什均衡理论的基本原理纳什均衡理论最早由约翰·福布斯·纳什提出,他通过对全局性决策和局部性决策的研究,提出了纳什均衡理论。
纳什均衡理论认为,在博弈过程中,当每个参与者都选择了最佳策略时,整个博弈系统将达到一个相对稳定的平衡点,即纳什均衡。
纳什均衡的基本原理可以通过一个简单的例子进行说明。
假设有两个参与者(甲和乙)参与一场博弈,分别有两种策略可供选择(策略A和策略B)。
如果甲选择策略A,乙选择策略A,它们的收益分别是10和10;如果甲选择策略A,乙选择策略B,它们的收益分别是5和20;如果甲选择策略B,乙选择策略A,它们的收益分别是20和5;如果甲选择策略B,乙选择策略B,它们的收益分别是0和0。
在这种情况下,甲乙双方最佳的选择是选择策略A,因为此时它们的收益最高。
所以,在这个例子中,策略A和策略A就是纳什均衡。
第二部分:博弈论的经济解释博弈论是研究决策者如何在相互竞争或合作的环境中做出最合理决策的一门学科。
在博弈论中,决策者被称为“玩家”,他们的选择被称为“策略”。
博弈论通过分析玩家的策略选择和相互作用的结果,揭示了决策者之间的相互影响和决策结果。
博弈论在经济学中的应用非常广泛。
它可以帮助我们分析市场竞争、资源分配、价格形成等一系列经济现象。
例如,在市场竞争中,博弈论可以帮助我们理解企业之间的策略选择和竞争结果。
在资源分配中,博弈论可以帮助我们分析个体如何在资源有限的情况下做出最优决策。
在价格形成中,博弈论可以帮助我们解释价格的形成规律和机制。
博弈论的经济解释不仅适用于市场经济,也适用于其他社会领域。
比如,在国际关系中,博弈论被广泛应用于分析国家间的决策和冲突。
运筹学与控制论综述
恒速机下的有限资源博弈排序最优性研究摘要排序问题是一类组合最优化问题,由于排序问题中的处理机、任务或作业是有限的,绝大部分排序问题是从有限个可行解中找出一个最优解,使目标函数达到极小.本文主要研究有限资源的博弈排序问题,我们考虑的资源是相同的,博弈的社会成本是实用的.在恒速机博弈排序模型中,每一个工件都可以自主选择一个合适的机器来加工它自己,这样每个工件的目标就是使它自己的成本最小.工件的成本是指它所选择的那台机器的总完工时间.本文的结构安排如下:第一章为绪论部分,主要介绍了排序问题、博弈论和纳什均衡问题、博弈排序的产生背景和主要内容以及后两章内容需要用到的一些预备知识.第二章考虑了恒速机下的博弈排序模型.在纳什均衡中,在每个工件的策略都不改变的情况下,任何一个工件都不能通过单方面的改变自己的策略来降低它的成本,但是纳什均衡不一定是最优的,实际上还常常与最优值存在很大差距.在这里我们使用POA(the price of anarchy)和POS(the price of stability)来分析纳什均衡的质量.当目标函数是总完工时间时,求得POA界和POS界.当目标函数是时间表长度时,求得POA界.第三章考虑了两台和m台带激活费用的恒速机模型,研究的整体目标函数是机器的总完工时间和激活费用之和,最后我们用POA来衡量纳什均衡时的最差的整体目标函数值与最优值之间的差异.两台机器时,我们假设机器的速度分别是1和a,每台机器的激活费用和它的速度相等,.m台机器时,我们假设机器的激活费用都是1,不随每台机器的速度变化,分别求得两种情况下的POA界.关键词:博弈排序;纳什均衡;恒速机;激活费用;POAAbstractScheduling problem is a kind of combinatorial optimization problems, due to the processor task or assignment is limited, so most of the scheduling problems is to find an optimal solution from limited feasible solutions, as to achieve the minimum of the objective function.In this paper, we investigate resource allocation games for job scheduling when the resource are limited. The resource we considered are identical and the social costs of the games are utilitarian. In terms of machine scheduling, assignment of jobs to machines in which selfish agents, representing individual jobs, select machines for processing the jobs, and each job will be minimize its cost. The structure of this article is as follows:The first chapter is an introduction, it mainly introduces the combinatorial optimization problems, the background of game scheduling and some preliminary knowledge.In the second chapter, we consider the load balancing game in uniform machines. A Nash equilibrium(NE) is a strategy profile, in any NE assignment, no job can reduce its cost by unilaterally changing its machine. But in terms of a given social objective, such an Nash equilibrium is not necessarily, indeed can often be far from optimal. We use the notions of the price of anarchy(POA) and the price of stability(POS) to analyze the quality of NE solutions.when the The objective function is Total completion time,we prove the POA and the POS. When the objective function is the makespan, we prove the POA.In the third chapter, we consider a system with two uniform machines and a fixed number m of uniform machines. The social cost is the sum of the system makespan and activation cost of machines. We assess the quality of Nash equilibrium in terms of the POA.we assume that the speed of the machine is 1 and a respectively, and the activation of each machine cost is equal to its speed when there are two machines. we assume that the machine activation cost is 1 and don't change with the speed of each machine when there are m machines, we prove the POA of two cases.Keywords:Game scheduling; Nash equilibrium; Uniform machines; activation cost; price of anarchy目录摘要 (I)第1章绪论 (1)1.1 排序问题的介绍 (1)1.2 博弈论和纳什均衡问题的介绍 (2)1.3 博弈排序问题的介绍 (3)1.4 本文研究的主要内容 (4)第2章无激活费用的恒速机博弈排序模型 (6)2.1 引言 (6)2.2 问题描述 (6)2.3 m台恒速机上社会成本为总完工时间的博弈排序问题 (8)2.4 m台恒速机上社会成本为时间表长度的博弈排序问题 (11)2.5 总结 (12)第3章带激活费用的恒速机博弈排序 (14)3.1 引言 (14)3.2 问题描述 (14)3.3 两台带激活费用的恒速机POA分析 (15)3.4 m台带激活费用的恒速机POA分析 (16)3.5 总结 (17)参考文献 (19)在读期间发表的学术论文及研究成果 (22)致谢 (23)第1章 绪论本章主要介绍了研究问题的背景,有关概念及其相关的研究进展,并简要说明了本文研究的主要成果及创新点.1.1 排序问题的介绍排序(scheduling )问题一开始主要应用于机器制造,后来被广泛应用,运输调度、计算机网络系统、生产管理等很多领域都要用到排序的理论和算法.排序是随时间对有限资源进行分配来执行一个给定的工作或活动,排序模型在工厂的应用和计算机系统的应用中起到很重要的作用.其他常见的排序问题有:项目调度,人员安排,制定时间表等.排序问题已经非正式的研究了几个世纪,Gantt Chart 用一个图形表示了在第一次世界大战中任务和资源随着时间的推移情形,这是应用排序的第一个正式模型,1950年代首次使用数学模型分析机器的调度问题,1970进一步研究了计算复杂性,现在,排序问题又广泛应用于现代制造业环境和供应链协调中.排序其实是一类重要的组合优化问题,它是利用一些机器(machine )、处理机(processor )或资源(resource )完成一批给定的任务(task )或作业(job ),使其结果最优,结果最优指的是使目标函数达到最小,而目标函数通常是对工件或任务的完工时间的长短、处理机的利用率、机器的总的费用等的描述.排序问题的三要素包括处理机、任务或作业和目标函数.处理机的数量类型和环境不同,作业或任务和资源的约束条件更是错综复杂,而且目标函数不同,形成了种类繁多的排序类型.我们普遍采用Graham 等人创立的三参数表示法(three-field representation )来描述一个排序问题[9].一般排序问题表示为:γβα||,其中,α域表示的是处理机的数量、环境和类型;β域表示的是作业或任务的性质、资源的数量,加工要求或者限制、作业或任务的种类和对加工的影响等条件,它可以同时包含许多项;γ域表示的是这个排序问题的目标函数.•α域(机器环境)1=α:指的是单处理机(single machine ).m P =α:m 个同速机,它指的是每台机器的速度都是一样的.m Q =α:m 个恒速机,它指的是机器的速度是不一样的,而且每台机器的速度都是一个常数,但是机器的速度并不依赖于被加工的工件.m R =α:m 个变速机,它指的是每台机器的速度不同,但是机器的速度依赖于被加工的任务.•β域(工件的加工约束和限制)p: 任务j的加工时间.jr:任务的到达时间.如果β中不出现j r,则表示所有的工件在0时刻都可以加工.jd:对任务j限定的完工时间.若不按期完工,则有一定惩罚.jω:工件j的权重,它表示工件j相对于其他的工件的重要程度.j•γ域(要优化的目标函数)C:最大完工时间,即时间表长,它等于排序最后一个工件的完工时间.max∑j C,∑j j Cω:总完工时间和,加权总完工时间和.L:最大延误,即最大工件延迟时间.max1.2 博弈论和纳什均衡问题的介绍博弈论是指研究多个个体或团队之间在特定条件制约下的对局中利用相关方的策略,而实施对应策略的学科.它是应用数学的一个分支,也是运筹学的一个重要组成部分,在很多领域都有广泛的应用.一般认为,博弈主要可以分为合作博弈和非合作博弈.合作博弈研究的主要是当人们达成合作协议时如何分配合作所得到的收益,就是所谓的收益分配问题;非合作博弈研究的主要是人们在利益相互制约的资源分配问题中如何选择自己的策略使自己的收益最大,就是策略决策问题.非合作博弈强调的是个人理性,个人的最优决策,其结果可能是有效率的,也可能是无效率的.本文研究的主要是非合作博弈.博弈广泛应用于资源分配中,例如:在作业调度应用中,任务分配给机器处理,同样,在沟通或交通网络,路由流量分配给网络链接.这些设置就是许多有趣的组合优化问题,但因为他们经常由多个战略用户决定,一个用户的个人收益由其他用户的决策决定,在资源分配分析中,博弈论已经成为一种必不可少的工具.在本文中,我们运用非合作博弈的理论研究资源分配问题,研究工件排序问题,博弈论的核心观点是假设每个客户都有战略上的考虑,都要使自己的成本最小,而不是最优化总体目标.在工件排序设置中,这意味着工件自己选择一个机器,而不是由一个中央管理者分配给一个机器.博弈论关注的是一个特定的环境或者是平衡点的稳定结果.一个纳什均衡是用户策略的组合,没有用户可以通过单方面偏离其策略来降低它的成本(考虑到其他用户的策略不会改变).当每个博弈者选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己的利益达到最大值,而且与此同时,其他所有博弈者也遵循这样的策略,所有博弈者策略构成一个策略组合(Strategy Profile),这时这个策略组合就被称为纳什均衡.纳什均衡,又称为非合作博弈均衡,是博弈论的重要核心,在非合作博弈理论中,没有成员可以单方面改变策略获得收益,一般来说,一个博弈可能是唯一的、多样的或者不均衡的.约翰·纳什在1994年诺贝尔经济学奖上分享了他关于博弈理论的工作,证明了在有限资源博弈中必须存在至少一个混合策略均衡.每个客户端和其他参与这一博弈的自私的客户各自都试图使自己的成本最小,我们称之为自私的负载平衡博弈.它不同于传统的负载平衡,然而,客户并不对最优的社会收益感兴趣,相反的,每个客户都有自己的私人目的,这些相互作用的稳定的结果就是纳什均衡(Nash equilibrium).在这个纳什均衡中,没有一个客户端可以通过单方面的改变自己的策略来提高他的收益.一般来说,一个资源分配的最优解往往是不稳定的,一个或更多的客户可能通过改变他们的策略来提高收益,而这样会导致其他的客户的收益变低.但是另一方面,纳什均衡下的社会成本与最优情况下的社会成本存在很大差距.1.3 博弈排序问题的介绍在组合最优化理论中,排序是为加工若干个工件,而对工件及其加工所需要的机器进行分配,在所有工件完工时的目标函数值最优.博弈是两个或多个局中人之间的博弈,并且假设参与博弈的局中人都是追求利益最大化.强调纳什均衡的存在和质量的博弈理论分析除了在工件排序有很大应用外,还被应用于各种各样的其他实际应用.比如用于费用分摊博弈(Jain and Mahdian 2007[8])其中引用,比如用于网络路由的设置(Correa et al[5],[6]. 2007,2004; Bonifaci et al[3]. 2010,Cominetti et al[4]. 2009, Awerbuch et al. 2005),用于网络建造(Fabrikant et al. 2003;Albers et al[2]. 2006, Anshelevich et al[1]. 2004, Epstein et al[7]. 2007).因为用户的成本函数引导他们的决策,成本函数的结构是任何博弈问题的一个重要组成部分,成本函数主要分为两类,第一类(如路由选择和工件排序)强调负拥堵效应,假设一个资源的成本随负载增加.相比之下,第二类(如创建网络)强调积极拥堵效应,假定一些固定的激活成本.在资源分配问题中,这两个拥挤效应是相互矛盾的,在现实情况下,激活一个新的“资源”是昂贵的,但与此同时缓解拥堵的负担.资源分配问题往往涉及决策问题,一个典型的例子就是机器的调度问题,把任务分配到机器上,这里每个工件都是一个自私的代理人,代表个人的工作,选择机器来处理自己的工作.从长远来看,每个代理人的决策出于个人利益,通常会形成一个纳什均衡,这样,在这个资源分配中,没有一个代理可以通过单方面的改变策略获得收益.我们假设工件相当于独立的局中人,工件自主选择机器进行加工而不是被安排到某台机器上进行加工,工件所选择加工的机器相当于局中人的策略.工件选择使自己的加工费用最少的机器进行加工,这就将可能达到纳什均衡.使目标函数为最优的可行解,称为最优排序(optimal schedule).在资源分配博弈中,纳什均衡时的总花费往往不是最小的,NE值有时与最优值相差很大,所以,我们常用POA(the price of anarchy)和POS(the price of stability)两个参数来衡量纳什均衡的目标函数值和最优值之间的差距,这两个参数最早是由Koutsoupias和Papadimitriou[13]两个人提出的.我们把所有可能的工件安排方案记为S ,每一种安排方法()S s s s n ∈=,,1Λ,排序s 的社会成本函数记为)(s g ,是所有工件的最高费用,()()s c s g j j max =.我们用OPT 表示最优的分配方案,()s g OPT S s ∈=min .令ξ是一类博弈排序问题,G 是这一类博弈排序问题中的一些博弈问题,且ξ∈G ,()G ϕ是纳什均衡解的集合,如果()φϕ≠G ,我们用POA 表示最差的纳什均衡解与G 的最优值的比值,用POS 表示最好的纳什均衡解与G 的最优值的比值.()()()G OPT s g G POA G s ϕ∈=max )(,()()()G OPT s g G POS G s ϕ∈=min )(. 1.4 本文研究的主要内容本文主要研究有限资源的博弈排序问题,我们考虑的资源是相同的,博弈的社会成本是实用的.在恒速机博弈排序模型中,每一个工件都可以自主选择一个合适的机器来加工它自己,这样每个工件的目标就是使它自己的成本最小.工件的成本是指它所选择的那台机器的总完工时间.本文的结构安排如下:第一章为绪论部分,主要介绍了排序问题、博弈论和纳什均衡问题、博弈排序的产生背景和主要内容以及后两章内容需要用到的一些预备知识.第二章考虑了恒速机下的博弈排序模型.纳什均衡不一定是最优的,实际上还常常与最优值差距很大.在纳什均衡中,在每个工件的策略都不改变的情况下,任何一个工件都不能通过单方面的改变自己的策略来降低它的成本,但是纳什均衡不一定是最优的,实际上还常常与最优值存在很大差距.本章考虑了m 台恒速机下的博弈排序问题,在这里我们使用POA (the price of anarchy )和POS (the price of stability )来分析纳什均衡的质量.当目标函数是总完工时间时,求得⎪⎭⎫ ⎝⎛+≤11m n s s POA m ,()()()n m m m n s s POS m +---+≥31111.当目标函数是时间表长度时,求得12s s POA m≤.第三章考虑了两台和m 台带激活费用的恒速机模型,研究的整体目标函数是机器的总完工时间和激活费用之和,最后我们用POA 来衡量NE 时的整体目标函数值与最优值之间的差异.两台机器时,我们假设机器的速度分别是1和a ,每台机器的激活费用和它的速度相等,求得a POA +<1.m 台机器时,我们假设机器的激活费用都是1,每台机器的速度不同, m s s s s ≤≤≤≤Λ321,求得m s P n s Wn m POA min11⋅+⋅+≤.第2章 无激活费用的恒速机博弈排序模型第2章 无激活费用的恒速机博弈排序模型2.1 引言本文中的资源分配博弈我们考虑如下,给定一个工件集{}n ,,2,1Λ,每个工件都有一个加工时间,也叫长度,并且都是由自私的代理商控制,每个代理决定选择同类机中的一个来分配自己的工作.我们考虑这个博弈模型:恒速机博弈排序模型.在这个恒速机博弈排序模型中,给定m 台机器,机器的负载就是每个玩家的成本,这里机器的负载就是指被安排的所有工件的长度和.像许多其他博弈,在资源分配博弈中,纳什算法的成本往往不是最小的,与之相对应的解决方案被称为最优.在这篇文章中,我们使用能被普遍接受的概念POA (the price of anarchy )和POS (the price of stability )来分析纳什算法的质量.Koutsoupias 和Papadimitriou [13]在1999年,Papadimitriou [14]在2001年都介绍了这一概念,POA (the price of anarchy)表示最差的NE 排序的目标函数值与最优值的比值,POS (the price of stability )表示最好的NE 排序的目标函数值与最优值的比值.1999年,Koutsoupias 和Papadimitriou 给出了新的术语POA (the price of anarchy)替代原来的术语 “coordination ratio”(协调比率).V ocking [21] 在2007年研究了经典的平行机博弈模型,并且已经被广泛的研究.2012年,Bo Chen 和Sinan Gurel [27]分析了同型机博弈模型的效率,他们所考虑的机器是同型机,而本文考虑的机器是恒速机.2.2 问题描述有m 台机器{}m M M M M ,,,21Λ=,机器台数2≥m ,每台机器的速度不同,加工n 个工件{}n J ,,2,1Λ=.每一个工件J j ∈都有一个加工时间,即长度j p ,且0>j p .对于给定的一个分配方案,我们把分配到机器i 上的工件分别表示为[]i J ,分配到机器i 上的工件个数表示为i n ,这个分配方案下机器i 的负载可以表示为[]∑∈=i J j j i p L .在这个恒速机博弈模型中,一个工件的花费就是这个工件被安排的机器的负载,给定的这个分配方案的所有工件的花费为∑==mi i i L n C 1.如果给定的这个分配方案是最优方案,我们就用*i J ,*i n ,*i L 分别表示分配到机器i 上的工件,机器i 上的工件个数,机器i 上的负载.下面给出本章中的一些符号定义:j p : 第j 个工件的加工时间.∑jc:所有工件的总完工时间.i L :第i 台机器的负载.i s : 第i 台机器的速度.i n :第i 台机器上工件的个数.i C :第i 台机器上工件的完工时间之和.max C :机器的最大完工时间.P :所有工件的加工时间.本章所研究的问题如下:(1) ,即m 台恒速机上社会成本为总完工时间的博弈排序问题,这个模型为m 台恒速机,每台机器的速度分别为m s s s Λ,,21,且m s s s s ≤≤≤≤Λ321,每台机器没有激活费用,要优化的目标函数为总完工时间.(2) ,即m 台恒速机上社会成本为时间表长度的博弈排序问题,这个模型为m 台恒速机,每台机器的速度分别为m s s s Λ,,21,且m s s s s ≤≤≤≤Λ321,每台机器没有激活费用,要优化的目标函数为最大完工时间.定义2.1 如果()φϕ≠G ,POA (the price of anarchy)表示最差的纳什均衡排序的目标函数值与最优值的比值,即()()()G OPT s g G POA G s ϕ∈=max )(.POS (the price of stability )表示最好的纳什均衡排序的目标函数值与最优值的比值,即()()()G OPT s g G POS G s ϕ∈=min )(.m j jQ ut c c =-∑max m j Q ut c C =-2.3 m 台恒速机上社会成本为总完工时间的博弈排序问题定理2.1 在任意纳什均衡排序中,机器的负载都满足:ji k k p L L s ≤+,.其中,[]i J 表示第i 台机器上的工件.定理2.1简单的说就是,在任意纳什排序中,没有工件可以通过单方面的改变机器来减少它的费用.下面,我们根据理2.1来证明eC 1的上界,我们这里所说的eC 1指的是纳什排序中所有任务的总的花费.定理2.2 在任意纳什均衡排序中,机器的总的费用满足:⎪⎪⎭⎫ ⎝⎛+≤=∑=k m i i i e sms n P L n C 1111. 证明:对于任意常数i ()m i ≤≤1,我们选择引理2.1中的k 和j ,得到下面不等式∑=≤≤≤=mi ikmk ks PLL11min ,[]iii j J j j n s L p p i ≤='∈'min . 其中任意常数i 表示第i 台机器,k L 表示第k 台机器的负载,j 表示第i 台机器上其中一个工件. 上面两个不等式很明显,因此,我们得到k j k i s p L L +≤ ki ii mi is n s L sP+≤∑=1. 定理2.2中eC 1的上界取决于所有工件的总长度,工件的个数,机器的个数.下面我们得到结果∑==mi iie Ln C11[],1,i j J i k m ∀∈≤≤∑∑∑===+≤mi kii mi mi iis s L sPn 111P s sPn kmi i⋅+⋅=∑=11P s ms n k ⎪⎪⎭⎫⎝⎛+≤11,证毕 然而在最优排序中,所有任务的总的花费为:∑==mi i i L n C 1***1∑=≥mi i L 1*[][][]mJ j jJ j jJ j js ps ps pm ∑∑∑∈∈∈+++=Λ2121ms P≥. 下面我们用最差的纳什均衡的目标函数值与最优值之间的比值来衡量纳什排序的质量,即POA .mk es P P s ms n C C ⎪⎪⎭⎫ ⎝⎛+≤11*11 km m s s ms n s +=1⎪⎭⎫ ⎝⎛+≤11m n s s m .因为上述不等式对于恒速机下的问题()M J ,的所有例子都成立,所以⎪⎭⎫ ⎝⎛+≤11m n s s POA m , 得证 以上分析我们得到 ⎪⎭⎫ ⎝⎛+≤11m n s s POA m .下面我们考虑一个例子来求POS 的下界.例子2.1 有m 台机器,1-m 个长度为i s 的大工件,n 个长度为n s m的小工件.假设m n >,n 是()1-m m 的倍数,即()1-=m km n .考虑纳什状态下的任务分配:每个大工件分别安排在前()1-m 个机器上,所有的小工件都安排在最后一台机器上.所以,纳什状态下的总费用为:()n n s n s m C mm e ⋅⋅⋅+-=111 n m +-=1.考虑这样一种分配:所有的大工件都安排在一台机器上,所有的小工件安排在剩下的机器上.这个分配得到最优状态下总费用的上界.()km km s n s km km s n s m s s s s s s C m m m m ⋅⋅⋅++⋅⋅⋅+-⎪⎪⎭⎫ ⎝⎛++++≤-11112111312*1ΛΛ ()⎪⎪⎭⎫⎝⎛++⋅-+-⎪⎪⎭⎫ ⎝⎛++=-m m m m m s s s s s s m km m s s s s 32112111Λ()()2112111s m s m km s s m m m -⋅-+-≤-()[]km m s s m+-≤211. 下面我们用最好的纳什均衡的目标函数值与最优值之间的比值来衡量纳什排序的质量,即POS .()[]kmm s s nm C C m e +-⋅+-≥21*1111 ()()()nm m n m s s m +--+-⋅=31111, 所以,以上分析我们得到()()()nm m m n s s POS m +---+≥31111.2.4 m 台恒速机上社会成本为时间表长度的博弈问题这个模型中有m 台恒速机,每台机器的速度分别为m s s s Λ,,21,且m s s s s ≤≤≤≤Λ321,机器没有激活费用,要优化的目标函数为最大完工时间.定理2.4 在任意纳什排序中,机器的最大完工时间满足:1min 1max s pms P C e+≤. 证明:在纳什排序中, ,由上面两个不等式,我们得到,kj i es p C C+≤max∑=≤'≤'≤=mi imi i i sPC C 11min min p p j =1min 1s p ms P +≤kmi is p sPmin 1+≤∑=得证而在最优排序中,机器的最大完工时间满足mL C mi i ∑=≥1**m ax[][]m s ps pmJ j jJ j jm ∑∑∈∈++≥Λ11[][]m s ps pmJ j jmJ j jm ∑∑∈∈++≥Λ1mms P ≥.下面我们用最差的纳什均衡的目标函数值与最优值之间的比值来衡量纳什排序的质量,即POA .Pms s p ms P C C m e⋅⎪⎪⎭⎫ ⎝⎛+≤1min 1*max max⎪⎭⎫ ⎝⎛+⋅≤P mp s s m min 11⎪⎭⎫ ⎝⎛+⋅≤P P s s m 1112s s m ≤,根据以上分析我们得到12s s POA m ≤.2.5 总结纳什均衡不一定是最优的,实际上还常常与最优值差距很大.在纳什均衡中,在每个工件的策略都不改变的情况下,任何一个工件都不能通过单方面的改变自己的策略来降低它的成本,但是纳什均衡不一定是最优的,实际上还常常与最优值存在很大差距.本章考虑了m 台恒速机下的博弈排序问题,在这里我们使用POA (the price of anarchy )和POS (the price of stability )来分析纳什均衡的质量.当目标函数是总完工时间时,求得⎪⎭⎫ ⎝⎛+≤11m n s s POA m ,()()()n m m m n s s POS m +---+≥31111.当目标函数是时间表长度时,求得12s s POA m≤.第3章 带激活费用的恒速机博弈排序本章研究了两台和m 台恒速机情形下的资源分配问题.有两台机器时,我们假设机器的速度是1和a ,每台机器的激活费用和它的速度相等;有m 台机器时,我们假设每台机器的速度都不同,每台机器的激活费用都为1.研究的整体目标函数是机器的总完工时间和激活费用之和.我们用POA 来衡量纳什均衡时的最差的整体目标函数值与最优值之间的差异.3.1引言不同人员之间成本花费的分配是一个常见的问题,所以大量的分配规则被提出(Moulin and Shenker [17][18]1992,2001; Herzog, shenker and Estrin [16]1997),这些分配规则都注重效率和公平.一些学者研究的重点是基于自私代理行为和不同的费用分摊规则下的纳什均衡的存在和效率问题(Perakis [19] 2007, Perakis and Roels [20] 2007, Bernstein and Federgruen [15] 2001). 在这个模型中,我们假设有有限台恒速机,每台机器使用时都有额外的激活费用.工件自主选择机器进行加工,而不是被特定安排到某台机器上进行加工.在本章中,我们研究的整体目标函数为所有被激活机器的总完工时间和总的激活费用之和.3.2 问题描述本章中要用到的数学符号如下:j p : 第j 个工件的加工时间.B :机器的激活费用.()s b j :在s 这种排序下,工件j 的分担激活费用.j p : 第j 个工件j J 的加工所用的时间. ()s c j :在s 这种排序下,工件j 的完工时间. i n :第i 台机器上工件的个数.)(s L i :在s 这种排序下,工件j J 在机器i 上的负载.工件j 的个体费用函数(Individual cost function)为:()()()s b s L s c j i j +=, 其中,()()B s L p s b i j j ⋅=.举一个例子:激活费用18=B ,两个长度分别为1和2的工件.则每个工件的完工时间分别93183)(1=+=s c ,1531823)(2=⋅+=s c .引理 3.1(Michal Feldman, Tami Tamir 2012)在任意纳什排序s 中,对于任意工件j ,B p s c j j +≤)(.引理3.2(Michal Feldman, Tami Tamir 2012)长度为j p 的工件被安排在负载小于激活费用B 的机器上,且B p j <,不能通过转移到负载大于B 的机器上或者用一台专用机减少它的花费.引理3.3(Michal Feldman, Tami Tamir 2012)如果激活费用∑≥j j p B ,在纳什排序s 中所有工件被安排到一台机器上.3.3 两台带激活费用的恒速机POA 分析有两台机器{}21,M M M =,加工n 个工件{}n J ,,2,1Λ=.设第一台机器1M 的速度为1,激活费用也为1,设第二台机器的速度为a ,激活费用也为a ,且1>a .W 为所有工件的加工时间之和,∑==nj j p W 1.S 表示问题()M J ,的所有排序s 的集合,则最优排序的整体目标函数值为:()s SC OPT Ss ∈=min .()G ϕ是纳什均衡解的集合,如果()φϕ≠G ,我们用POA 表示最差的纳什均衡解与G 的最优值的比值,即()()()G OPT s g G POA G s ϕ∈=max )(.定理3.1 若有两台带激活费用的恒速机可被激活,速度分别为1和a ,则a POA +<1. 证明 当a W ≤时,W OPT +≥1,则WW a POA +++<11 WW a a +++++<1)1(1a +=1,当a W >时,⎭⎬⎫⎩⎨⎧++++≥a W a a W a OPT 11,min ,则 ⎭⎬⎫⎩⎨⎧++++++<a W a a W a W a POA 11,min 1。
论博弈论与纳什均衡的影响及局限
论博弈论与纳什均衡的影响及局限博弈论是研究人类决策行为的一个分支学科,它将决策者之间的互动和影响视为一个博弈过程,试图通过数学模型来预测各方决策的可能性和结果。
博弈论在经济学、社会学、政治学等领域有着广泛应用,其中最为重要的成果之一就是纳什均衡理论。
纳什均衡理论是博弈论中最为著名的理论之一,它描述的是一个博弈过程中,所有参与者都在采取最优策略的情况下,达到了一个互相依赖、互不干扰的平衡状态。
这个平衡状态不一定是最优的,但却代表了所有决策者所能达到的最好结果。
纳什均衡理论的应用范围非常广泛,它被广泛应用于经济学、社会学、政治学、生物学等领域。
然而,纳什均衡理论也存在着一些局限性。
首先,纳什均衡只是一个理论模型,它无法针对复杂的现实问题进行精确的预测。
尤其是涉及到非理性因素和不确定性的情况下,纳什均衡理论的预测能力往往有限。
其次,纳什均衡理论的前提是每个参与者都是理性的、自私的,具有完美的信息和判断能力,但现实生活中存在很多非理性的行为和信息不对称的情况,这使得纳什均衡理论的应用受到一定限制。
另外,纳什均衡理论还存在一些争议的问题。
例如,它忽略了博弈参与者之间的合作和协调,而只考虑了竞争和对抗的情况。
在实际生活中,很多问题都需要协作和合作才能得到解决,纳什均衡理论对这些问题的解释和预测能力有限。
综上所述,纳什均衡理论虽然具有重要的理论意义和实践应用价值,但也存在着一些局限性和限制。
在今后的研究和应用中,我们应该不断探索和拓展博弈论的理论体系,使其能够更好地应对复杂现实问题的挑战。
同时,我们也应该保持谨慎和清醒的态度,尊重现实问题本身的复杂性和多样性,不断通过实践和研究来完善相关理论和方法。
博弈论公式纳什均衡博弈树博弈矩阵
博弈论公式纳什均衡博弈树博弈矩阵博弈论:公式、纳什均衡与博弈树、博弈矩阵博弈论是一门研究决策制定的数学理论。
在博弈论中,存在多个参与者(称为玩家),他们通过制定策略并参与互动,在特定的规则下寻求最佳的决策结果。
本文将介绍博弈论中的一些基本概念,包括公式、纳什均衡、博弈树以及博弈矩阵。
一、公式公式在博弈论中起到了重要的作用。
公式是对博弈过程中的选项和结果进行模型化表示的数学表达式。
通过建立公式,可以更好地理解玩家之间的关系以及可能的结果。
例如,对于两名玩家参与的零和博弈(zero-sum game),其最基本的公式可以表示为:v = max(min(U1(x), U2(y))), ∀x ∈ X, y ∈ Y其中,v表示最终结果的价值,U1(x)和U2(y)分别表示玩家1和玩家2在选择策略x和y时的收益。
通过解析公式,可以确定最优的策略选择,以达到最大化自身的收益。
二、纳什均衡纳什均衡是博弈论中的一个核心概念,指的是在一个博弈中,每个玩家都选取了最优策略后的状态,无法通过改变个体策略来获得更好的结果。
换句话说,纳什均衡是一个稳定状态,每个玩家都做出了最佳的决策,不愿意单方面改变策略。
在一个简单的二人博弈中,假设两名玩家的策略集分别为X和Y,玩家1和玩家2的收益函数分别为U1(x, y)和U2(x, y)。
纳什均衡的定义可以表示为:∀x ∈ X, y ∈ Y, U1(x*, y) ≥ U1(x, y*), U2(x, y*) ≥ U2(x*, y)其中,(x*, y*)表示纳什均衡点,满足这一条件时,博弈达到了稳定状态。
三、博弈树博弈树是用于描述博弈过程的一种图形表示方法。
博弈树可以将博弈的各个阶段以及玩家的决策路径清晰地展示出来,有利于分析和理解博弈的策略选择。
考虑一个简单的两人博弈,玩家1在第一轮有两个策略可选,分别为A和B;玩家2在第二轮有三个策略可选,分别为C、D和E。
通过构建博弈树,可以描述出博弈的整个过程。
博弈论贝叶斯纳什均衡
博弈论贝叶斯纳什均衡一、引言博弈论是研究决策者在相互影响中做出决策的科学。
贝叶斯纳什均衡是博弈论中的一种解法,它考虑了不完全信息下的决策问题,被广泛应用于经济学、政治学、计算机科学等领域。
本文将从博弈论和贝叶斯纳什均衡两个方面进行详细介绍。
二、博弈论1.基本概念博弈论中有三个基本概念:玩家、策略和收益。
玩家是参与游戏的实体,可以是个人、组织或国家等。
每个玩家都有自己的目标和利益。
策略是指玩家在游戏中做出的选择。
每个玩家都有多种可选的策略,每种策略都对应着不同的收益。
收益是指每个玩家在游戏结束后获得的利益或损失。
收益可以用数字表示,也可以用其他方式来描述。
2.分类根据游戏参与者数量和信息情况,博弈论可以分为以下几类:(1)单人博弈:只有一个玩家参与游戏,如囚徒困境。
(2)双人博弈:有两个玩家参与游戏,如零和博弈、非零和博弈等。
(3)多人博弈:有多个玩家参与游戏,如合作博弈、竞争博弈等。
(4)完全信息博弈:每个玩家都知道其他玩家的策略和收益情况,如国际象棋。
(5)不完全信息博弈:每个玩家只知道自己的策略和收益情况,不知道其他玩家的策略和收益情况,如扑克牌。
3.解法解决一个博弈问题需要找到一种最优的策略组合,使得每个玩家都能够获得最大化的收益。
常见的解法有纳什均衡、帕累托最优解等。
三、贝叶斯纳什均衡1.基本概念贝叶斯纳什均衡是指在不完全信息下的多人博弈中,每个玩家根据已知信息做出最优选择所形成的策略组合。
它包含两个部分:先验概率和后验概率。
先验概率是指每个玩家在游戏开始前对其他玩家的策略和收益情况所做的预测。
后验概率是指每个玩家在游戏进行过程中,根据已知信息对其他玩家的策略和收益情况所做的修正。
2.求解方法贝叶斯纳什均衡的求解方法可以分为两种:直接求解和迭代求解。
直接求解是指通过计算每个玩家在不同信息情况下的期望收益,找到满足条件的最优策略组合。
这种方法适用于信息量较少、博弈参与者较少的情况。
迭代求解是指通过反复修正先验概率和后验概率,最终找到满足条件的最优策略组合。
《博弈论基础》读书笔记(一)博弈标准式与纳什均衡
《博弈论基础》读书笔记(⼀)博弈标准式与纳什均衡在之前⼀个⽼师的安利下,还是开了这个博弈论的坑。
书是:这本书本⾝写的⾮常棒,⽽且很易懂,强烈安利。
顺便⾃⼰记录下读书的笔记和⼀些想法,同时也把书中⽐较难理解的地⽅⽤⾃⼰的理解说⼀下,希望能帮到⼤家。
第⼀章 1完全信息静态博弈在本章,我们来讨论如下简单形式的博弈(包含如下特点):1. 静态博弈:所有游戏的参与者同时选择⾏动,然后根据⾏动每个参与者得到各⾃的结果2. 完全信息博弈:即每⼀个参与者的收益函数在所有参与者之间是共同知识,即不存在信息的不对称性,也就是说每个参与者对游戏规则以及游戏演化机理完全明⽩。
关于本章的结构:在1.1节中我们先会介绍两个问题:1. 如何描述⼀个博弈问题2. 如何求得博弈问题的解在1问题中我们定义了博弈的标准式表述和严格劣战略的概念,在2问题中我们根据前⾯的介绍引出了纳什均衡的概念。
在1.2节中我们会运⽤前⾯的⼯具来分析古诺(Cournot,1838)的不完全竞争模型,使⽤纳什均衡的⽅式对之进⾏求解,之后我们将重回理论知识,我们将会定义混合战略,它可以理解为⼀个参与者并不能确定其他参与者会如何⾏动时应该选的战略,之后会引出纳什定理。
1.1节博弈的标准式和纳什均衡1.1.A 博弈的标准式表述⾸先举⼀个⼤家都⽐较熟悉的、很经典的例⼦:囚徒困境警⽅逮捕甲、⼄两名嫌疑犯,但没有⾜够证据指控⼆⼈⼊罪。
于是警⽅分开囚禁嫌疑犯,分别和⼆⼈见⾯,并向双⽅提供以下相同的选择:若⼀⼈认罪并作证检控对⽅(相关术语称“背叛”对⽅),⽽对⽅保持沉默,此⼈将即时获释,沉默者将判监10年。
若⼆⼈都保持沉默(相关术语称互相“合作”),则⼆⼈同样判监1年。
若⼆⼈都互相检举(相关术语称互相“背叛”),则⼆⼈同样判监8年。
对于这个博弈我们可以来使⽤如下矩阵来进⾏描述对于这个矩阵,其横纵轴分别为囚徒1、2所对应的选择。
⽅框⾥的值第⼀项代表在此选择下,囚徒1 的收益情况,第⼆项代表囚徒2的收益情况。
博弈论01纳什均衡4
博弈论绪论学习选择学会放弃绪论学习选择学会放弃绪论学习选择学会放弃绪论学习选择学会放弃绪论学习选择学会放弃绪论学习选择学会放弃绪论学习选择学会放弃囚徒困境囚徒困境囚徒困境价格竞争价格竞争囚徒困境的理解显然,不论是从两个囚徒整休来看,还是从他们各自来看,两人都供认的结局都不如两人都抵赖的结局。
由于这种结局具有必然性,虽然不理想但又很难摆脱,所以称为囚徒困境囚徒困境模型同时揭示了两个矛盾:一个是个体理性与团休理性之间的矛盾,从个体利益最大化出发的行为往往不能实现团体的最大利益;另一个是个体理性本身的内在矛盾,即使从个体利益最大化出发的行为最终也不一定能真正实现个体的最大利益,甚至会得到相当差的结果。
囚徒困境的理解囚徒困境是很多社会现象的简单抽象,可以说是理性的人类社会活动最形象的比喻。
它准确地描述了人类社会中所存在的互相之间不信任和相互防范的一面。
在无法改变他人选择的情况下,背叛常常是使自己避免风险的最好选择。
上述结论是在理性人假设之下得到的。
理性人可以理解为广义上的利己之人。
人是生而利己的,利他是后天习得的,其实也是一种利己的扩大化。
利己而不损人,利人而不损己损人利己,长不了,好不了;损己利人,多不了,也长不了利己心是推动社会发展的原动力。
军备竞赛军备竞赛公地悲剧注水简历写简历应该如实介绍还是夸大其词,也是囚徒困境式的博弈。
关税之战两个国家,在进口关税上都有两种选择:提高关税,以保护本国同类商品。
(背叛)降低关税,以利各自商品的流通。
(合作)当一国独自提高关税时,另一国也会做出同样反应,会引发关税战,两国商品均会失去对方的市场,同时对本国经济也造成损害。
员工困境一名苛刻的经理和手下数名员工。
如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都要超负荷工作;如果某人不听从吩咐,其他人听从吩咐,则此人下岗,其他人继续工作;如果所有人都不听从经理吩咐,则经理下岗。
由于员工之间信息不公开,都担心别人听话自己不听话而下岗,所以大家只能继续繁重的工作。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
全措垄施断,情产况生下人博只必弈有须问一考题个虑。卖自方己,的没行有动竞对争竞者争;对而手在
完全竞争情况可下能,产一生家的公影司响不。可同能时跟也踪要极分其析多竞的
竞争者的所有争行者动可。能做的事情。否则,危险便
在现实中最会多接见踵的而市至场。情而况博是弈寡论头正垄是断擅和长垄分断
绪论 学习选择 学会放弃
09:42 博弈论
博弈论的学习目的:
初步认识博弈论的基本思想和 典型问题,建立策略思维的意识, 了解策略更思重维要的的方是法不。但要知道博弈论说了些
什么,而且要学习运用博弈论的思想和 方法分析现实生活中遇到的各种问题, 无论把你它学当到成了分多析少和博描弈述论自的己概身念边和事方情法的,有 当你真效正方面法临,一提个高具观体察问问题题时、,分都析不问能题生、解 搬硬套决。问解题决的问能题力的。关键是开动自己的大 脑,冷静地将各种理论、方法和具体情况 综合起来思考,找出尽可能好的解决办法。
绪论 学习选择 学会放弃
09:42 博弈论
博弈论研究什么−从我们身边说起
为何学习博弈论−遵从社会活动规律
如何学习弈论−问题导向归纳提炼联系实际
研究具有相互依存 性的策略选择问建题立策略思维的意识
了解策略思维的方通法过典型问题 理解基本方法
囚徒困境
09:42 博弈论
囚徒乙
囚徒甲和囚徒乙
供认 抵赖
09:42 博弈论
为何要研究具有相互依存性的策略选择问题?
首先,策略选择问题在我们每个人的 日常生活、学习和工作会常常遇到。
其次,这类策略选择问题都有一个共 性,就是相互依存性。在你做出选择的 同时别人也在进行选择,他们的选择与 你的选择相互影响、相互作用。 具有相互依存性的策略选择问题不仅存在 于下棋、打牌及体育比赛等活动中,还广泛 地存在于人们的各种社会活动和日常生活中。 只要存在人的互动情况,就存在博弈问题。
博弈论
绪论 学习选择 学会放弃
09:42 博弈论
博弈论研究什么?
博弈一词最早见于《论语孟子·阳货第十七 篇》,子曰:“饱食终日,无所用心,难矣 哉!不有博弈者乎?为之,犹贤乎已。”
朱熹《论语集注》:“博,局戏也。弈, 围棋也。”
新华字典、现代汉语 词典、辞源等对博弈的 解释,除了指六博和围 棋外,也泛指赌博。
争、寡头垄断和完全垄断。
完其全中垄寡断头指垄市断场往中往只出有现一在个生卖产家;完全竞争指
市高场度中集有中充的分行多业个。卖如家钢和铁买、家石,油任、何人都不能单
独汽影车响、市飞场机价、格家,电是等理。想寡的头市厂场商状态。在这两种
市为场保中持人自们身都地不当位必市会担场采心上取策只种略有种的几排相家他互公作司用时。,因局为中完
是参与博弈的两方,
称囚徒甲为甲供 认 抵 赖行和动乙−−或69都−−者各61策有−−略两13 −−个。93 选如择果的 称 在 左,甲称所为 一 下一为得收 起 方个局,益 称 为对中即或为甲局人博者收的下。弈支益收局的付矩益中结,阵,人果放。右,
选择了抵赖、乙选择了供上认方,为乙的收益。对局 称为一个对局或者策略组(合抵,赖,供认)的结果记 记为(抵赖,供认)。 为(−9, −1)。
囚徒困境
09:42 博弈论
囚徒乙
博弈论中假设局中
供认 抵赖
人都是理性人,就是
供 −6 −9
囚 徒 甲
认 抵
−6 −1
−1 −3
赖 −9 −3
局中人在博弈中总是 以自身利益最大化为 相决对策来的说原,则抵。赖称为
甲的下策,抵赖也是乙
供认是甲的上策,供的认下策。下策不应该使
也是乙的上策,(供认用, ,删除后只剩下(供 供认)是一个上策均衡认,,供认)一个策略组合, 双方的得益为(−6,−6即)为。均衡策略组合。
法茨律、埃里克·马斯金、罗杰·迈尔森以 创立和发展机制设计理论方面的贡献 获得诺贝尔经济学奖。
绪论 学习选择 学会放弃
09:42 博弈论
博弈论可以作为社会科学的一种一
般分析方法,同时也是分析和说明我 们日常人生类活社中会遇中到的的博问弈题现的象学,问与。自然
界中的很多自然现象相类似。 美国史密斯学院经济学助理教授詹
囚徒困境
09:42 博弈论
囚徒乙
供认 抵赖
供 −6 −9
囚 徒 甲
认 抵
−6 −1
−1 −3
赖 −9 −3
可以将供认看成背叛 同伙的策略;抵赖是与 同伙合作的策略。
由于双方无法串供,也无法相信对方
一定会与自己合作,所以只能从自身利
益最大化来选择,即选择背叛的策略。
价格竞争
09:42 博弈论
经济学中将市场分为四类:完全竞争、垄断竞
游戏结果的关键因素。特别引起人们兴趣的是
参赛者之间在策略选择上具有相互依存性,游
戏的结果不仅取决于自身的策略选择,还取决
于其他参赛者的策略选择。每位参赛者在做出 自G己am的e选T择he时or必y正须是充研分究考这虑类其具他有参相赛者的选择。 互依存性的策略选择问题的理论。
绪论 学习选择 学会放弃
姆斯·米勒在其著作中写到:“不理解 当代博经弈济论学的全人才,保在罗与·萨掌缪握尔博森弈也论说的过人:相 研究博“ 你和弈要 必发论想须展不处在对,仅时现博更影,代弈重响很社 论要着容会 有的社易做 一是会就一 个它科在个 大正学战有 致改的术文 的上化了失的解去人。优,”势。” 变着人们的思维习惯。
甘肃出土:六博木俑
绪论 学习选择 学会放弃
09:42 博弈论
博弈论译自英文Game Theory。Game在 英文中的含义有“游戏、运动及竞技比赛、 运动在会这”类等游,戏比活如动O中lym,p一ic 旦Ga身m体es条;件还、有技术水 “平计等谋因、素花既招定”以的后意,思策。略选择的好坏就是左右
绪论 学习选择 学会放弃
09:42 博弈论
博弈论的19应94用年范诺围贝:尔经济学奖 德国柏林大学莱因哈德·赛尔腾因在非
合作博弈的均衡分析理论方面做出了开 2外0以0交5美年双诺创大政重贝影性治国尔响贡籍经献获经济、奖济学对。学奖博家弈罗论伯和特经·奥济学产生了重 曼和美博国弈经美济国学普家林托斯马顿斯大·谢学林数因学在系教授约翰·纳 博弈论分论2什0析0,7方经年经因面济 济诺提的贝出研尔在究经非获济合奖学作。奖博弈理论中起着核 军事 心三作位用美的国纳经什济均学衡家概里念奥获尼奖德。·赫维