博弈论的方法对商场位置分布

博弈论的方法对商场位置分布
博弈论的方法对商场位置分布

博弈论方法对商场商店地理位置的分析作者:班级:学号:

摘要:国贸,西单,王府井,世贸天街都是商场荟萃,众所周知的繁华区。当人们需要购买基本生活用品或高档商品时通常都会去商场或商店,商场与人们的生活密不可分。随着社会化生产程度的提高,生产规模的扩大,通讯和交通运输工具的现代化,各大商场之间展开了激烈角逐。回想起2000 年前后的彩电降价狂跌,近年来的企业并购联合,以及国际市场上的美、日汽车贸易谈判等等皆属于同一类型的竞争问题,都可以应用博弈论进行分析。由于商场和顾客联系很紧密,客流量直接决定了商场的收益,而影响客流量的因素很多,包括价格的高低,售货员服务态度,质量优劣,地理位置等。两家商场的竞争不光体现在价格方面,可以说地理位置也是个十分重要的因素,因为人们会愿意到市中心繁华的地方购物,而不是到偏远的地方购买,即使偏远的地方物品价格相对较低,但考虑到运输费用(公交地铁)及方便程度,人们还是会倾向于在繁华地区购买,因此在热闹的市区客流量会较大。因此,零售企业选址是市场经济下商业投资决策的关键。

关键词:商场;商店;零售企业;位置分布;选址;博弈论

一、生活中常见的现象

在每个大大小小的城市街道上,我们会经常见到这么一个大家都很熟悉的现象:某一地段上的商店十分拥挤,形成了一个繁华的商业中心区,但另一些地段却十分冷僻,没有什么商店。再仔细观察,你还会发现一个更有意思的现象:往往同类型的商家总是聚集在一起,比如肯德基麦当劳两家百年老店紧紧相邻;沃

尔玛,家乐福相隔不远,相依为伴;安利,雅芳隔路而望······这是什么缘故呢?纳什均衡理论就能够对这些现象作出科学的解释。

二、博弈论概述

本文需要用到博弈论的相关知识,在这里先对博弈论知识进行简要概括和描述。

1.博弈论定义及博弈的基本要素

博弈论(Game Theory)是研究各方策略相互影响的条件下,理性决策人决策行为的一种理论。一个完整的博弈应包含三项要素:博弈的参加者;策略空间;博弈方的得益。一旦确定了以上四要素,一个博弈也就随之确定了。

2.纳什均衡

纳什均衡又称为非合作博弈均衡,是由美国数学家纳什提出的一种最常见的也是最重要的博弈均衡。他是博弈论中第一个重量级的概念。

纳什均衡的概念:假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。

2.博弈论的发展及应用

1944年Von Neumann和Morgensterm合著的《博弈论与经济行为》一书的出版,标志着系统的博弈理论的初步形成。20 世纪50 年代是博弈论研究、发展最重要的阶段,一些重要的博弈论的概念就是在这个阶段发展起来的,如“纳什均衡”等。近几十年来,博弈论的应用研究迅速发展,有人将这种发展趋势与100 多年前的“边际革命”相比拟,惊呼“博弈论革命”己经来临。1994年Nash、Selten、Harsanyi三位“博弈论”巨匠共同获得诺贝尔经济学奖,则更使博弈论作为重要的经济学科分支的地位和作用得到了最具权威的肯定。

现在博弈论正在得到越来越多经济学科的接受和运用,几乎贯穿了整个微观经济学,并且己扩展到宏观经济学及产业组织理论,在环境、劳动、福利经济学等方面的研究也都占有重要的地位,大有“吞噬”整个西方现代经济理论的趋势。博弈论的应用范围不仅包括经济学,政治学、军事、外交、国际关系、公共选择,还有犯罪学等等。

三、对商场商店选址方案的博弈分析

(1)理论基础

“囚徒困境”博弈是博弈理论中的典型实例。“囚徒困境”讲的是两个同案犯嫌疑人(囚徒)被警方拘捕后,为防其相互之间串供,而分别拘押、隔离审问时,两疑犯所面临的认罪策略选择的问题。两囚徒决策时都以自己的最大利益为目标,结果是实现最大利益。这种情况在现实生活中具有相当的普遍性,在市场竞争中,环境问题,公共资源开发、利用及商业企业广告行为等决策中屡见不鲜。

(2)分析过程

假设有一条笔直的公路,公路上每天行驶着大量来往的车辆,并且车流量在公路上是均匀分布的。现在设想有两家快餐店AB要在这条公路上选择一个位置

开张,招揽往来的车辆。他们所买的东西口味差不多价格也相当,那么两家快餐店开在公路的哪个具体位置好呢?注意:这里我们假设两家餐馆基本情况一样,司机去哪里仅仅取决于路程远近。

也许你会说把这条公路从0到1四等分,快餐店A在四分之一的位置,快餐店B在四分之三的位置,不就是最好的策略选择吗?的确,从资源的最佳配置来看,这种均匀散布的情况是最优的,每Array

家快餐店都拥有二分之一的顾客量,同时对司机来说这样到快餐店的总距离最短,可大大缩短吃饭时间。

但是老板作为生意人,必然精明之至,希望自己利益最大化,别人怎样与自己无关。处于这种理性考虑,A老板会想,我过我将快餐店从四分之一向二分之一的位置挪一些,那么我的势力范围会扩大,B的地盘会缩小,我肯定会从B快餐店夺取部分顾客,生意会更红火火。这对于A单方面来说是个好主意,所以原来位于四分之一处的A就有了向二分之一处移动的激励,于是会向二分之一的位置移动。同样的,B也不甘示弱,作为一个经济理性人,他也有将自己的店从四分之三处移到二分之一点出的激励,也会采取和A同样的行动。

我们可以建一个类似于囚徒困境的博弈模型,如下图所示

B快餐店

A快餐店

在这个博弈中,

博弈的参加者是A和B,

每个参与人的战略空间:每个参与人的战略空间:Si (i=1,2)即1/4,1/2;每个参与人的得益函数:ui(s1,…,sn),(i=1,2);当A选择1/4时,B应选择1/2,因为4比3收益大;当A选择1/2时,B也应该选择1/2,因为2比1收益大。同理A 无论如何也会选1/2.

从中,我们可以看出双方博弈的最后结局是将两家快餐店设置在重点二分之一的位置,这就是纳什均衡的位置。

四、结论

开头所说的一些日常生活中大家都熟悉的现象的原因,现在都解释清楚了。只要承认只关心自己眼前商业利益的理性人假设,且条件许可,那么同类型的商家将几乎趋向于相依为邻,挤在中点就是唯一稳定的策略选择和唯一的纳什均衡。这也完全可以看做是公正的市场竞争的合理结果。这就是很多城市商业中心形成的原理。当然,实际生活中的情况不全这样,但那是因为有其他因素作用的结果。

一种可能是重点位置的房租特别高,根据成本收益分析,靠近中点位置所争取的

顾客带来的利润抵不上高出放假的那部分支出,觉得不划算。再就是两家店服从于一个协调机构,解调机构从为大众提供方便的角度考虑,希望两家店互相礼让,分别设在四分之一和四分之三的位置。但在模型中所假设的条件成立的情况下,这些因素是不用考虑的,因此我们最后得出的结论是,同类型的商家最后都趋向于集中在一起。

致谢

感谢老师这个学期的精彩讲课和辛勤教导,我会把博弈论当做一门兴趣继续学习

下去。

【参考文献】

1. 张维迎. 博弈论与信息经济学. 上海: 上海人民

出版社, 1996

2.徐文,一本书看懂博弈论。北京:新世界出版社

运筹学例题

例9 分析在原计划中是否应该安排一种新产品。以第一章例1为例。设该厂除了生产产品Ⅰ、Ⅱ外,现有一种新产品Ⅲ。已知生产产品Ⅲ,每件需要消耗原材料A ,B 各为6kg ,3kg ,使用设备2台时;每件可获利5元。问改产是否应生产该产品和生产多少?若能以10个单位的价格再买进15单位的原材料A ,这样做是否有利? ()()T B P B C c 3,6,20,125.0,5.153133-='-'='-σ =1.25>0 21max x x z += ?????? ?≥≤+-≤+为整数 21212 121,0,13651914x x x x x x x x ()T n X ??? ??=310,23 ()629=*z 2,111≥≤x x 21max x x z += 21max x x z = (IP1)?????????≥≤≤+-≤+为整数212112121,0,113651914x x x x x x x x x (IP2)????? ????≥≥≤+-≤+为整数 212112121,0,21 3651914x x x x x x x x x 继续解(IP1)和(IP2),得最优解分别为: ()()()()941,923,2310,37,12211= ?? ? ??== ??? ??=z X z X T T ()9410≤≤*z 3,221≥≤x x 21max x x z = 21max x x z +=

(IP3)??????????≥≤≥≤--为整数2121212121,0,22136x x x x x x x x (IP3)??????????≥≥≥≤+-为整数 2121212121,0,32 1 36x x x x x x x x ()()1461,2,143333=?? ? ??=z X T IP4无可行解 21max x x z += 21max x x z = (IP5)???????????≥≤≤≤+-≤+为整数2121212121,0,2113651914x x x x x x x x x x (IP6)???????????≥≤≤≤+-≤+为整数 2121212121,0,31 1 3651914x x x x x x x x x x ()()()3,2,155==z X T IP6无可行解 14613≤≤*z ()T 2,1433=不为整数 3,211≥≤x x 分别加入问题(IP3)形成两个子问题 21max x x z += 21max x x z =

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

运筹学例题解析

(一)线性规划建模与求解 B.样题:活力公司准备在5小时内生产甲、乙两种产品。甲、乙两种产品每生产1 单位分别消耗2小时、1小时。又根据市场需求信息,乙产品的产量应该至少是甲产品产量的3倍。已知甲、乙两种产品每销售1单位的利润分别为3百元和1百元。请问:在5小时内,甲、乙两种产品各生产多少单位,才能够使得总销售利润最大? 要求:1、建立该问题的线性规划模型。 2、用图解法求出最优解和最大销售利润值,并写出解的判断依据。如果不存在最优解,也请说明理由。 解:1、(1)设定决策变量: 设甲、乙两种产品分别生产x 1 、x 2 单位 。 (2)目标函数: max z=2 x 1+x 2 (3)约束条件如下:1221 12 25..3,0+≤??≥??≥?x x s t x x x x 2、该问题中约束条件、目标函数、可行域和顶点见图1所示,其中可行域用阴影部分标记,不等式约束条件及变量约束要标出成立的方向,目标函数只须画出其中一条等值线, 结论:本题解的情形是: 无穷多最优解 ,理由: 目标函数等值线z=2 x 1 +x 2 与 约束条件2 x 1+x 2≤5的边界平行 。甲、乙两种产品的最优产量分别为 (5,0)或(1,3)单位;最大销售利润值等于 5 百元。 (二)图论问题的建模与求解样题 A.正考样题(最短路问题的建模与求解,清华运筹学教材编写组第三版267-268页例 13)某企业使用一台设备,每年年初,企业都要做出决定,如果继续使用旧的,要付维修费;若购买一台新设备,要付购买费。但是变卖旧设备可以获得残值收入,连续使用1年、2年、3年、4年以上卖掉的设备残值分别为8万元、6万元、3万元和0万元。试制定一个5年的更新计划,使总支出最少。已知设备在各年的购买费与维修费如表2所示。要求:(1)建立某种图论模型;(2)求出最少总支出金额。

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博 弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则 为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信 息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P,I),其中P为市场价格,I为消

费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 2、 参与人的行动顺序,即每个参与 人在何时行动; 3、 序列结构:每个参与人行动时面 临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息; 4、 参与人的支付函数。 比较: 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论浅谈

博弈论浅谈 在查找博弈论课题资料的过程中,不禁发现自己已经深深地被这门数学分支吸引住了。我想,这门学问的魅力主要在于它的实用性,数学中很少有一个方面能够被如此广泛地应用到实际生产实践、解释自然界的现象当中。而博弈论无疑是这其中一个既吸引数学家也吸引着数学“门外汉”的“大众科学”了。 博弈论又称对策论,主要研究斗争性或竞争性现象的理论解决方法,是现代数学的分支,也是运筹学的一部分。博弈论会考虑竞争过程中的个体的预测行为和实际行为,并研究它们的优化以达到最优化策略。一般以1928年数学家、计算机专家冯·诺依曼证明了博弈论的基本原理这一事件作为博弈论正式诞生的标志。发展至今已经渐趋完善,此过程中有许多优秀的学者如冯·诺伊曼、约翰·纳什等为之作了卓越贡献。由于博弈论与经济学类相关甚紧,博弈论中某一理论的研究常常会带来经济学领域的一大突破,正如1994年约翰·纳什作为数学家获诺贝尔经济学奖所体现的一样,这种跨学科的效应在博弈论学中淋漓尽致地体现了出来。 “博弈论”该词在现代社会可以说是脍炙人口,在各种大型讲演和授课中经常能听到,但我个人觉得这个词的翻译不如它的英文源词“Game Theory”一样直白。“Game Theory”如果理解为“游戏的理论”更能够清晰地向一位不了解博弈论的人介绍这门科学。至于上升

到“博弈”的层次当然也是有其原因的。“Games”在当代早已将其内涵和外延延伸至社会科学、自然科学的方方面面,已经不仅仅停留在“游戏”的层面上。广义上来说,一个结构中的群体之间的相互作用构成一个博弈。狭义一点,社会中人群之间或集团之间的合作、承诺、互相利用等也是博弈论的体现。从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,因为博弈论的基本假定是博弈各方的行动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。博弈论研究的是理性的博弈方之间如何进行策略选择的。由此可知,大到社会的发展、生物的繁衍,小至下棋打牌都可以看作是博弈。这么说来博弈论对于我们来说一点也不陌生,这些不正是与我们息息相关的日常事务?中国人对博弈论自古代就有深入的了解,甚至有将其理论系统化。比如《三十六计》就将当时军事上使用的计谋等集中收集到了一起,这种“计谋”其实就是指导人们的博弈理论。 作为数学的一个分支,且不论博弈论对自然科学的重要性,它还对社会科学有着重要的意义,是社科研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。它还深刻地改变着人们的思维,如人们熟知的“囚徒困境”“海盗分宝石”等问题已经作为经济学、心理学的经典案例;成功企业中的高管与智囊团因善于博弈、制定正确的发展战略而使公司利于不败之地;政府公务员在制订法律、颁布政策时也需要不断利用博弈理论,站在人民的角度看问题从而进一步完善规章制度以促进外

运筹学复习题目加答案

一、单选题 1.目标函数取极小(minZ )的线性规划问题可以转化为目标函数取极大的线性规划问题求解,原问题的目标函数值等于( )。 A. maxZ B. max(-Z) C. –max(-Z) D.-maxZ 2.下列说法中正确的是( )。 A .基本解一定是可行解 B .基本可行解的每个分量一定非负 C .若B 是基,则B 一定是可逆 D .非基变量的系数列向量一定是线性相关的 3.在线性规划模型中,没有非负约束的变量称为 ( ) A.多余变量 B .松弛变量 C .人工变量 D .自由变量 4. 当满足最优解,且检验数为零的变量的个数大于基变量的个数时,可求得( )。 A .多重解 B .无解 C .正则解 D .退化解 5.对偶单纯型法与标准单纯型法的主要区别是每次迭代的基变量都满足最优检验但不完全满足 ( )。 A .等式约束 B .“≤”型约束 C .“≥”约束 D .非负约束 6. 原问题的第i个约束方程是“=”型,则对偶问题的变量i y 是( )。 A .多余变量 B .自由变量 C .松弛变量 D .非负变量 7.在运输方案中出现退化现象,是指数字格的数目( )。 A.等于m+n B.大于m+n-1 C.小于m+n-1 D.等于m+n-1 二、判断题 1.线性规划问题的一般模型中不能有等式约束。 2.对偶问题的对偶一定是原问题。 3.产地数与销地数相等的运输问题是产销平衡运输问题。 4.对于一个动态规划问题,应用顺推或逆解法可能会得出不同的最优解。 5.线性规划问题的每一个基本可行解对应可行域上的一个顶点。 6.线性规划问题的基本解就是基本可行解。 三、填空题 1.如果某一整数规划:MaxZ=X 1+X 2 X 1+9/14X 2≤51/14 -2X 1+X 2≤1/3 X 1,X 2≥0且均为整数 所对应的线性规划(松弛问题)的最优解为X 1=3/2,X 2=10/3,MaxZ=6/29,我们现在要对X 1进行分枝,应该分为 和 。 2.如希望I 的2 倍产量21x 恰好等于II 的产量2x ,用目标规划约束可表为: 3. 线性规划解的情形有 4. 求解指派问题的方法是 。 5.美国的R.Bellman 根据动态规划的原理提出了求解动态规划的最优化原理为 6. 在用逆向解法求动态规划时,f k (s k )的含义是:

《博弈论原理模型与教程》第06章扩展式博弈第01节.

《博弈论:原理、模型与教程》 第二部分完全信息动态博弈 第6章扩展式博弈 (已精细订正!) 对博弈问题的规范性描述是科学、系统地分析博弈问题的基础。 前面介绍了一种常用的博弈问题描述方式—战略式博弈,虽然这种博弈模型结构简单,只要给出博弈问题的三个基本构成要素(即参与人、参与人的战略集及参与人的支付),就可完成对博弈问题的建模。 但是,由于战略式博弈假设每个参与人仅选择一次行动或行动计划(战略),并且参与人同时进行选择,因此从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 虽然战略式博弈也可以对动态博弈问题进行建模,但是从所得到的模型中只能看到博弈的结果,而无法直观地了解到博弈问题的动态特性。 本章将介绍一种新的博弈问题描述方式—扩展式博弈。从扩展式博弈模型中,不仅可以看到博弈的结果,而且还能直观地看到博弈的进程。在介绍扩展式博弈构成的基础上,还将对扩展式博弈的战略和解进行讨论。 6.1 扩展式博弈(文字描述、博弈树描述) 所谓扩展式博弈(extensive form game),是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。 一般而言,要了解一个博弈问题的具体进程,就必须弄清楚以下两个问题: (1)每个参与人在什么时候行动(决策、选择); (2)每个参与人行动时,他所面临决策问题的结构,包括参与人行动时可供他选择的行动方案及所了解的信息(集)。 [注: 行文中频繁出现的“行动”一词,有两义: 其一,动词的“行动”,指选择、决策。 其二,名词的“行动”,指策略、战略、谋略、行动方案、方案。] 上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。对于一个博弈问题,如果能够说清楚博弈过程中参与人的决策问题的序列结构,那么就意味着知道了博弈问题的具体进程。

运筹学练习题分析

第1题单选 题 A、决策变量 B、松弛变量 C、偏差变量 D、人工变量 2.第2题单选题若用图解法求解线性规划问题,则该问题所含决策变量的数目应为( ) A、二个 B、五个以下 C、三个以上 D、无限制 3.第3题单选题用单纯形法求解目标函数为极大值的线性规划问题,当所有非基变量的检验数均小于零时,表明该问题( ) A、有无穷多最优解 B、无可行解 C、有且仅有一个最优解 D、有无界解 4.第4题单选题 A、1个

B、4个 C、6个 D、9个 5.第5题单选题线性规划问题中基可行解与基解的区别在于( ) A、基解都不是可行解 B、 C、基解是凸集的边界 D、 6.第6题判断题如果线性规划问题问题存在最优解,则最优解一定对应可行域边界上的一个点 标准答案:正确 7.第7题判断题若线性规划问题有两个最优解 , 则它一定有无穷多个最优解 标准答案:正确 8.第8题判断题任何线性规划问题存在并具有唯一的对偶问题 标准答案:正确 9.第9题判断 题 标准答案:正确 10.第10题判断题对偶问题的对偶问题一定是原问题 标准答案:正确 11.第11题判断题线性规划模型中增加一个约束条件,可行域的范围一般将缩小,减少一个约束条件,可行域范围一般将扩大 标准答案:正确 12.第12题判断题线性规划问题的基解对应可行域的顶点

标准答案:错误 13.第13题判断题若线性规划的原问题有无穷多个最优解,则其对偶问题也一定具有无穷多最优解 标准答案:错误 第1题单选题对于 m 个发点、n 个收点的运输问题,叙述错误的是 ( ) A、该问题的系数矩阵有m × n 列 B、该问题的系数矩阵有 m n 行 C、该问题的系数矩阵的秩必为 m n-1 D、该问题的最优解必唯一 2.第2题单选题在解运输问题时,若已求得各个空格的改进路线和判别数,则选择调整格的原则是( ) A、在所有空格中,挑选绝对值最大的正判别数所在的空格作为调整格 B、在所有空格中,挑选绝对值最小的正判别数所在的空格作为调整格 C、在所有空格中,挑选绝对值最大的负判别数所在的空格作为调整格 D、在所有空格中,挑选绝对值最小的负判别数所在的空格作为调整格 3.第3题单选题在运输方案中出现退化现象,是指数字格的数目( ) A、等于m n B、大于m n-1 C、小于m n-1 D、等于m n-1 4.第4题单选题求最初运输方案可采用( ) A、大M法 B、位势法 C、西北角法 D、闭合回路法 5.第5题单选题 A、使诸供应点的供应总量减少G-Q B、使诸需求点的需求总量增加G-Q

纳什博弈论的原理与应用的论文

纳什博弈论的原理与应用的论文 1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯·诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已 站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。 纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现———非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的。 1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(zermelo)、鲍罗(borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(oskar morgenstern),并与其合作才使博弈论进入经济学的广阔领域。 1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔

博弈论与社会科学方法论(潘天群)

通识课 课程中文名称:博弈论与社会科学方法论 课程英文名称:Game Theory and Methodology of Social Sciences 课程代号:开课学期:第一学期(秋学期) 主讲教师:潘天群职称:教授、博导 研究专长:博弈论、逻辑学、科学方法论 所在院系:哲学联系电邮:tqpan@https://www.360docs.net/doc/3c13028579.html, 授课对象:全校二、三年级本科生(不限专业) 一、主讲教师简介: 潘天群,哲学博士,现为南京大学哲学系、南京大学现代逻辑与逻辑应用研究所教授、博士生导师。兼任中国逻辑学会常务理事、中国逻辑学会经济逻辑专业委员会副主任委员。教育部新世纪人才(2006)。曾于2001年9月-2002年2月在美国纽约大学政治学系从事“博弈论中的方法论问题”的访问研究。 主要研究领域为:逻辑学、哲学、博弈论。在《哲学研究》等国内外学术杂志发表学术论文约70余篇。独立出版著作5部:《行动科学方法论》,《博弈生存——社会现象的博弈论解读》、《博弈思维——逻辑使你决策制胜》、《社会决策的逻辑结构》与《合作之道——博弈中共赢方法论》。其中《博弈生存——社会现象的博弈论解读》,自2002年出版以来深受读者欢迎,为畅销书与长销书,已出版第三版。 主持国家社会科学基金项目“博弈论的哲学基础与应用功能研究”(2009)。 二、课程简介 由于“他人”与“我”是既合作又竞争的关系,研究冲突与合作的博弈论自上一世纪由冯?诺依曼等人创立与发展以来,对社会现象表现出强大的解释力,已经成为社会科学的一个通用工具。迄今至少有五位博弈论专家获得诺贝尔经济学奖,许多诺贝尔经济学奖获得者其研究与博弈论相关。博弈论也也渐渐渗透到自然科学(如生物学、人工智能)之中。 本课程突破数理博弈论的框架,结合主讲教师十年来的研究工作,构建适合

运筹学例题解析word精品

(一)线性规划建模与求解 B.样题: 活力公司准备在 5小时内生产甲、乙两种产品。甲、乙两种产品每生产 1 单位分别消耗2小时、1小时。又根据市场需求信息,乙产品的产量应该至少是甲产品产量 的3倍。已知甲、乙两种产品每销售 1单位的利润分别为 3百元和1百元。请问:在5小时 内,甲、乙两种产品各生产多少单位,才能够使得总销售利润最大? 要求:1、建立该问题的线性规划模型。 2、用图解法求出最优解和最大销售利润值, 并写出解的判断依据。如果不存在最优解, 也请说明理由。 解: 1、(1)设定决策变量: 设甲、乙两种产品分别生产 X]、X 2单位 _____________ max z=2 X 1+X 2 _________________________________ 12X 1 亠X 2 乞5 s.t X 2 _3X ! X,X 2 _0 1所示,其中可行域用阴影部分 目标函数只须画出其中一条等值线, 求解过程如下: 1?各个约束条件的边界及其方向如图 1中直线和箭头所示,其中阴影部分为可 行域,由直线相交可得其顶点 A(5,0)、 B(1,3)和 0(0,0)。 2. 画出目标函数的一条等值线 CD : 2x 什X 2=0,它沿法线向上平移,目标函数 值z 越来越大。 3. 当目标函数平移到线段 AB 时时,z ⑵目标函数:. (3)约束条件如下: 2、该问题中约束条件、目标函数、可行域和顶点见图 标记,不等式约束条件及变量约束要标出成立的方向, 顶点用大写英文字母标记。 -2 -1 X 2> 3 X 4 B(1,3) 3 图1 X2 5; A(5,O) T Max z 。 1 MaX 2

博弈论的基础知识与应用

博弈论的基础知识与应用(转) 1 基础知识 博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。 ■一个科学的隐喻 由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。在博弈论中常常讨论的问题包括:1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么? 2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是“理性”的? 3)如果对2)的回答是“有时候是”,那么在什么样的环境下侵略是理性的,在什么样的情况下合作是理性的? 4)在特定情况下,正在持续的关系与单方退出这种关系是不同的吗? 5)在理性的自我主义者的行为互动中,合作的道德规则可以自然而然地出现吗? 6)在这些情况下,真正的人类行为与“理性”行为是否相符? 7)如果不符,在那些方面不符?相对于“理性”,人们更倾向于合作?或者更倾向于侵略?抑或二者皆是? 因而,博弈论研究的“博弈”包括: 破产 门口的野蛮人(Barbarians at the Gate) 网络战(Battle of the Networks) 货物出门,概不退换(Caveat Emptor) 征召(Conscription) 协调(Coordination) 逃避(Escape and Evasion) 青蛙呼叫配偶(Frogs Call for Mates) 鹰鸽博弈(Hawk versus Dove) Mutually Assured Destruction 多数决定原则(Majority Rule) Market Niche 共同防卫(Mutual Defense) 囚徒困境(Prisoner’s Dilemma) 补贴小商业Subsidized Small Business 公共地悲剧Tragedy of the Commons 最后通牒Ultimatum

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论

博弈论 是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。 博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。 1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般

化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。 博弈的分类根据不同的基准也有所不同。一般认为,博弈主要可以分为合作博弈和非合作博弈。它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息,在这种情况下进行的博弈就是不完全信息博弈。目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

1.3.7 博弈论分析方法的主要特征

博弈论分析方法的主要特征 博弈论已形成一套完整的思想体系和方法论体系。其分析方法具有下列特征: 1. 研究对象的普遍性和应用范围的广泛性 人们的行为之间存在相互作用与相互依赖,不同的行为主体及其不同的行为方式所形成的利益冲突与合作,已成为一种普遍现象,这使博弈论的研究对象具有普遍性。一切涉及到人们之间利益冲突与一致的问题、一切关于竞争或对抗的问题都是博弈论的研究对象。 现实社会中广泛存在的合作与非合作博弈、完全信息与不完全信息博弈的事实,使博弈论的研究内容和应用范围十分广泛,涉及到政治学、社会学、伦理学、经济学、生物学、军事学等诸多领域,在经济学中的应用尤为突出。 2. 研究方法的模型化、抽象化以及涉及学科的综合性 一是运用数学模型来描述所研究的问题,使博弈论的分析更为精确。 二是研究方法具有抽象化的特征,由于博弈论分析大量使用了现代数学,使它所描述和分析的过程及所揭示的结论都带 有抽象、一般化的特点。 三是博弈论分析方法所体现的模式化特征,博弈论为人们提供了一个统一的分析框架或基本范式,从而使博弈论能够分 析和处理其它数学工具难以处理的复杂行为,成为对行为主 体间复杂过程进行建模的最适合的工具。

四是博弈论方法所涉及的学科的综合性。在博弈论分析中,不仅要应用现代数学的大量知识,还涉及到经济学、管理学、 心理学和行为科学等学科。 3. 研究方法的实证性与研究结论的真实性 博弈论中的最佳策略是经济学意义上的最优化,它只回答是什么导致博弈均衡,均衡的结果是什么,所遵循的基本原则是科学结论的客观性和普遍性。从实践上看,博弈论突破了传统的完全竞争、完全信息假定,更加强调决策者的个人理性,强调不完全信息、不完全竞争条件下的经济分析,强调决策个体之间的相互影响和相互作用等外部性,强调通过规则、机制和制度的设计和优化在个人理性得到满足的基础上达到个人理性和集体理性的一致,等等。作为一门方法论科学,除了提供分析和解决博弈问题的独特和新颖的具有战略思维的思想方法以外,还提供了更加贴近现实的分析工具并填补了传统经济分析的许多空白。从这个意义上说,博弈论方法具有实证的特征,使研究结果更具有真实性。

博弈论的基本概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。 参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。 ?信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。 ?收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益,它是策略组合的函数。 ?均衡:均衡是所有参与者的最优策略组合,记为s*。 几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。

相关文档
最新文档