1博弈论第一章

合集下载

第一章 博弈论概述PPT课件

第一章 博弈论概述PPT课件
博弈论与信息经济学
Game Theory and Information Economics 天津大学管理与经济学部
授课:XXX
1
第一章 博弈论概述 (Game Theory)
授课:XXX
2
一、博弈论的定义
又称对策论,是研究决策主体的行为发生直 接相互作用时的决策以及这种决策的均衡问 题的学科。
➢ 博弈分析的基本假设 (1)个人理性 假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。
(2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最
大化的策略。
授课:XXX
12
坦白 抵赖
➢ 博弈问题的基本要素
坦白
(1)局中人(Players)
抵赖
参与对抗的各方;不一定指自然人
若二人均不坦白,则只能因藏有枪支而被判刑1年; 若有一人坦白而另一个不坦白,则坦白者无罪释放,
不坦白者 被判刑10年; 若二人都坦白了,则同判8年。 此二人确系抢劫犯,请分析他们的抉择。

坦白

抵赖
坦白 -8,-8 -10,0
抵赖 0,-10 -1,-1
授课:XXX
均衡解: 二人均坦白
11
相关概念介绍
他的故事被好莱坞拍成了电影《美丽心灵》,该影片获 得了2002年奥斯卡金像奖的四项大奖
授课:XXX
7
2002年 北京国际数学家大会(ICM)
授课:XXX
8
• 主演
罗素·克劳,Russell Crowe
詹妮弗·康纳利, Jennifer Connelly
授课:XXX
9
1. 囚犯困境(Prisoners’ dilemma

1博弈论第一章

1博弈论第一章
i 1
n n
n
厂商i的收益:
i 1
qi P( qi ) cqi qi [ P( qi ) c]
i 1
厂商i的收益不仅与自己既定成本和产量有关,还与 其他厂商的产量决策有关。
1.3.1 博弈中的参与人 1.3.2 博弈中的策略 1.3.3 博弈中的收益 1.3.4 博弈的过程 1.3.5 博弈的信息 1.3.6 参与人的能力和理性 1.3.7 博弈的分类
哲理:相生相克,以柔克刚
猜硬币方 正 面 反 面 1, -1 -1, 1 参 与 人 1 石 头 剪 子 布 石 头 0, 0 -1, 1 1, -1 参与人2 剪 子 1, -1 0, 0 -1, 1 布 -1, 1 1, -1 0, 0
盖 硬 币 方
正 面 反 面
-1, 1 1, -1
1.2.3 产量决策Cournot模型
4
2015/12/5
1.3.1 博弈中的参与人
参与人:独立决策、独立承担博弈结果的个 人或组织。只要在一个博弈中统一决策、统一行动、
统一承担结果,不管一个组织有多大,甚至大到一个国家 或多国,都可以作为一个参与人。囚徒困境中的警察、田 忌赛马中的孙膑都不是参与人。

一、单人博弈——只有一个参与人的博弈
严格地讲,单人博弈由于不存在其他参与人的反应和反 作用,因此不属于博弈论的研究对象。但是讨论单人 博弈会使理论更完整,为多人博弈提供基础和启示。 例一:单人迷宫 扩展型
入口 右 A B 0 出口(奖金M) 右 M
A,1
左 B,1

博弈规则面前参与人之间平等,不因参与 人之间权利、地位的差异而改变 参与人数量对博弈结果和分析有影响。根
两个囚徒的收益矩阵

第1章博弈论基本模型

第1章博弈论基本模型

为什么学习?
从学习中获得心灵的提高,获得心灵的享受。
学习,其实就为自己创造一个美丽的心灵世界的过程。
有人说,我也没什么追求,就学一点实用知识就行,但问题是, 你没有那些“无用”的知识,你怎么驾驭哪些实用的知识呢? “世人只知有用之用,而不知无用只用”。
很多人30岁后就不再读书,到60岁还是30年前的思维;很多人 感慨“现在一读书就头痛”;农村现在不要为生存而挣扎了,那 做什么呢?“我不打牌又做什么呢?”
齐 田忌策略:
上马 ∨
中马 ∨
下马 ∨

上马
中马
下马
结 果:
田忌将军每次输掉三千金
谋士孙膑 策略:
结 果:

上马
中马
下马




下马
上马
中马
田忌将军胜二负一赢一千金
博弈论的创立与发展
2、博弈论的发展阶段 第一阶段:萌芽期(20世纪40年代前)。利益冲突的研究是分散和初
步的、带有很大程度的随意性。 孙子兵法:古诺(Cournot,1883)—古诺的“双寡头垄断”模型;艾
专业学习:谋职、谋生(身无长物、何以生存)。 事理学习:明白事理、懂得分析生活中的很多问题。(崔琦:
明白这个世界是一个什么样子,这很重要)。一个人,其实只 要懂得了加减乘除四则运算,就可以挣到钱买房买车,在物质 世界中生活的很好。但这只是像一个盲人一样在生活,“春天 来了,但我却看不到” 。(明明德) 人生学习:充实人生、提高人生的境界、把学习融入人的生活 中。人不是做事和挣钱的工具,而是宇宙中的有血有肉的生灵, 需要提高生活的趣味,享受趣味化的人生,这就需要学习。一 个人,不会欣赏《二泉映月》,不会感受过禅宗的静谧,从来 也不思考什么是天行健,好像也是在生活。看看很多人下班后 在做什么?打牌、或者歌厅洗脚房等,当衣食住行解决了之后, 就不知怎么过了,只有赌博和玩乐,却找不到真正的趣味。 (身体在成长、心灵也在成长吗?)(新民) 仰望星空

博弈论 第一章

博弈论 第一章

1 完全信息静态博弈1.0 对策论研究的内容与基本形式对策论研究的内容对策论研究多个行为主体的决策问题。

对策论研究的形式博弈(game),由多个行为主体构成的系统。

例Stackelberg modelCournot model博弈的类型参与者行动的时间与顺序同时行动——静态博弈;先后行动——动态博弈。

参与者的信息多少信息相同——完全信息;信息不同——不完全信息。

1.1 基本理论: 博弈的标准式和纳什均衡例1 儿童游戏:“石头、剪刀、布”。

博弈的标准式表示(normal-form representation)(1) 参与人( player).n 个参与人:1, 2, …, i, …, n.(2) 战略(strategy).一个参与人的战略是他采取的一个行动。

参与人i 的战略:s i.参与人i 的战略空间: S i.战略的一个组合: s ={s1,s2, …, s n}.简化表示:s-i ={ s1,…, s i -1,s i+1, …, s n }.(3) 收益(payoff).参与人i 的收益:u i= u i(s1,s2, …, s n)n个参与人博弈的标准形式表示:G = {S1, S2, …, S n;u1, u2, … , u n}完全信息(complete information):每个参与人知道其他人的战略空间和收益。

静态博弈(static game):所有的参与人同时行动。

每个人行动时,不知道其他人的行动。

例1(续):博弈{石头、剪刀、布} 的描述:参与人:1,2。

战略空间:S1 = S2 = {石头、剪刀、布}收益:两人出手的函数u1 (石头,石头) = 0,u1 (石头,剪刀) = 1,u1 (石头,布) = -1 …u2 (石头,石头) = 0,u2 (石头,剪刀) = -1,u2 (石头,布) = 1 ……收益表:两个参与人,有限个战略的博弈的表示方法。

P2石头剪刀布石头0 ,0 1 ,-1 -1 ,1P1剪刀-1 ,1 0 ,0 1 ,-1布 1 ,-1 -1 ,1 0 ,0博弈的问题:能否知道每个参与人选择的战略?例2: 囚徒困境(The Prisoner’s Dilemma)囚徒 2沉默招认沉默-1 ,-1 -9 ,0囚徒 1招认0 ,-9 -6 ,-6囚徒1的考虑:无论对方选沉默还是招认,自己选“招认”好于“沉默”。

博弈论讲义-概述1

博弈论讲义-概述1

第一章 概述-人生处处皆博弈
注意两点: 注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
第一章 概述-人生处处皆博弈
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
参与人
ห้องสมุดไป่ตู้
第一章 概述-人生处处皆博弈-基本概念
博弈论的基本概念包括: 参与人:博弈论中选择行动以最大化自己效用的决策主体; 参与人:博弈论中选择行动以最大化自己效用的决策主体; 行动: 行动:参与人的决策变量 战略: 战略:参与人选择行动的规则 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和 行动的知识 支付函数: 支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的集合 均衡: 均衡:所有参与人的最优战略的组合 参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈 规则决定均衡。
完全信息静态博弈 纳什均衡
第一章 概述-人生处处皆博弈
纳什(1950,1951)
分析:上述博弈属于何种类型的博弈?
囚徒困境 坦白
囚徒 B 囚徒A
抵赖
坦白 抵赖 行动
-8,-8 -10,0
0,-10 -1,-1
支付函数
完全信息静态博弈 纳什均衡
纳什(1950,1951)
第一章 概述-人生处处皆博弈-智猪博弈
第一章 概述-人生处处皆博弈-囚徒困境 亚当斯密在1776年发表的经典之作《原富》中认为: 亚当斯密在1776年发表的经典之作《原富》中认为: 1776年发表的经典之作

博弈论第一章ppt课件

博弈论第一章ppt课件

qj ( j k) 必须使(3)式极大化.于是,令
j 0 , j1,2,,n.
qj
n
于是有 a2bqj b qkc0
(4)
kj1
n
即 bjq acb qk, j1,2,,n (5)
k1 .
n
n
将这 n个式子相加得 b qj n(ac)nb qj
j1
j1
行业的总产量为
n j1
qj
n(ac) b(n1)
设市场需求为
n
pab(qj) a0,b0 j1
(2)
当然a >c(否则会有问题,后面可以看到),由
(1)与(2)两式易知企业 j 的利润为
.
n
j(q1,q2,qn)(ab qj)qjcqj (3) j1
所谓古诺均衡,便是存在一个产量:
q(q1 ,q2 ,,qn )使得每个企业的利润都达到
最大.即当所有别的企业的产量 qk 时q,k
.
1·2 应用举例 古诺(1838年)提出了纳什所定义的均衡(但 只是在特定的双头垄断模型中),但是他并没有 从理论上系统的定义均衡的意义.古诺的研究 被认为是最早的博弈论的经典文献之一. 此模型告诉我们; (1)如何对一个问题的非正式描述转化为一
个博弈的标准式表述; (2)如何通过计算解出博弈的纳什均衡; (3)重复剔除严格劣战略的步骤.
所选战略的函数,假定企业 的i 收益就是其利润
ui(si,sj)i(qi,qj)qi[a(qiqj)c]
i1 ,j2(i2,j1 )
.
一对战略 (s1, s如2)是纳什均衡,则对每个参与

i,s
i
应满足:
ui(si,sj)ui(si,sj) (NE)

北京大学博弈论课件第1章博弈论概述

北京大学博弈论课件第1章博弈论概述
博弈参与者可能是单个的个人,也可能是组织或集体
企业、社会团体、国家
博弈参与者可能多于两方,三方或多方博弈参与者
二、博弈策略(Strategy)
博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中,博弈参与者所能采取的博弈策略
均为“锤头”、“剪刀”或“布” 两名同学去相约去博物馆博弈中,博弈参与者所能采取的博弈策
博弈参与者:两个人 博弈过程:
两人在校门口集合,一起逛博物馆
博弈策略和结果
两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过
博弈双方策略相互依赖,不独立。
其他博弈实例
棋类比赛:象棋、围棋等。古人“对弈”。 寡头市场:
遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是
如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为
“坦白”或“不坦白”
三、博弈的收益(Payoff)
博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博弈中,博弈参与者得到的收益是:赢、平局、
输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相
2.非合作博弈(Non-cooperative games),纳什就读于普林斯 顿大学数学系的博士毕业论文,1950年。

博弈论第1章-导论

博弈论第1章-导论

第一章 导论 1.2 策略环境中的博弈思维 策略
确定策略集合? 可行策略清单。 两类人: 一是有自己的策略但是不知道用哪个好的人(强化自 己的策略性思考能力即可); 二是没有一个策略集合。(这个比较难) 自己无法决策,也没有可选择的策略,这就是难点

第一章 导论 1.2 策略环境中的博弈思维 策略
下上中 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 下中上 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3
1.2.2 赌胜博弈
二、猜硬币博弈
猜硬币方
正面
盖 硬 币
反面
正面
-1,1
反面
1,-1 -1,1

1,-1
该博弈与上一个例子相似,即取胜的关键都是不能 让另一方猜到自己的策略而同时自己又要尽可能猜出对 方的策略。
一场是同等级马或 者田忌说的对称结 果 上马对下马,中马 对上马,下马对中 马
一、齐威王田忌赛马
田忌 比赛结 输赢结果 果 三场全 输3000金 负
两胜一负
一胜两负
赢1000金
两负一 胜
一负两 胜
输1000金
赢1000金
输1000金 田忌说的那种情况,
1.3.2 赌胜博弈
一、齐威王田忌赛马
如果齐王采取策略,赛马就变成了策略相依的决策 较量,构成了典型的赌胜博弈。
第一章 导论 1.2 策略环境中的博弈思维 预测与均衡


预测与均衡 在预测对手的策略是,要站在对手的角度评价, 思考这几种策略组合能为他带来多少利益。 N方的行动决定
N社的标题
经济
经济
A社的标题
政治
3 4
政治
6

博弈论1:纯策略

博弈论1:纯策略
• 二者相结合将起到好结果
如何制定规则来约束
• 世界上有两种符合集体利益的正义: 实质正义与规则正义。实质正义必须通过 规则正义来实现,否则将被虚置。因此规 则正义最重要。
• 分蛋糕或分粥故事: 20个人的小集体, 每天吃粥。如果所有人抡吃,导致纳什悖 论:每人早早来等粥,成本极高,对谁都 不利。
• 纳什均衡:在完全信息静态 博弈中各方都实现个利益最 大化的策略组合状态
• 纯策略:假定每个参加者每 次只选择一个策略进行博弈
• 混合策略:每个参加者每次 按照各种几率选择不同策略 进行博弈,如监督博弈
二、博弈案例1:占优策略与劣策略
(dominant strategy and dominated strategy) 课本上译为“支配性策略”与“被支配策略”
完全信息静态博弈游戏各方在完全知道博弈过程的三大要素的情况下同时选择策略完全信息动态博弈走象棋围棋游戏各方的完全知识博弈过程的三大要素的情况下相继作出策略选择不完全信息动态博弈国际市场竞争10矩阵的每个位置显示每个参加者的每个策略组合此位置即一博弈格局每个博弈格局上列出每个参加者的利益函数于是得到payoffmatrix例如
• Since then game theory has be taken as the Foundation for Understanding Complex Economic Issues
一、博弈论的基本理论框架
1/博弈论的理论意义与特征
▪ 古典经济学:根据资源稀缺性配置资源 的科学,价格是资源稀缺性的信号,由 此对经济行为进行成本收益分析,MR= MC实现利润最大化 忽视了他人决策对彼此经济利益的影响
• 制度经济学:
科斯:对人之间的交易过程的成本收益分析 诺斯:对交易过程的制度环境进行分析,包括 制度约束与制度变迁与交易过程的关系

第一章博弈论与信息经济学-50页精选文档

第一章博弈论与信息经济学-50页精选文档
给定信息结构及预定结果什么是最优的契约安排(合同)
事前(ex ante) 事后(ex post)
表1-2 信息经济学的基本分类
隐藏行动(hidden action) 1.隐藏行动的道德风险模型
隐藏信息(hidden information)
3.逆向选择模型; 4.信号传递模型; 5.信息甄别模型
2.隐藏信息的道德风险模型
解决方法:①分离市场—发送信号(si旧车出售后在一年内因同一问题修理了4次,或放 置修车行至少30天,旧四经销商必须购回此车,并在再次出售后修好,贴了“柠 檬法购回”的标签以告知新的买主。
第一节 博弈论、信息经济学与经济学
例2、(考察保险业)假设一家保险公司想提供自行车 失窃保险。市场调查显示:被盗概率:A地区(99%),B 地区(1%);自行车平均价格为300元,假设保险公司决 定根据平均失窃率(50%)提从保险(300元×50%=150 元),你认为会出现什么情况呢?
第一章 博弈论、信息经济学与经济学
第一节 博弈论、信息经济学与经济学
第二节 博弈论的创立与发展
第三节 1994、2019、2019、2019、 2007诺贝尔经济学奖获得者的主要工 作
第四节 博弈论的若干实例
第一节 博弈论、信息经济学与经济学
博弈论、信息经济学与经济学关系: 经济学解决的矛盾问题:有限与无限的矛盾 经济学研究的基本问题:
逆向选择(adverse selection)——事前不对称 是指在信息不对称的条件下,参与交易或交往的一方可 能隐藏自己的私有信息,反而藉着提供不真实的信息以增加自 己的福利,但是这种行为却伤害到另外一方的利益。如柠檬市 场、人才招聘等。
信号(signal):代理人在达成契约前后采取一定行动并以 信号的形式向委托人显示自己的类型。

博弈论(第一章)

博弈论(第一章)

博弈的表述方法的例题
例:囚徒困境博弈的集合表示:G=((坦白,不坦白), (坦 白,不坦白);(-5,-5),(0,-8),(-8, 0),(-1,-1)) 例:在两个公司竞争出售同一产品的博弈中,两个公司是两 个博弈方,两个公司的各自销售量q1,q2是策略空间,
两个公司的所获利润u1(q1,q2),u2(q1,q2)是得
①用损益矩阵表示 例1:故事齐威王与大将田忌赛马,赛马的规则是这样的,每次 双方各出三匹马,一对一比赛三场,每一场的输方要赔1000斤 铜给赢方,齐威王的三匹马和田忌的三匹马按实力都可以分为 上,中,下三等,但齐威王的上,中,下三匹马分别比田忌的 上,中,下三匹马略胜一筹,由于总是同等次的马进行比赛, 因此田忌都是连输三场。实际上,田忌的上马尽管不如齐威王 的上马,却比齐威王的中马和下马要好,而田忌的中马比齐威 王的下马要好一些。因此,田忌的谋士孙膑为田忌出了个主意, 用自己的下马对齐威王的上马,上马对齐威王的中马,中马对 齐威王的下马。这样,二胜一负,田忌反而能赢齐威王1000斤 铜,试写出其标准式表述。
你能否写出上述问题的矩阵形式?
(3)囚徒困境的应用
③ 假定你是一个公司的采购人员,考虑向两家供应商采 购100万只零件,每只零件的成本为6元。如果你分别 向两家供应商各订购50万只,则每个供应商就会把价 格定在10元。你可以设计一个采购策略,以便在两家 供应商之间制造出囚徒困境的情形,从而给自己带来 好处。如何取定这样的采购政策,并写出其矩阵的表 达形式。同时,考虑你的采购策略的使用条件是什么?
低价
80, 80 100, 20
20, 100 50, 50
(3)囚徒困境的应用
② 公共产品的供给也可以看作是一个囚徒困境问题,如 果大家都出钱兴办公用事业,所有的人福利都会增加。 问题是,如果我出钱你不出钱,我得不偿失,而如果 你出钱我不出钱,我可以占你的便宜。所以每个人的 最优选择都是“不出钱”,但是这种状态使得所有人 的福利得不到提高。

博弈论第一章

博弈论第一章

招认 囚徒1 沉默
囚徒2 招认 沉默 –5, -5 0, -8 -8, 0 -1 , -1
囚徒的困境
策略“沉默”严格劣于策略“招认”
博弈分析的目的:预测博弈的均衡结果, 即给定每个参与人都是理性的是共同知识, 什么是每个参与人的最优策略?什么是所有 参与人的最优策略组合?
*肯定性(sure-thing)或替代性(substitution) 公理:一个决策者在事件A发生的偏好选项1 胜于选项2,并且在事件A不发生时也 偏好选项1胜于选项2,那么就有,他 在知道事件A无论是发生还是不发生之 前都应该偏好选项1胜于选项2。
Chapter 1 完全信息静态博弈 Static Games of Complete Information In this chapter we consider games of the following simple form: first, the players simultaneously choose actions; then, the players receive payoffs that depend on the combination of actions just chosen. Within the class of such static (or simultaneous-move) games,we restrict attention to games of complete information. That
招认
囚徒2 招认 沉默 –5, -5 0, -8
-8, 0 -1 , -1
囚徒1
沉默
囚徒的困境
We now turn to the general case. The normal-form representation of a game specifies: (1)the players in the game; (2)the strategies available to each player; (3)the payoff received by each player for each combination of strategies that could be chosen by the players.

MBA必修课程《博弈论》第一部分:典型案例及导论

MBA必修课程《博弈论》第一部分:典型案例及导论

弱者是如何胜出的?
Page 8
他就是枪手丙。是的,没错,他的枪法最差,怎么说也 轮不到他胜利呀。但事实是,如果没有出现重大意外或者奇 迹,这场对决中只有枪手丙能够活下来。
甲:向乙开枪100% 乙:向甲开枪80% 丙:向甲开枪60% 结局死的概率:
甲: 80%*40%+60%*20%+80%*60%=32+12+48=92%
乔治·阿克尔洛夫
乔治·阿克尔洛夫 (1940-)美国人,他对市场的不对称信息 研究具有里程碑意义.引入信息经济学研究中的一个著名 模型是“柠檬市场”(注:“柠檬”一词在美国俚语中表 示“次品”或“不中用的东西”),主要用来描述当产品 的卖方对产品质量比买方有更多的信息时,低质量产品将 会驱逐高质量商品,从而使市场上的产品质量持续下降的 情形.阿克尔洛夫的理论被广泛运用于一些完全不同的领 域,如健康保险、金融市场和雇佣合同等.获得2001年诺 贝尔经济奖.
2001诺贝尔经济奖
Page 21
2001年,三位经济学家阿克洛夫(G.A.Akerlof )、斯蒂格利茨 (J.E.Stiglitz)和斯彭斯(A.M.Spence)因运用博弈论研究信息经济学所取 得的成就而成为这个年度的诺贝尔经济学奖得主.
迈克尔·斯彭斯
迈克尔·斯彭斯 (1948-)美国人 ,他认为,假如雇主不能区分 高能力和低能力的劳动能力之间的区别,那么就会导致劳动 力市场以低工资雇用低能力者,形成劳动力市场上“劣币驱 逐良币”的现象.斯彭斯还发现一个现象,即高能力的男性预 期获得比同等能力的妇女更高的学历.在这种均衡下,在男女 之间的教育回报由于教育方面投资的不同而不同.另外,斯彭 斯信号发送模型还对博弈论产生了深远的影响,他的专业竞 争下的市场均衡模型已经影响到其他领域,比如增长理论和 国际贸易.获得2001年诺贝尔经济奖.

博弈论第一章

博弈论第一章

1.1.2一个非技本性的定义 规定或定义一个博弈需要以下几个方面: 1.参与人(Player)(局中人)指博弈中的决策主体, 他的目的是通过选择行动(或策略)以最大化自己的支 付(效用)水平,参与人可以是自然人、团体、自然 (“上帝”作为虚拟的参与人)。 2.各个参与人各自可选择行动集(action set),Ai={ai}, 是其可以采用的全部行动的集合。一个行动组合(action proile)是一个由博弈中的n个参与人每个选取一个行动 所组成的有序集a=(a1,a2,…an)。
1.3.2 博 弈 中 的 策 略 博弈中独立决策、独立承担博弈结果的个人或 组织称为博弈方。 博弈中各博弈方的决策内容称为“策略“,但 应注意到并不是每个博弈方都有相同的可选 策略。 如果在一个博弈中每个博弈方的策略数都是有 限的,则称该博弈为有限博弈;否则就称为 无限博弈。 1.3.3 博弈中的得益(支付,payoff) 得益指在一个特定的策略组合下参与人得到效 用水平, 即各个博弈方从博弈中所获得的利益.
如果一个决策者在追逐其目标时能其前后一 致地做决策,我们就称他是理性的(rational) 如果局中人知道我们付此博弈所知道的一切, 并能做出我们对此局势所做的一切推断,我 们就称此博弈的局中人是智能的。
1.2 几类经典的博弈模型
1.2.1 囚徒的困境(prisoners’ dilemma)
囚徒B
坦白 坦白 不坦白
囚徒A
-8,-8
-10,0
0,-10
-1,-1
不坦白
这个例子本身就部分奠定了非合作博弈论的基础。
1.2.2 智猪博弈 猪圈里有两头猪:大猪和小猪,猪圈的一头有一 个猪食槽,另-头装有-个按纽,控制着猪食的 供应,按一下就会有10单位的猪食进槽,但谁按 谁就要付出相当于2单位猪食的成本;当猪食进 槽时,若下猪先到,大猪可吃到9单位;小猪先到, 则小猪可吃到4单位,大猪吃6单位;若两者同时 到,叫大猪可吃7单位,小猪吃3单位。

第一章博弈论的发展

第一章博弈论的发展

第一章博弈论的发展一、博弈论的由来博弈论是一门年轻的学科,起源于本世纪初,在二战后发展成为一门完整而丰富的理论体系。

其中博弈译自英文的Game,字面意义可直译为游戏,我国学术界的另一种译法是博弈。

从名称上可以体会到博弈论的来源。

如同概率论来自对掷色子,彩票等随机性行为的观察和研究(概率论的起源有一个故事,两个人为一笔奖金而打赌,约定谁先赢到一定局数就获得全部奖金,但因故没有赌完,各自赢得一定局数,于是请数学家裁定每个人应该得到多少,数学家分析了各自获得最终胜利的概率,应按比例进行分配),博弈论起源于对国际象棋,扑克等竞赛活动的认识。

这也许可以说体现了西方精神与东方精神的差别,在中国人不屑深究其内在意义的地方西方人发展起了一种科学。

一旦以严肃认真的科学态度去分析游戏,它的思想成果即刻就超越了它原来的研究对象,博弈论的对象很快扩展为广泛存在于人类生活各个方面的人与人之间利益相互制约下进行策略选择时的理性行为及相应结局。

豪尔绍尼在诺贝尔获奖辞中是这样定义博弈论的:“博弈论是关于策略相互作用的理论,就是说,它是关于社会形势中理性行为的理论,其中,每个局中人对自己行动的选择必须以他对其他局中人将如何反应的判断为基础”。

简言之,博弈论研究人与人之间“斗智”的形式和后果。

当人们的利益存在着冲突时,每个人所获得的利益不仅取决于自己所采取的行动,也取决于其他人同时采取的行动或者对自己行动的反应。

例如,我国人们喝酒时有猜拳的习气,一个人是否被罚一杯不仅取决于自己伸出的手指数目与说出的数字,还取决于对手的选择。

由于人与人之间利益存在磨擦的情况出现于几乎所有的人类活动中,博弈论即具有了广阔的用武之地。

值得注意的是,博弈论研究的目的并非帮助特定一方胜券在握,而是描述在这种形势中各方理性选择自己的行动会达成的结果。

由于它研究人们决策相互影响的形势,国内为了突出它博弈略的强调,常常将其译为学术气氛更浓的博弈论。

博弈论这种译法来自于港台,由于它更贴近英语原文的风格以及更为直观,现下逐渐流行起来。

博弈论第一章答案

博弈论第一章答案

1.4 对 于 第 i个 厂 商 , 其 目 标 为 最 大 化 自 己 的 利 润 , 即 :
max πiqi
=
max(a qi ≥0
− qi

q−*i
− c)qi

由 一 阶 条 件 ∂π i / ∂qi = 0 , 可 得 : qi* = (a − q−*i − c) / 2 … … ( 1)
则 原 博 弈 的 混 合 战 略 纳 什 均 衡 为 : { (1/3, 2/3, 0), (2/3, 0, 1/3) }。 1.12 按 照 1.11 的 解 法 , 可 得 混 合 战 略 纳 什 均 衡 为 : { (2/3, 1/3), (3/4, 1/4) }。 过 程 略 。 1.13 此博弈有两个纯战略纳什均衡、一个混合战略纳什均衡。 纯 战 略 纳 什 均 衡 为 :( 向 企 业 1 申 请 , 向 企 业 2 申 请 );( 向 企 业 2 申 请 , 向 企 业 1 申 请 )。 混合战略纳什均衡为:
设 此 博 弈 的 纯 战 略 纳 什 均 衡 是 ( s1* , s2* )。
对于参与人
1来 说 ,
s1*
=
max{ max 0≤s1 ≤1−s*2
s1
,
max
1−s*2 <s1 ≤1
s1
}
=
max{1−
s2* , 0} = 1−
s2*

同 理 , s2* = 1− s1* 。
也 即 , 此 博 弈 的 纯 战 略 纳 什 均 衡 为 ( s1* , s2* ), 且 满 足 s1* + s2* = 1, 0 ≤ s1*, s2* ≤ 1。
c1 < c2 < a 且 2c2 > a + c1 时 , 纳 什 均 衡 解 为 角 点 解 , 即 q1* = (a − c1) / 2 , q2* = 0 。 此 题 目

博弈论第一章总结

博弈论第一章总结

博弈论第一章总结那咱就开始唠唠博弈论第一章的那些事儿哈。

博弈论啊,这可是个超级有趣的东西呢。

第一章就像是打开博弈论大门的一把小钥匙,虽然小,但可重要啦。

这第一章啊,主要就是给咱介绍啥是博弈论的基本概念。

就好比是你要去一个新地方,先得知道这个地方是干啥的,大概啥样对吧。

博弈论呢,简单来说就是研究在不同的决策情况下,人们或者各方之间是怎么互相影响的。

比如说啊,下象棋的时候,你走一步,对方走一步,你每一步的决策都要考虑到对方可能会干啥,对方也是一样,这就是一种博弈呀。

这里面有个很重要的点就是参与者。

这些参与者就像一场大戏里的演员,每个参与者都有自己的目标,就像演员都有自己的角色任务一样。

比如说在商业竞争里,那些公司就是参与者,每个公司都想赚更多的钱,扩大自己的市场份额,这就是他们的目标啦。

而且这些参与者的决策可不是瞎做的哦,都是为了达到自己的目标去想办法的。

再说说策略这个事儿。

策略就像是每个参与者手里的武器或者魔法棒。

不同的参与者有不同的策略可以选择。

还拿商业竞争举例哈,如果一家公司想要增加市场份额,它可以选择降低价格,提高产品质量,或者做很多广告这些策略。

而且每个策略都会对其他参与者产生影响呢。

比如说你降价了,别的公司可能就会受到影响,也跟着降价或者想出其他办法来应对。

信息也是博弈论第一章里不能少的部分。

信息就像是在黑暗里的灯光,有多少信息就决定了你能多清楚地看清局势。

要是你知道很多关于其他参与者的信息,比如他们的策略啦,他们的目标啦,那你做决策的时候就更有把握。

但是要是你啥都不知道,就像在黑夜里瞎摸,那可就危险啦。

比如说在谈判的时候,如果一方知道另一方的底线,那这一方就有更大的优势,能更好地争取自己的利益。

这第一章的博弈论啊,其实就是把这些基本的东西一股脑儿地摆在我们面前,让我们对博弈论有个初步的认识。

它告诉我们在各种情况下,人与人、公司与公司、国家与国家之间的互动都是有规律可循的。

就像我们解开一个谜题一样,每一个概念都是一块小拼图,当我们把这些小拼图都搞清楚了,就能慢慢看到整个博弈论这个大拼图的全貌啦。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
-1,1 1,-1 1,-1 1,-1 3,-3 1,-1
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
收益矩阵
策略无好坏之分! 取胜关键:不让对方猜到自己策略,尽可能猜出对方策, 随机出招。
3
2015/12/5
二、猜硬币博弈
三、石头、剪子、布

一、三厂商离散产量
Q q1 q2 q3
P P(Q) 20 Q {


Cournot模型是寡头产量竞争,是市场经济 中最常见的问题之一 Cournot 1838年提出,直到现在还是经常 使用 Cournot模型有很多扩展 Cournot模型与囚徒困境相似,对理解市场 经济和博弈分析本身都有重要价值
坏天气(25%)
-16000 -10000
好天气 (75%)
0
坏天气 (25%)


1
运输路线收益矩阵
两人博弈就是两个各自独立决策,但是策略和利益相 互依存的参与人的决策问题 两人博弈最常见,研究最多,是最基本和有用的博弈 类型 囚徒困境、猜硬币、田忌赛马等都是两人博弈 两人博弈有多种可能性,参与人的利益方向可能不一 致,也可以一致;掌握信息多的并不能保证获胜;追 求个体利益最大化,常导致不能实现社会利益最大化, 从而也不能真正实现个体利益最大化
i 1
n n
n
厂商i的收益:
i 1
qi P( qi ) cqi qi [ P( qi ) c]
i 1
厂商i的收益不仅与自己既定成本和产量有关,还与 其他厂商的产量决策有关。
1.3.1 博弈中的参与人 1.3.2 博弈中的策略 1.3.3 博弈中的收益 1.3.4 博弈的过程 1.3.5 博弈的信息 1.3.6 参与人的能力和理性 1.3.7 博弈的分类
4
2015/12/5
1.3.1 博弈中的参与人
参与人:独立决策、独立承担博弈结果的个 人或组织。只要在一个博弈中统一决策、统一行动、
统一承担结果,不管一个组织有多大,甚至大到一个国家 或多国,都可以作为一个参与人。囚徒困境中的警察、田 忌赛马中的孙膑都不是参与人。

一、单人博弈——只有一个参与人的博弈
有限博弈(Finite Games):参与人个数是有限的, 每个参与人的策略数是有限的。总可以用矩阵、扩展或
罗列法将所有策略、结果和收益表示出来。

无限博弈(Infinite Games):至少有某些参与人的 策略有无限多个。无法列举,只能用数集、函数表示。
5
2015/12/5
1.3.3 博弈中的收益
田忌赛马分析
田 忌 上 中 下 上 下 中 中 上 下 中 下 上 下 上 中 下 中 上
齐 威 王
上中下 上下中 中上下 中下上 下上中 下中上
3,-3 1,-1 1,-1 -1,1 1,-1 1,-1
1,-1 3,-3 -1,1 1,-1, 1,-1 1,-1
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
西方经济学的基石。
二、双寡头削价竞争
寡头2 高 价 寡 头 1 高 价 低 价 低 价
1.2.2 赌胜博弈

100,100
150,20
20,150
70,70

双寡头的收益矩阵
赌博、竞技等构成的博弈问题,在经济中 也有许多应用,赌胜博弈也是一类重要的 博弈问题,对研究经济竞争和合作有很大 启示 赌胜博弈的特点是一方得等于另一方失, 不可能双赢,属于对称“零和博弈”
《学弈》(《孟子•告子》)
弈秋,通国之善弈也。使 弈秋侮二人弈,其一人专 心致志,惟弈秋之为听; 一人虽听之,一心以为有 鸿鹄将至,思援弓缴而射 之。虽与之俱学,弗若之 矣。为是其智弗若与?吾 曰:非然也。
1
2015/12/5
诺曼底登陆与游戏

诺曼底登陆与游戏

T.C.Schelling: 用一个矩阵表 示双方得失
哲理:相生相克,以柔克刚
猜硬币方 正 面 反 面 1, -1 -1, 1 参 与 人 1 石 头 剪 子 布 石 头 0, 0 -1, 1 1, -1 参与人2 剪 子 1, -1 0, 0 -1, 1 布 -1, 1 1, -1 0, 0
盖 硬 币 方
正 面 反 面
-1, 1 1, -1
1.2.3 产量决策Cournot模型
2
2015/12/5
一、基本模型
对社会利益而言,罪犯受到了惩罚。 对囚徒个人,从个体利益出发既没有实现个人利益最大化,也没有实现两人总 利益最大化。 Prisoner 2 Mum Mum Prisoner 1 Fink -1, -1 0, -9 Fink -9,0 -6, -6
囚徒困境的启示
个人理性与集体理性的冲突:从个体利益出发没能实现集体利益最大 化;也没有实现个体利益最大化。从各人追求利己行为而导致的最 终结局是一个“均衡”,是对所有人都不利的结局。两人在坦白与抵
严格地讲,单人博弈由于不存在其他参与人的反应和反 作用,因此不属于博弈论的研究对象。但是讨论单人 博弈会使理论更完整,为多人博弈提供基础和启示。 例一:单人迷宫 扩展型
入口 右 A B 0 出口(奖金M) 右 M
A,1
左 B,1

博弈规则面前参与人之间平等,不因参与 人之间权利、地位的差异而改变 参与人数量对博弈结果和分析有影响。根
据参与人数量分单人博弈、两人博弈、多人博弈等。最常 见的是两人博弈,单人博弈是退化的博弈
左 0
例二:运输路线
一批货物价值90000,AB之间有水陆两条路线,陆路运输成本10000,水路 成本7000,但是水路风险:暴风雨概率1/4,损失10% 自 然
二、两人博弈

好天气(75%)
商 人 水 路 陆 路 -7000 -10000
一、田忌赛马 忌数与齐诸公子驰逐重射。孙子见其马足不甚 相远,马有上、中、下辈。于是孙子谓田忌曰: “君弟重射,臣能令君胜。”田忌信然之,与 王及诸公子逐射千金。及临质,孙子曰:“今 以君之下驷与彼上驷,取君上驷与彼中驷,取 君中驷与彼下驷。”既驰三辈毕,而田忌一不 胜而再胜,卒得王千金。 ——史记卷六十五 列传第五 孙武吴起



零和博弈:也称“严格竞争博弈”。参与人之 间利益始终对立,偏好通常不同。参与人之间 不可能和平共处 —猜硬币,田忌赛马,石头-剪刀-布 常和博弈:参与人之间利益的总和为常数。参 与人之间的利益是对立的且是竞争关系。参与 人较容易相互妥协、和平共处 —分配固定数额的奖金、利润,遗产官司 变和博弈:零和博弈和常和博弈以外的所有博 弈。合作利益存在,博弈效率问题的重要性。 —囚徒困境、产量博弈、制式问题等
P
1
8
20 20 25 33 49
2
16
25 20 25 33 21
3
12
30 24 25 33 21
2
5 4 5 11 7
二、n个厂商连续产量
n个厂商的总产量: 市场出清价格:
n
1.3 博弈的要素和分类
n
Q
qபைடு நூலகம்
i 1
i
P P(Q) P( qi )
i 1
厂商i的收益:
qi P qi P ( qi )
20 (q1 q 2 q3)
0
Q 20 Q 20
i P qi [20 (q1 q2 q3 )] qi
初步结论 1. 三厂商中每个厂商最大产量不会超过20 2. 每个厂商产量不会超过10
q1
4
4 5 5 3 7
q2
8
5 5 5 3 4 3
q3
6
6 6 5 3 3
我方2个师的兵力,敌方3个师的兵力,只能整 师调动。有两条进攻路线。我方兵力超过敌方, 则获胜;我方兵力小于或等于敌方兵力,则我 方负。问如何决策?
A a -,+
B +,-
C
D
敌方方案:A、三个师都驻守甲方向; B、三个师都驻守乙方向; C、两个师驻守甲方向,一个师驻守乙方向; D、一个师驻守甲方向,两个师驻守乙方向。 我方方案:a、两个师从甲方向进攻; b、两个师从乙方向进攻; c、兵分两路,两个方向各派一个师进攻。
2015/12/5
教材及参考书:
自编讲义
Game Theory 博弈论
谢识予. 经济博弈论(第三版). 上海: 复旦大学出版社, 2007. 罗伯特·吉本斯. 博弈论基础. 北京: 中国社会科学出版社, 1999. Gibbons . Game Theory for Applied Economists . Princeton University Press (July 13, 1992) 张维迎. 博弈论与信息经济学. 上海: 上海三联书店, 1996. A. K. Dixit, S. Skeath. 策略博弈. 北京: 中国人民大学出 版社, 2009. A. K. Dixit, B. J. Nalebuff. 策略思维. 北京: 中国人民大学 出版社, 2002.

b c
博弈:策略起关键作用
博弈就是策略对抗,或策略有关键作用的游戏

1.1.2 一个通俗定义
定义:博弈就是一些个人、队组或其他组织,面对一定 的环境条件,在一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进行选择并加以实 施,各自取得相应结果的过程。
四个方面 博弈的参加者(Players)——参与人 各参与人的策略(Strategies)或行为(Actions) 博弈的次序(Orders) 参与人的收益(Payoffs)
-7000
相关文档
最新文档