博弈论引论
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论与行为经济学 GMAE
中国经济特区研究中心 章平
pzhng@
课程内容安排
• • • • 教学以老师授课为主 同学们若有问题,欢迎随时发问 行为实验 课堂讨论
• 寻找知识、理论和案例三者间最佳平衡点
考核与成绩评定
• 学期成绩包括期中期末测验及课堂、出席 状况。
期末测验占学期成绩的主要部分, 测验将随堂进行(初定18周)。
• 随机抽点,每人享有三次缺席的机会。
第 三次缺席起,扣分。
本课程不接受事假和 公假(已有三次缺席的权利)。
参考书
• 王则柯。
人人博弈论 • 阿维纳什·K.迪克西特,巴里·J.奈尔伯夫 • 妙趣横生博弈论
博弈论
• 博弈论是有关“互动行为”(interactive behavior)的科 学。
研究决策主体的行为直接相互作用的决策以及这种决 策的均衡问题。
game1
• 分歧终端机(同时出牌)
• 由两片带把手的ABS塑料组成一个圆筒。
使用时,有分歧的两人分别 将手伸进塑料筒,在筒中各自出招,然后一齐喊“一二三”,分别用 另外一只手把塑料圆筒上的小把手拉开,这样两人都不能临时变招了。
Game1 以败取胜
• 2004《Survivor》第一季冠军理查德·哈奇 • 最后环节,理查德的对手还剩两个,一个是72岁的海豹特 种部队的退役海军鲁迪·伯什(最受欢迎,进入决赛就极可 能获胜),另一个是23岁的导游凯莉·维格尔斯沃斯。
• 在最后的挑战中,三人都需要站在一根柱子上,一只手扶 在豁免神像上。
坚持到最后的人将进入决赛。
而同样重要 的是,胜出者要选择他的决赛对手。
• 理查德最希望的就是在决赛中与凯莉对阵:一是凯莉在柱 子站立比赛中胜出,并选择理查德作为决赛对手;另一种 是理查德胜出,然后选择凯莉。
在理查德看来:终极挑战会以如下三种方式之一发生
(1)鲁迪赢。
然后鲁迪选择理查德,但鲁迪最有可能成为 赢家。
(2)凯莉赢。
凯莉很聪明,知道她只有淘汰鲁迪,与理查 德对阵,才最有希望获胜。
(3)理查德赢。
若他选择鲁迪继续对阵,鲁迪就会在决赛 中打败他。
若他选择凯莉,凯莉将击败他,因为理查德将失 去鲁迪及其诸多朋友的支持(由被淘汰的选手们投票决定最 终的获胜者)。
• 放弃比赛使理查德免去了在烈日下站柱子的煎熬 • 4小时11分钟后,鲁迪在改变站姿时跌了下来。
• 凯莉和理查德对阵,鲁迪投出了关键的一票! 理查德的比赛之所以令人印
象深刻,是因为他能够提前 预料到所有不同的行动。
1个球拍和一个球总共 花了1.10美元,球拍比 球多花1美元,请问买 球花了多少钱?
行为实验
incentives
•学生上课不认真,若置之不理就失去了老师的权威,若点名批评后学生继续不认真,老师的权威也同样失去。
就像Stephen Morris一篇论文里讲的,法院若一味遵从民意就失去了独立性和权威,若总是和民意向左,民众也就不再听法院的。
如何保持权威,这是个策略问题。
incentives
•激励:给人们一个理由,通过让他们觉得做你想要做的事情,对他们来说也有好处,让人们做你想要他们做的事情。
让游戏中的其他玩家觉得值得来玩你想要玩的游戏。
•市场经济VS计划经济
•监管的角色
•高管薪酬
•政府救助——奥曼演讲
/html/8762/2013/1/22/9336 52.shtml
1基本概念
1.1博弈三要素1.2博弈分类
1.3博弈表达
Game2
如果给你两个师的兵力,由你来当司令,任务是攻克敌人占据的一个城市,通往城
市的道路只有甲乙两条,而敌军的守备力
量是三个师。
规定:双方兵力只能整师调动;当你发起攻击时,你的兵力超过敌人,你就获胜;你的兵力比敌人守军少或相等,你就失败。
那么,你将如何制订攻城方案?
——王则柯《人人博弈论》p.6
规则和兵力都有利于敌方,你一定输吗?敌方行动方案:A 3个师守甲B 2个师守甲,1个师守乙C 1个师守甲,2个师守乙
D 3个师守
你的行动方案:
c 2个师从甲攻
b 1个师从甲攻,1个师从乙攻
c 2个师从乙攻
敌
A B C D
++——a——++你—++—b+——+
——++ c++——
攻守博弈
诺曼底登陆模拟
•比较A和B:
•如果我采取a,则敌军采取A或B都会赢,结果一样。
•如果我采取b,则敌军采取A会输,采取B会赢。
•如果我采取c,则敌军采取A或B都会输,结果一样。
•可见,站在敌军的立场,B优于A;
•同样比较敌军的C和D,可知C优于D。
•在此基础上,可知我的策略中,c最差。
•所以最终情况是:
•敌军必取“2+1”;而且我则是集中兵力攻击敌军一处,当然是薄弱处。
• • • • •
你第一轮猜的数是 你第二轮猜的数是 你第三轮猜的数是 你第四轮猜的数是 你第五轮猜的数是
? ? ? ? ?
最小化平均信息量区间二等分并选择其中间数
分析该问题最符合逻辑和最有效的方式
博弈论提示:将自己置于对方的立场。
。
我们站在你的立场上,预计你会怎么 猜。
弄清楚了你会怎样玩这场游戏, 我们便可以降低你猜中我们数字的机 会,从而也大大降低了我们需要付出 的金额!
我们的目的是让你赢不到钱!
• 你第五轮猜的数是 ?
要想在游戏中击败我们,你 必须比我们考虑得更进一步!
是什么使得某些事件成为一场博弈:你必须考虑到其 他参与人的目标及策略。
在猜测一个随机挑出的数字时,这个数字不会被刻意 掩饰。
工程师的思维——将区间一分为二。
但在博弈中,你需要考虑其他参与人将如何行动,以 及那些人的决策将如何影响你的策略。
Game4 领先还是不领先
假如你成绩领先了,那么,维持领先地位的 最可靠的办法就是看见别人怎样做,你就跟 着怎样做!
• 帆船比赛给我们提供了一个很好的机会,观察 “跟随领头羊”策略的一个很有意思的反例。
• 成绩领先的帆船,通常会照搬尾随船只的策略。
一旦遇到尾随的船只改变航向,那么成绩领先的 船只也会照做不误。
实际上,即便成绩尾随的船 只采用一种显然非常低劣的策略时,成绩领先的 船只也会照样模仿。
• 为什么?因为帆船比赛,成绩接近是没有用的, 只有在最后胜出才有意义。
博弈论提示:跟在别人后面采取行动有两种办法。
一是 一旦看出别人的策略,你立即模仿(好比帆船比赛的情 形);二是再等一等,直到这个策略被证明成功或者失 败后再说(好比电脑产业的情形)。
在商界,等得越久越有利,这是因为,商界与体育比赛 不同,这里的竞争通常不会出现赢者通吃的局面。
结果是,市场上的领头羊们,只有当它们对新生企业选 择的航向同样充满信心时,才会跟随这些企业的步伐。
Game5 策略思维
• 辛迪想要减肥。
她只知道该怎样做:少吃,多运动。
她非常了解食物金字塔,也很清楚各种饮料中所含 的卡路里。
可是这一切都没有用,没有对她的减肥 大计产生任何效果。
她的第二个孩子出生后,她的 体重增加了40磅 ,而且一直都没有瘦下来过。
• 这就是为什么她接受了美国广播公司为她提供减肥 帮助的原因。
2005年12月9日,她来到了曼哈顿西 部的一个摄影工作室,在那里她换上了一件比基尼。
从9岁起,辛迪就再没有穿过比基尼,而且现在也 不是再开始穿比基尼的时候。
• 她和美国广播公司黄金时段节目组签订了一份协议, 如果她能在接下来的两个月内减掉15磅,他们就会 销毁这些照片。
• 美国广播公司不会为她提供任何减肥帮助。
它们不 提供教练、不提供培训师、也不提供专门的减肥食 谱。
她已经知道自己该怎样做。
她需要的仅仅是一 些额外的激励,以及从今天而不是从明天起开始减 肥的理由。
• 现在,她已经有了额外的激励。
如果她不能成功减 肥,美国广播公司就会把这些照片和录像展现在黄 金时段电视节目上。
她已经和美国广播公司签约授 权。
他们是在和未来的自己博弈。
今天的自己想让未来的自 己节食和运动;而未来的自己想吃雪糕和看电视。
但大 。
多数时候是未来的自己获胜,因为人们总是最后才行动。
解决这一问题的方法是,改变对未来自己的激励,从而 改变他的行为。
• 两个月后,辛迪减掉了17磅。
虽然公开照 片的威胁是让他们开始减肥的动力,但一 旦他们开始减肥,接下来的努力就得靠自 己。
项羽“巨鹿之战”:破釜沉舟 韩信:背水一战
1.1 博弈三要素
• 博弈分析之前需要区分的关键: • 参与人 Players:可以是一个、二个或多个;可以是个人、
厂商,也可以是国家。
• 行动或策略 Actions/Strategies:是指博弈中的任一
参与人针对其他参与人的可能行动所采取的行动原则和应对办法。
[纯策略、混合策略] • 支付 Payoffs:博弈参与者所获得的收益或效用。
Game6 连续性的小悦悦事件
• 2010年12月15日,深圳市福田区益田村,78岁的 市委组织部老干部肖雨生在小区里跌倒,保安和 路人无一上前搀扶。
20多分钟后,儿子肖先生外 出时发现,老人孤零零趴在地上,额头磕破流血, 鼻子紧贴地面,已没有了呼吸。
• 2011年1月1日,深圳两名中学生扶起了一名摔倒 的78岁老人,并将其送到医院,待老人伤口包扎 完毕之后又将其送回了家。
昨天,深圳市见义勇 为基金会奖励两名学生各1万元。
老人儿媳表示, 这种举动改变了她扶人怕被讹诈的想法。
表彰决 定中说:两名学生的行为彰显社会正气,是市民 学习的榜样。
2011年11月20日,34岁的上海男人潘跃昀
在开车路上碰到遭土方车碾轧的4岁小女孩。
他抱起受伤的小女孩奔波近20公里,垫付6000元医药费。
当被问起是否担心被讹,
他说,你无法判断别人是好人还是坏人,
但你自己可以做一个好人。
博弈论在近年来“进步神速”•加州蒙特利海军研究生院的Owen透露,博弈论软件对于发现本·拉登藏身于巴基斯坦的阿伯塔巴德起到了重要作用;•Bueno de Mesquita在2010年5月即预测埃及总统穆巴拉克将在一年内倒台;据悉2007年美军还曾向他提供机密信息,让他模拟航母靠近朝鲜的政治影响
•英超点球:26.3%的点球由左脚发出,成功率82.3%,显著高于右脚的成功率74.6%。
Game 7
•模拟瑞典卖过的这种彩票:花10克朗,可以在1至99999间选择一个整数。
如果你的数只有你一个人选、且在所有只有一个人选的数中最小,你就中大奖了,得到至少10万克朗的奖金。
几位学者用瑞典这种博彩的数据,验证博弈论的推断。
•2007年初,这种彩票在瑞典推出两个多月后就停了。
原因是有很多人私下合谋,各自选不一样的数,以增加他们的中奖机会。