《博弈论与信息经济学》课程论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《博弈论与信息经济学》课程论文
2014-2015(1)
学院:生命科学学院
专业:生态学
年级: 2011级
学号: **********
学生姓名:***
任课教师:**
2014年12月
论博弈论中的策略思维
李贵阳
贵州大学生命科学学院(550025)
内容摘要:博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。本文从合作、模仿、创新、拍卖、战争和群居等实例表明博弈论中的策略思维是如何影响人们的行为的。
关键词 :博弈论策略思维
博弈论源于历史上一些颇为有趣的游戏, 但同时也是一门学问艰深的理论。那么博弈论为什么能在经济学领域产生如此巨大的影响呢 ? 又何以在经济分析中独辟蹊径,形成了能与 (随机 )一般均衡理论相对立的另一种经济学研究范式? 这恐怕还得益于博弈论的起源和其中蕴含的策略思维。博弈论从本质上讲是一种游戏理论, 在给定游戏的特定规则 (信息结构 )下, 游戏参与人要想赢得游戏就必须对其他参与人的心理和可能采取的行动进行反复揣摩, 并据此决定和调整自己的行为 ,这就是制定策略或对策的过程。为此, “博弈论”一般也称为“对策论”或“游戏理论”。加之博弈论的游戏情节一般也源于人们的真实生活, 是生活环境的抽象和概念化, 因此, 博弈的结果不仅仅是游戏胜败的表现, 而且更是生活哲理的凝结 ,它为人们深刻理解和准确把握各类社会经济现象提供了一份独特的视角,同时对制定社会规则和经济政策具有现实的指导意义。
一、“囚徒困境”:合作还是不合作
考虑这样一种情形,小偷甲和乙联手作案 ,私入民宅被警方逮住, 但未获证据。警方将两人分别置于两所房间分开审讯。若一人招供但另一人不招, 则招
供者立即释放, 不招供者判入狱 10年;若二人都招供则各判刑 8年 ;若两人都不招供则因未获证据但私入民宅而各拘留 1年 (见表 1)。试问甲和乙应该如何抉择自己的行为 ? 理性行为人的想法是这样的:对甲来说, 无论乙是选择“招”还是“不招”,选择“招”都会比选择“不招”来得更好。因此 , “不招”是相对于“招”的严格劣策略, 所以, 甲会选择“招”。同理 ,根据对称性 ,乙也会选择“招”,于是纳什均衡解便是甲乙两人都招供, 各判 8年。这个例子表明 ,运用“剔除严格劣策略”的方法可以找到问题的均衡解。虽然甲乙两人都选择“不招”是集体最优的, 但是这个结果不会出现 ,或者说, 甲乙双方都存在偏离这一结果的激励,个体理性与集体理性之间存在着冲突。假设从两人都不招供出发 ,只要其中一人变卦,他就能谋取更多的利益。为此 ,即便甲乙两人都有不招供的约定在先,这样的约定也只能是“不可置信的承诺”而已 ,故而纳什均衡解具有内在稳定性。
表 1 囚徒困境博弈支付矩阵
在囚徒困境的重复博弈中,有两种著名的策略,一种叫“冷酷”策略(grimstrategy),另一种叫“针锋相对”策略 (tic-for-tacstrategy)。所谓“冷酷”策略是指对于事先两人均不招供的攻守同盟,一旦有人招供,则对方在以后的任一阶段博弈中,都将选择招供,以示对对方违约的惩罚, 对方也将丧失改正错误的机会 ;而“针锋相对”策略是指行为人在本阶段选择对方前一阶段的行为选择, 相对于“冷酷”策略 , “针锋相对”策略允许行为人存在违约的激励 ,因而它不会是精炼均衡。模型表明合作潜在地具有“囚徒困境”的逻辑结构 ,因而我们可借此分析日常生活中的许多合作与不合作现象。政府提供公共品便是极好的一例。设想有两户相邻的住户,需要一条好路从居住地通往公路。修一条路的成本为 4,每个住户能从修好的路上获利为 3。如果两家住户共同出资联合修路 ,并平均分摊修路成本 ,则每家住户获得净利为 1;当只有一家住户单独出资修路时 ,修路者获利为 -1,“搭便车”者 ,即不出资但仍可以使用修好的路的另一住户获利为3(不考虑产权问题 )(表 2)。
表 2 修路博弈支付矩阵
通过“剔除严格劣策略”方法, 可以得到 ,两家住户都不会出资修路。为了解决这条新路的建设问题,需要政府强制性地分别向每家征税2单位, 然后投入 4单位资金修路 ,并使两家住户都得到 1单位的利益。这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因。同样的道理 ,国防、教育、社会保障,环境卫生等都由政府承担资金投入, 而私人投资的积极性一般都不高。“囚徒困境”重复博弈还能用来解释企业 (或者银行和企业 )之间的合作问题。当一次性违约的收益大于失信所必须付出的代价时 ,企业就存在偏离合同规定行事的激励。这种内生的激励表明 , “损人利己”也是行为人的理性选择。如果企业之间致力于长期合作 ,就应当设法改变合作机制 ,降低合作企业发生机会主义行为的概率。除了健全社会诚信体系之外, 一种行之有效的方法便是采取“冷酷”策略,以提高失信成本。
二、智猪博弈 :创新还是模仿
“囚徒困境”中参与人地位是对等的 ,如果参与人地位不对等 ,又会发生怎样的情况的呢? 假设猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮, 每按一下 ,位于猪圈另一端的食槽中就会有 10单位的猪食进槽, 但按一下按钮会耗去相当于 2单位猪食的成本。如果大猪按钮取食 ,小猪在一旁等待, 则大猪能吃到9单位食物而小猪仅能吃到 1单位食物;如果两猪同时按钮取食 ,则大猪吃7单位, 小猪吃3单位食物;如果小猪按钮取食 ,大猪在一旁等待, 则大猪吃6单位而小猪吃4单位食物 (见表 3)。这个博弈没有“剔除劣策略均衡”,因为大猪没有劣策略。但是,小猪的劣策略是“按”,因为无论大猪作何选择, 小猪选择“等待”是比选择“按”更好一些的策略。所以 ,小猪会剔除“按”, 而选择“等待”;大猪知道小猪会选择“等待”,从而自己的最优选择是“按”,