博弈论ppt2
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈的分类 1.合作与非合作博弈 2.静态博弈与动态博弈 3.完全信息博弈与不完全信息博弈 4.完美信息博弈与不完美信息博弈 5.零和博弈与非零和博弈 6.常和博弈与非常和博弈
这里我们重点讲两个分类的简单概念,1和5
一.合作博弈与非合作博弈 我们现在谈到的博弈论大部分指的是非合作博弈论 区别在于: 合作博弈论:达成有约束力的协议,强调团体性,强 调效率,公正,公平。 非合作博弈论:强调的是个人的理性,个人最优决策 ,其结果可能是有效率的,也可能是没效率的。
无领导思考题: 一架私人飞机坠落在荒岛上,只有6个人存活: 1、孕妇:怀胎八月 2、发明家:正在研究新能源(可再生、无污染)汽车 3、医学家:今年研究艾滋病的治疗方案,已经取得突破 性进展 4、宇航员:即将远征太空,寻找适合人类居住的新星球 5、生态学家:负责热带雨林抢救工作组 6、流浪汉 这时,逃生工具只有一个能够容纳一人的橡皮气球吊篮, 没有水和食物。那么应该谁乘坐热气球离岛呢?
思路: 要确定排序原则和方法,不能单纯思考一个独立个体的特 征,一定要纵观岛上6个人的生存状态,按照最终能是 所有人获救的原则和思路来分析,也就是说谁可以安全 乘坐吊篮离开,去寻求救援队伍然后是岛上所有人获救。 分析:
1.孕妇:不可以上气球,高空压力的变化可导致流产,非常危险。 2.医学家:他有专业的医学知识,可以留下来照顾孕妇。 3.发明家:可以利用飞机残骸搞一些发明,作为等待救援期间的生活用品 和基础设施。 4.生态学家:对热带雨林环境有所了解,因此能也会有一定野外生存技巧, 可以带大家渡过难关。 5.流浪汉:懂得节约资源,寻找食物的方法。 6.宇航员:懂得各种飞行器的操作,有超强的耐力,精确的定位能力。所 以为最合适的人选。
二.零和博弈与非零和博弈 1.零和博弈:又称零和游戏,指在严格竞争 下,乙方的收益必然意味着另一方的损失 博弈各方的收益和损失相加的总和永远为 零,双方不存在合作的可能。 2.非零和博弈博弈各方的收益或损失的总和 不为零值。 正和博弈 (整体利益增加) 非零和博弈 (整体利益减少)
博弈论基本思想 1.人们在日常生活中进行着博弈,与配偶, 朋友,陌生人,老板/员工,教授等。 2.类似的博弈也在商业活动、政治和外交事 务、战争中进行着——在任何一种情况下, 人们相互影响以达成彼此有利的协议或者解 决争端。 3.博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学,心 理学和哲学。
囚徒到底应该选择哪一项策略,才能将自己 个人的刑期缩至最短?两名囚徒由于隔绝监 禁,并不知道对方的选择;就及时他们可以 互相交谈,还是未必能够相信对方不反口。 就个人理性选择而言,背叛对方所获得刑期 总比沉默这个赌注代价低。 两名囚犯当时各自的心境: ♠若对方沉默,我背叛会让我获释,所以在 这一点上我会选择背叛。 ♠若对方背叛我,我也必须背叛他才能获得 较低的刑期,所以我也是会选择背叛。
主讲人: 伟大的思想家,心理学家,经济学家, 各种学家,法库最牛X的人物
什么是博弈呢?博弈实际上就是如何在现 有条件下做出最优选择的一种策略。 博弈论也叫做对策论,或称赛局理论,是 研究具有斗争或竞争性质的现象的理论和 方法。可以简单的说,博弈论就是运用你 的智慧和理性思维,在纷繁的选择中能够 使你的利益达到最大化的一门科学。
总结:纳什均衡属于追求个人利益最大化, 但并不意味着一个总体(集体)最优 的结果。它是非合作博弈理论的结晶
囚徒困境是博弈论的非零和博弈中的具有代表 性的例子,反映的是个人最佳选择并非团体 最佳选择。虽然困境本身只属于模型的性质, 但在现实生活中的价格竞争,环境保护等方面 也会频繁出现类似的情况。
博弈论思想古已有之,我国古代的《孙子 兵法》就不仅是一部军事著作,而且算是 最早的一部博弈论著作
博弈论最初主要研究象棋、桥 牌、赌博中的胜负问题,人们对 博弈局势的把握只停留在经验上, 没有向理论化发展。
囚徒A
沉默
囚徒B
背叛
A获释 B服wk.baidu.com10 年 二人同时 服刑2年
沉默 背叛
二人同服 刑半年 A服刑10 年 B获释
B不降价 A不降价 A降价 都可获得5万 A:7万 B:2万 B降价 A:2万 B:7万 都获得3万
因此该博弈的得益数组(3万,3万)所对应的策略组合(降价,降价)为 本次博弈的纳什均衡。
虽然双方选择(不降价,不降价)要比降价好,但是参与博弈的双方都是以 追求自身利益最大化为目标,每一方都不能保证对方会不降价而自己也采 取不降价来共同分享利益,为防止对方降价而自己不降价给自己带来损失 的情况发生,最终双方选择的是均采取降价的纳什均衡,于是你降我也降 你再降我也降,价格大战由此拉开。这从博弈角度说明了价格竞争的必然 性。
应用: 旅游公司价格竞争的简单博弈模式 价格竞争是行业重复建设、对行业总体市场容量过度乐观、企业数量发展 过快的结果。近年来由于国家产业政策的支持, 旅游的产业规模急剧膨胀, 旅游公司数量增长幅度大大超过了旅游人数的增长幅度,从而造成供求失 衡。旅游公司为争夺市场份额,纷纷把降价作为争夺客源的主要手段。按照 博弈论的观点,在非合作博弈的条件下,降价是企业的合理选则。 假定在旅游市场有两家经营同类产品的旅游公司:A和B,还假设他们同时 行动,并只有两种选择:降价和不降价。从而得出旅游价格战博弈模型:
方案: 1.博弈双方主动改变博弈策略,将公司目标从“收入”调整为“利润”,使 (不降价,不降价)成为最优的纳什均衡,但这种条件的形成一直出于探 讨与研究。过程也是极为复杂。 2.持续创新同样是旅游行业获得较高利润,避免过度竞争的有效途径。旅游 企业可通过开发特色旅游新产品而避免产品雷同。比如近几年的老年旅游 市场的开发;以高中学生为对象,在假期举行的高校游;以各种兴趣为对 象的摄影游、徒步游、探险游等。
由此我们可以看出所谓非零和博弈,是既有对抗又有合作 的博弈.各参与者的目标不完全对立,对局表现为各种各 样的情况。自时候参与者只按本身的利害关系单方面做出 决策.有时为了共同利益而合作。其结局收益总和是可变 的,参与者可以同时有所得或有所失。换句话说非零和博 弈的博弈双方既可以相互合作,又可以互相竞争对抗,结 果可能是互有输赢,但总和不是零值,也可以是双赢或者 是双输。 在这里两个囚徒为了追求个人利益的最大化,基本不可能 出现一人背叛,一人沉默的必然,因此也就不会出现“零 和”,因此结局就会是另外的两种,即达到一个“非零和 ”的状态。两个囚徒选择合作那必然结果会是集体利益最 大,达到双赢,而在不知情的情况下就陷入了两难的处境 ,这就是“困境”的原因。囚徒困境所反映出的深刻问题 是,人类的个人理性有时能导致集体的非理性——聪明的人 类会因自己的聪明而作茧自缚。
二人面对的情况一样,所以通过二人的理想 思考都会得出一个相同的结论———选择背叛 。背叛是两种策略之中的支配性的策略。因 此,这场博弈中唯一可到达的纳什均衡,就 是双方都选择背叛,结果二人同时服刑两年 。 纳什均衡
又被称作非合作博弈均衡。在一个博弈的过 程中,无论对方的策略选择如何,当事人一 方都会选择某个确定的策略,则该策略被称 为支配性策略。如果两个博弈的当事人的策 略组合分别构成各自的支配性策略,那么这 个组合就被定义为纳什均衡。