从非合作博弈走向合作博弈
博弈类型及其表述形式
1博弈的分类博弈模型一般分为合作博弈( cooperative game )和非合作博弈( non- cooperativegame),如图。
合作博弈是以单个参与者的可能行动集合为基本元素,而非合作博弈是以参与人群的可能联合行动集合为基本元素( Martin and Ariel Rub in stein ,2000, P2),也就是说,在合作博弈中,博弈中所有参与者都独立行动,不存在有约束力的合作、联合或联盟的关系,而在非合作博弈中,在一些参与者之间存在着有约束力的合作、联合或联盟的关系,并因为这种关系影响到博弈的结局。
合作博弈强调的是团体理性( collectiverati on ality )、效率、公正和公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是低效率或无效率的(张维迎,1996,P5)。
20世纪50年代,合作博弈的研究达到鼎盛期,同时开始出现对非合作博弈的研究,此后,博弈论的研究主流逐步转向在非合作博弈领域。
有些人认为非合作博弈模型比合作博弈更“基本”,但有些人认为两者不相上下(Martin and Ariel Rubinstein ,2000,P2)。
合作博弈,有时也叫做联盟博弈( coalitional game ),一般根据有无转移支付而分为两类:可转移支付联盟博弈( coalitio nal game with tran sferable payoff )和不可转移支付联盟博弈(coalitional game with non-transferable payoff )。
可转移支付也叫有旁支付(side payment ),可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来衡量他们的赢得,且各联盟的赢得可以按任意方式在联盟成员中分摊;否则,就是不可转移支付联盟博弈。
可转移支付合作博弈合作博弈不可转移支付合作博、非合作博弈非合作博弈的分类主要从两个角度进行划分。
从非合作博弈到合作博弈
龙源期刊网
从非合作博弈到合作博弈
作者:陈定洋王泽强
来源:《商业研究》2008年第03期
摘要:“一事一议”制度成为农村社区公共产品供给的重要运行机制,是我国农村公共产品供给制度变迁的结果;但在实践中机制运行却存在着农村公共产品供给的“政府失灵”与“市场失灵”两个非合作博弈,即“农户选择不提供,基层政府也选择不提供”成为唯一的纳什均衡。
因此,中央和基层政府需要调整政策,从积极引导农民组织化,培育多元的供给主体,确立公共财政理念等多方面入手,使基层政府与农民、农民与农民之间的非合作博弈走向合作博弈。
关键词:公共产品供给;“一事一议”制度;“政府失灵”;“市场失灵”;多中心治理
中图分类号:F224.32。
非合作合作两型博弈
“非合作合作两型博弈”资料合集目录一、基于非合作合作两型博弈且押金返还回收商的闭环供应链定价与利润分配研究二、基于非合作合作两型博弈且押金返还回收商的闭环供应链定价与利润分配研究三、押金返还制造商的闭环供应链双渠道回收竞争与利润分配的非合作合作两型博弈方法四、限制交流结构下供应链碳减排策略的非合作合作两型博弈研究五、考虑链间竞争与链内研发成本共担的绿色供应链决策基于非合作合作两型博弈方法基于非合作合作两型博弈且押金返还回收商的闭环供应链定价与利润分配研究在当今复杂多变的商业环境中,供应链管理已成为了企业成功的关键因素之一。
在闭环供应链中,产品的回收再利用对于企业的可持续发展和利润增长具有重要意义。
本文将探讨基于非合作合作两型博弈且押金返还回收商的闭环供应链的定价与利润分配问题。
在非合作博弈模型中,供应链成员之间不存在信息共享和协同决策。
每个成员都追求自身利益最大化,导致整体供应链效率低下,甚至出现“囚徒困境”。
在闭环供应链中,非合作博弈模型无法充分利用回收商的信息和资源,可能导致过高的交易成本和较低的供应链效率。
相比之下,合作博弈模型强调供应链成员之间的信息共享和协同决策。
通过建立合作伙伴关系,供应链成员可以共同制定定价策略和利润分配方案,实现整体利益最大化。
在闭环供应链中,合作博弈模型有利于提高回收效率和降低交易成本,进而提升整个供应链的利润水平。
押金返还制度是一种促进产品回收再利用的有效手段。
在闭环供应链中,企业可以向消费者收取一定数额的押金,承诺在消费者退回产品后返还押金。
押金返还制度可以激励消费者参与产品回收,提高回收率,进而降低生产成本和增加供应链利润。
基于非合作合作两型博弈且押金返还回收商的闭环供应链,企业需要制定合理的定价与利润分配方案。
企业应通过市场调研和分析,确定消费者对产品的需求和接受程度;根据产品的特性、市场需求以及回收成本等因素,制定合理的定价策略;企业应与合作伙伴协商制定利润分配方案,确保整体利益最大化。
合作博弈
1.非合作博弈(noncooperative game): 参与者无法协调相互之间战略选择的博弈,得到的是非合作博弈解(noncooperative solution),理性经济人需要解决的问题是:“当其他参与者会对自己的战略选择做出最优反应时,我的最优战略选择是什么?”2.合作博弈(cooperative game):参与者可以协调相互之间战略选择的博弈,得到的是合作博弈解(cooperative solution),合作博弈需要解决的问题是:“如果参与者的战略可以相互协调,什么样的战略选择才会带来整体最大收益呢?”3.在非合作博弈的世界里,是不会存在商品买卖行为的。
市场中,往往存折这能够促使买卖双方进行互利交易的机构,这样就可以得到所期望的合作博弈解。
4.在合作博弈中,买卖双方的转让支付是与协议联系在一起的,这种支付叫做旁支付(sidepayment)。
若个人的收益是主观的,与货币无关,则不存在旁支付。
5.解集:在保证每个参与者至少获得非合作博弈收益的基础上,使总收益达到最大值的所有合作联盟。
解集是全部有效(帕累托最优)联盟结构与收益分配方式的集合,参与者们至少能够获得非合作博弈下的收益。
6.怎样尽可能缩小可行解的范围:可以考虑以下因素来缩小可行解范围,比如来自其他潜在交易者的竞争压力,公平性,讨价还价能力7.当参与者不能对合作战略作出可信承诺时,将产生非合作博弈解8.联盟结构(coalition structure):每一种可能的联盟方式;大联盟(grand coalition):所有参与者联合在一起的联盟;单人联盟(singleton coalition):参与者各自形成一个联盟。
9.合作博弈理论的通用分析方法:分析重点在于收益不同的联盟形式的选择,也就是说只需要知道哪些联盟结构是博弈的核就可以了10.合作博弈的核:核包含在解集中,核是稳定的解11.存在转移效用(transferable utility):如果存在转移效用,参与者的主观收益与货币的多少紧密地结合在一起,可以通过货币转移来调整参与者之间的收益。
博弈论论文--非合作博弈论
非合作博弈论博弈论也叫对策论,是现代微观经济学的基础领域之一,主要研究在彼此互动的情形下个人是如何做决策的。
近年来它已经被广泛地应用于商业、政治、社会学等其他社会科学的分析中。
博弈的分类根据不同的基准也有不同的分类。
一般认为,博弈主要可以分为合作博弈和非合作博弈。
合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。
他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。
从而揭示了博弈均衡与经济均衡的内在联系。
纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。
1944年冯·诺依曼与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。
尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。
例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。
冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。
合作型博弈在20世纪50年代达到了巅峰期。
然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。
正是在这个时候,非合作博弈—“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。
非合作合作两型博弈方法及在供应链管理中的应用
这个章节探讨了如何将非合作博弈和合作博弈结合起来,形成一种更全面的供 应链管理策略。它解释了这两种方法的集成方式,以及如何通过这种方法实现 供应链的进一步优化。
这个部分总结了本书的主要观点和发现,并指出了未来研究的方向。它强调了 非合作合作两型博弈方法在供应链管理中的重要性,并鼓励读者将这些策略应 用于实践中。
这本书首先从基础概念入手,详细解释了非合作-合作两型博弈的定义、组成 要素、规范化刻画、分析框架、建模与求解过程。对于那些对博弈论和供应链 管理不太了解的读者来说,这一部分的阐述无疑是一次深入浅出的学术启蒙。 而对于已经有一定基础的读者,这也是一次对既有知识体系的巩固与升华。
非合作-合作两型博弈的最大特点是其创新性。它不仅仅个体或组织的策略选 择,还进一步探索了在不同策略选择下联盟的形成及利益分配问题。这一范式 的提出,不仅丰富了博弈论的理论体系,更为实际问题的解决提供了更为全面 和深入的视角。
“在供应链管理中,选择合适的博弈策略需要根据实际情况进行权衡。有时, 非合作博弈可能更有利于个体利益,而合作博弈则可能带来更好的整体效益。”
这一观点提醒我们,在实际操作中,我们不能盲目追求某一类型的博弈策略。 在做出决策时,我们需要全ቤተ መጻሕፍቲ ባይዱ考虑各种因素,如成本、收益、风险等,并在此 基础上选择最合适的策略。
阅读感受
《非合作-合作两型博弈方法及在供应链管理中的应用》:打破常规,开创博 弈新篇章
《非合作-合作两型博弈方法及在供应链管理中的应用》这本书,以其独特的 视角和深入的剖析,为博弈论和供应链管理领域带来了新的思考维度。作者李 登峰教授不仅为我们揭示了非合作-合作两型博弈的内在逻辑和运行机制,还 通过丰富的案例研究,展示了其在现实世界中的巨大应用价值。
博弈论复习题及答案
博弈论复习题及答案1. 博弈论中,非合作博弈与合作博弈的主要区别是什么?答案:非合作博弈是指参与者之间没有约束性协议的博弈,每个参与者都独立地选择自己的策略以最大化自己的利益。
而合作博弈则允许参与者之间形成具有约束力的协议,共同合作以达到共同的目标。
2. 什么是纳什均衡?答案:纳什均衡是指在一个博弈中,每个参与者都选择了最优策略,并且考虑到其他参与者的策略后,没有参与者有动机单方面改变自己的策略。
3. 零和博弈与非零和博弈有何不同?答案:零和博弈是指博弈中所有参与者的收益总和为零,即一个参与者的收益必然导致另一个参与者的损失。
非零和博弈则是指参与者的收益总和不为零,参与者之间可能存在合作共赢的情况。
4. 如何判断一个博弈是否存在纯策略纳什均衡?答案:可以通过构建博弈的收益矩阵,然后寻找每个参与者在其他参与者策略给定的情况下的最佳响应策略。
如果存在一组策略,使得每个参与者在其他参与者策略不变的情况下,都没有动机改变自己的策略,那么这个策略组合就是一个纯策略纳什均衡。
5. 混合策略纳什均衡与纯策略纳什均衡有何不同?答案:纯策略纳什均衡是指参与者在均衡状态下选择的策略是确定的,而混合策略纳什均衡则是指参与者在均衡状态下选择的策略是随机的,每个策略都有一定的概率被选择。
6. 什么是支配策略?答案:支配策略是指在博弈中,无论其他参与者选择什么策略,某个参与者选择该策略都能获得比其他策略更好的结果。
7. 博弈论中的“囚徒困境”说明了什么?答案:“囚徒困境”说明了即使合作对所有参与者都有利,但由于缺乏信任和沟通,参与者可能会选择对自身最有利的策略,导致集体结果不是最优的。
8. 什么是博弈论中的“倒后归纳法”?答案:“倒后归纳法”是一种解决动态博弈的方法,通过从博弈的最后阶段开始,逆向分析每个阶段的最优策略,直到博弈的初始阶段。
9. 博弈论在经济学中的应用有哪些?答案:博弈论在经济学中的应用非常广泛,包括但不限于市场结构分析、拍卖理论、合同理论、产业组织、宏观经济政策分析等。
合作博弈
哥本哈根气候峰会博弈
3 巴西这样的一些发展中国家的大国,在减排问题上 所采取的立场比中国主动。这对中国的国际形像有不 少负面影响。巴西政府在参加气候峰会前也提出了减 排目标。根据京都议定书的规定,作为发展中国家, 巴西本来也没有具有约束性的减排义务。但是巴西却 自愿做出了绝对减排的承诺。无论是用排放总量、排 放密度、人均排放等任何一个指标来衡量,巴西温室 气体排放上的责任都要比中国要小得多。巴西与中国 在这一重大国际问题上不同立场的对比,使得一向声 言要做一个"负责任的大国"的中国在面子上很有些挂 不住。
合作博弈的含义
与非合作博弈相比,需要一个描述集体 理性的效用函数。 纳什认为(1951),可利用纳什均衡这一 基本概念(非合作博弈的理论基础), 通过参与人间讨价还价过程,达成合作 的实现。在协议集(bargaining sets)理论 中对此进行了描述。 详细论述参考文献[3]、[4]相应部分。
Shapley 值
参与人集合N的一个置换 (permutation),是 任一函数π:N N,使得对于N中的每个j, N 中恰好存在一个i, 使得π(i) =j( π是单射,又 是满射) 给定上述置换π和任一联盟博弈v, 令πv为满足 π v ({π (i) | i∈S})=v (S), S为N的任一子集 的联盟博弈。
哥本哈根气候峰会博弈
2 中国的立场在发展中国家之间也备受争议。 受温室效应影响最大、承受能力最弱的是那 些最穷的发展中小国,尤其是那些受海平面 上升威胁最大的小岛国。他们的代表在会议 的第三天明确地提出,此次会议应该达成一 个比《京都议定书》更为严厉的新协议。这 个协议不仅应该对发达国家、也应该对像中 国这样的发展中大国具有约束力。中国对这 个方案马上提出了反对。中国的立场引起了 这些国家的强烈不满,因此中国所期待的发 展中国家用同一个声音说话的计划也就成了 水中阁楼。
非合作博弈算法-概述说明以及解释
非合作博弈算法-概述说明以及解释1.引言1.1 概述非合作博弈算法是一种在博弈论中常见的算法,用于处理个体之间相互作用但不协作的情况。
在非合作博弈中,每个参与者都追求自身的利益最大化,而不考虑其他参与者的利益。
通过非合作博弈算法,可以模拟和分析各种实际情况下的竞争和冲突,从中找出最佳策略和结果。
非合作博弈算法通常涉及到博弈论、优化理论、数学建模等多个领域的知识,因此在实际应用中具有广泛的适用性。
这些算法已经被成功运用在经济学、管理学、计算机科学、工程学等多个领域,为决策者提供了重要的参考和帮助。
本文将对非合作博弈算法进行深入探讨,分析其原理、特点、应用领域以及优势和局限性,旨在为读者提供全面的了解和收益。
1.2 文章结构本文将围绕非合作博弈算法展开,首先将介绍非合作博弈算法的基本概念和原理,包括其与博弈论的关系以及算法的运行机制。
接着将探讨非合作博弈算法在不同领域的应用,例如经济学、计算机科学和社会科学等。
然后将分析非合作博弈算法的优势和局限性,深入探讨其在实际应用中可能面临的挑战和限制。
最后,通过总结现有研究成果,展望未来非合作博弈算法的发展方向和潜在的应用领域,为读者提供对该领域的深入了解和启发。
1.3 目的:本文旨在介绍非合作博弈算法的基本概念、应用领域、优势和局限性,从而让读者对该领域有一个清晰的认识。
通过对非合作博弈算法的介绍,读者能够了解该算法在实际应用中的重要性和作用,以及在不同领域中的具体应用情况。
同时,本文也旨在探讨非合作博弈算法的未来发展方向,为相关研究和实践提供一定的参考和指导。
通过本文的阐述,希望能够促进对非合作博弈算法的学习和研究,推动该领域的进一步发展和应用。
2.正文2.1 什么是非合作博弈算法非合作博弈算法是一种博弈论中的概念,它主要研究在博弈过程中各参与者之间的竞争和冲突。
相对于合作博弈算法,非合作博弈算法更侧重于个体之间的自利行为,每个参与者都追求自身的最大利益而不考虑其他参与者的利益。
博弈论
ui ( si , s i ) ui ( si , s i ), s i,si si where s i ( s1 , , si 1 , si 1 , , sn ) 即s i S1 Si 1 Si 1 S n
称si*为局中人i的(严格)占优策略
各局中人先后、依次进行选择、行动 后出手者通常能观察到先出手者的选择 策略≠行动
按信息
信息是局中人关于博弈的知识,是实施决策的重要依据 完全信息(Complete Information):没有私人信息
局中人的策略集和支付函数均为共同知识
□ 策略集蕴含了行动集和出手时间
完全信息静态博弈是最简单的一种博弈类型。
中国科学技术大学管理学院 @ 2010
9
矩阵博弈与Maximin解(续)
矩阵博弈的Maximin解:
考虑到对方可能取使己方支付最小的策略(比如:对方通过各种渠道事先窥探 到己方策略),为稳健起见,选择纯策略的原则是:
让最小支付值尽可能大(取最差情况中最好的) ——悲观逻辑、最大最小原则 □ 考虑己方每个纯策略可能带来的最小支付(每行中的最小值) □ 比较这些最小支付,对应于最大的纯策略即为己方所选
对于矩阵博弈A=(aij)m×n,根据稳健的“最大最小原则”
己方Maximin策略: 对方Maximin策略:
i arg max
i{1,, m} j{1,, n}
min aij
1、逐行行内取小 2、小中取大 1、逐列列内取大 2、大中取小
j arg max
j{1,, n} i{1,, m}
合作博弈(Cooperative Game)
部分或全部局中人能够联合,达成一个具有约束力且可强制执行的协议的博弈 类型。 合作博弈强调的是集体理性,强调效率、公正、公平。 通过合作能带来“合作剩余” 合作博弈最重要的两个概念是联盟和分配。
博弈困境的两种解决方案分析
博弈困境的两种解决方案分析纳什均衡(Nash Equilibrium)概念的提出和存在性证明奠定了博弈论这门学科的基础,为理解和预测人们在策略互动中的行为提供了强而有力的工具。
但是,随着博弈论的发展,人们普遍意识到,甚至通过实验研究也发现,在有些博弈中,纳什均衡所预测的博弈结果并不符合人们的直观和各种实验研究的结果。
人们把这些纳什均衡与直观或现实严重冲突的博弈称为博弈困境,著名的例子有囚徒困境(Prisoner s Dilemma)、旅行者困境(Traveler s Dilemma)、蜈蚣博弈(Centipede Game)、纳什讨价还价问题(Nash bargaining problem)、伯川德悖论(Bertrand competition)、公共物品供给博弈(Public Good Game)、最后通牒博弈(Ultimatum Game)和独裁者博弈(Dictator Game)等。
旅行者困境是由著名经济学家Kaushik Basu于1994年提出来的博弈中的一个新的困境。
正如他本人所说:旅行者困境是一个特殊的并且令人信服的悖论,在这里,无情的博弈论理性和直觉观念无法保持一致。
该困境融合了以往困境中具有代表性的一些主要特征,从而使博弈论中的根本问题更为集中地得到展现。
旅行者困境的发现和提出,立刻引起了学术界的广泛关注,国际上不少博弈论学家和逻辑学家从理论和实验两个方面分别展开研究。
与此相反,国内学者虽然对一般意义上的博弈困境及其产生原因已有所关注,但是对针对博弈困境的各种解决方案缺乏细致而深入的学理分析和研究。
对解决方案的深入研究可以加深我们对人类社会中各种博弈困境的理解的同时,有助于寻找新的理论和现实解决方案,还可以避免对博弈论泛泛而谈的批评和指责。
本文以旅行者困境为例,对Halpern Pass提出的重复后悔度极小化模型和Capraro提出的基于联盟与合作的概率推理模型两种方案进行分析比较,以窥它们是如何成功地解释和预测旅行者困境中选手实际博弈行为的,并分析这两种方案各自存在的问题。
非合作博弈论
非合作博弈论
《非合作博弈论》是一门跨越经济学、决策理论和博弈论的核心理论,它为研究互利关系和竞争状况提供了一个重要的分析框架。
它首先是由美国经济学家威廉比诺德(William Vickrey)介绍的,他认为,这一理论能够帮助分析我们如何处理相互依赖的互利关系。
因此,他的理论已经受到了国际社会的广泛关注和评价。
非合作博弈论认为竞争性博弈的结果取决于参与者的决策策略。
在博弈过程中,参与者的决策者有一系列的收益矩阵,这些矩阵将决定最终的博弈结果。
另一方面,博弈还考虑了参与者可能会遵守或者违反约定,从而影响结果。
非合作博弈论的最重要结论是,参与者可以采取一种通过反复交换位置来最大化自身收益的策略,即所谓的“最优战略”。
看起来,如果参与者采取最优策略,那么这一理论没有反映出它自身的思想相互合作、协商、谈判和建立良好的信任关系。
然而,非合作博弈论也强调了个体之间可以通过互利协定达成共识,这些协定可以帮助所有参与者实现自身利益最大化。
此外,也可以让参与者相互间建立良好的信任关系,从而构建和谐的关系通过这种方式,可以更有效地实现双方的最大利益。
此外,非合作博弈论也是一种高效的决策工具。
它可以帮助管理者们采取最合适的措施,以最大限度地实现机构和个人的利益。
通过这种方式,它可以应用于多种不同的领域,如贸易谈判、政府决策、金融合同、政治决策等,以达到约定的目标。
总之,《非合作博弈论》是一个很重要的经济理论,它可以帮助我们更加有效地研究和分析互利关系和竞争状况。
通过对参与者可以采取的最优策略的深入研究和分析,它可以帮助我们更好地管理组织内部的决策,并且为达成积极结果奠定坚实的基础。
高校学生资助福利困境的非合作博弈向合作博弈的跃迁
丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌丌保山学院学报高校学生资助福利困境的非合作博弈向合作博弈的跃迁王俊春1段丹2李凯敏1张宇雁1赵兴国1(1.保山学院;2.保山中等专业学校,保山云南678000)[摘要]在论证高校资助育人中存在“福利困境”基础上,基于哈耶克—萨格登式“道德与惯例为同一社会演化过程的产物”的理论基础,构建学生资助育人对称模型和非对称模型,分析两种情形的演化稳定策略(ESS ),并得出资助育人中“利德融合”的相关研究结论。
[关键词]资助育人;福利困境;非合作博弈;演化稳定策略[中图分类号]H172.3[文献标识码]A doi:10.3969/j.issn.1674-9340.2020.04.012[文章编号]1674-9340(2020)04-070-09收稿日期:2020-08-17基金项目:2019年度云南省哲学社会科学教育科学规划项目“高校资助育人中的福利困境和解决路径研究”(项目编号:AD19007)。
作者简介:王俊春(1986-),男,云南保山人,硕士,副教授,研究方向为教育经济学。
通讯作者:赵兴国(1985-),男,布朗族,云南施甸人,硕士,副教授,研究方向为应用经济学。
习近平总书记在全国教育大会上指出,“培养什么人,是教育的首要问题。
要把立德树人融入思想道德教育、文化知识教育、社会实践教育各环节。
”高校立身之本在于立德树人,要坚持把立德树人作为中心环节,把思想政治工作贯穿教育教学全过程,实现全程育人、全方位育人。
高校学生资助的分配是道德浸润、道德教化的最佳试验场,在这个过程中,体察规则推演出道德的可能性、感受公平产生的过程、利益矛盾的协调等,在学生资助分配过程中达到物质支持和精神顿悟的结合,也就是“资助”+“育人”的双重价值主张。
“利”和“德”在学生资助分配中的关系是什么样的?二者可不可以融合以及如何融合?进而助力家庭经困难学生自由全面发展,这些是高校学生资助育人中十分重要的问题。
从非合作博弈走向合作博弈
当有一种情况发生即a与b之间有了不可分隔的共同利益可以互相依赖的资源存在合作的收益大于对抗的收益的时候彼此的对抗就会停止他们取消了互相之间的对抗转向一种理性结果即结盟从而能够资源共享内部分配得益最典型的例子就是寡头市场上的竞争合作如果两个寡头进行竞争那么他们都是以最大化自己的利润为目标而不管对方的利润怎样但是如果两寡头认为合作得益更多必定会签订协议从而形成垄断共同最大化垄断利润然后将合作所带来的总利润在两寡头之间进行分配
第9讲合作博弈论
,则 ( N , v) 称作常和博弈。
,
则 ( N , v) 称作简单博弈。
例如在投票博弈中,每个参与人的权重 wi (wi Q),1 i n ,
0 v( S ) 1
w Q w Q
iS i iS i
• 如果 v(S ) v(T ) v(S T ) v(S T ) ,则 ( N , v) 称作凸 博弈。
根据纳什的这一界定条件,由于合作博弈中存在具有约 束力的协议,因此,每位博弈者都能够按自己的利益与其他 部分的博弈者组成一个小集团,彼此合作以谋求更大的总支 付。我们称这些小集团为联盟(coalition),而由所有博弈者 组成的联盟则称为总联盟(grand coalition)。因此,对有n 个局中人参与的博弈,即 N {1,2,, n} ,我们称集合 N 的任何一 个子集 S 为一个联盟。
v(S1 S2 ) v(S1 ) v(S2 )
S1 S 2 ,如果。
n
类型2, v 满足 v( N ) v(i) 。即大联盟的效用大于每 i 1 个参与人的效用之和。这说明通过联盟创造了新的合 作剩余,联盟有意义,这种联盟能否维持,取决于如 何分配合作剩余,使每个参与人的支付都有改善。这 种对策称为实质性对策。
•
函数 v 对集合 N 当中的每一个可能的非空子集 S 都会进 行赋值,其值为一个实数,我们用 N , v 来表示一个合作 博弈,而函数为每一个集合所赋的值则称为S的联盟值。 为了确保每位博弈者都愿意组成总联盟,合作博弈论 一般要求支付可转移的联盟型博弈为有结合力的: 定义1.4 一个支付可以转移的联盟型博弈 N , v 是有结 合力的,当且仅当,对于集合 N 的每个分割物,即{S1 , S 2 , S m }
博弈论论文--非合作博弈论
博弈论论⽂--⾮合作博弈论⾮合作博弈论博弈论也叫对策论,是现代微观经济学的基础领域之⼀,主要研究在彼此互动的情形下个⼈是如何做决策的。
近年来它已经被⼴泛地应⽤于商业、政治、社会学等其他社会科学的分析中。
博弈的分类根据不同的基准也有不同的分类。
⼀般认为,博弈主要可以分为合作博弈和⾮合作博弈。
合作博弈和⾮合作博弈的区别在于相互发⽣作⽤的当事⼈之间有没有⼀个具有约束⼒的协议,如果有,就是合作博弈,如果没有,就是⾮合作博弈。
1950年和1951年纳什的两篇关于⾮合作博弈论的重要论⽂,彻底改变了⼈们对竞争和市场的看法。
他证明了⾮合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。
从⽽揭⽰了博弈均衡与经济均衡的内在联系。
纳什的研究奠定了现代⾮合作博弈论的基⽯,后来的博弈论研究基本上都沿着这条主线展开的。
1944年冯·诺依曼与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济⾏为》出版,标志着现代系统博弈理论的的初步形成。
尽管对具有博弈性质的问题的研究可以追溯到19世纪甚⾄更早。
例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利⽤博弈论⽅法帮助⽥忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,⽚断的研究,带有很⼤的偶然性,很不系统。
冯·诺依曼和摩根斯特恩的《博弈论与经济⾏为》⼀书中提出的标准型、扩展型和合作型博弈模型解的概念和分析⽅法,奠定了这门学科的理论基础。
合作型博弈在20世纪50年代达到了巅峰期。
然⽽,诺依曼的博弈论的局限性也⽇益暴露出来,由于它过于抽象,使应⽤范围受到很⼤限制,在很长时间⾥,⼈们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响⼒很有限。
正是在这个时候,⾮合作博弈—“纳什均衡”应运⽽⽣了,它标志着博弈论的新时代的开始!纳什不是⼀个按部就班的学⽣,他经常旷课。
合作博弈理论及其发展
盟博弈 用 , N = 11 , 2 , … … N }表示所 有行 为人 的集
合 。 一 个 收益分配 ( 拌 y o f al loc iat on ) 就是 指 砂 中 的
任一 向量 x 二 ( x ; ) i〔 N , 其 中每 个 分量 x i 都 可 以 理 解 为是集 合 N 中行 为人 i 的效 用 收 益 。 进一 步 来 说 ,
中对 不同情 形进 行 分 析 的重 要 的模 型 方 法 , 并且 都
能使 我们理 解策 略 的推 理给 予启发 。
一 、 联盟博弈
合作博 弈 ( C o pe m tl v e g 田叮es ) 又被 称 为联 盟博 弈
iaol(c
it o n al
邵叨 es
。
)
在 合 作 博 弈 中 , 合 作 ( c o ep ar -
用 , 那 么非合作博 弈不 一 定会 取 得 现 在 的辉 煌 ! 因 此 , 尽 管近 年来大 部分 的研究 集 中在 非合 作博弈 论 ,
但这 不能代表 非 合作 博 弈 要 比合 作 博 弈更 为 重要 。
不论是非合 作博弈 , 还是 合作博弈 , 它们都 反应 了针
对不 同类型 的策 略 所做 的分 析 和论述 , 都是博 弈 论
效用 ( 或支 付 ) 的联 盟 博 弈 , 对不 可 转 移效 用 的 支付 联盟 博弈仅 略有提 及 , 不 做 详 细介 绍 。
二 、 联盟 博弈解 的概 念
在 联盟博 弈 中 , 解 的概念 很 多 、 也很 复杂 , 而 且
很难找 到一个像 非合 作博弈 中具有 纳什 均衡那样 具 有核心 地位 的解 的概 念 。 因此 , 博 弈论 专 家从合作
。
合作博弈核仁法
合作博弈核仁法一、什么是合作博弈核仁法1.1 定义合作博弈核仁法是一种用于分析合作博弈的方法,通过研究博弈中的核和仁的性质来寻找合理的合作方案。
合作博弈是指在博弈中参与者可以通过合作来获得更大利益的一种博弈模式。
1.2 合作博弈和非合作博弈的区别合作博弈和非合作博弈是博弈论中的两种基本概念。
合作博弈强调参与者之间通过合作来达到共同目标,而非合作博弈则是每个参与者都追求自身利益的最大化。
二、合作博弈核的定义和性质2.1 核的定义合作博弈中的核是指一组合作方案,对于这组方案,没有任何一个参与者可以通过单方面退出博弈获得更大的收益。
核是一种稳定的合作方案。
2.2 核的性质核具有以下性质:1.集体理性:核中的每个参与者都选择了在核中达到自身最大利益的策略。
2.消费最佳化:核中分配的资源得到最有效地利用,没有浪费。
3.可行性:核中的分配方案是可行的,即满足各种限制条件。
3.1 Shapley值Shapley值是计算合作博弈核的一种方法,它是由Lloyd Shapley于1953年提出的。
Shapley值的计算考虑了每位参与者对于博弈结果的贡献。
3.2 Shapley值的计算公式Shapley值的计算公式为:ϕi(v)=∑(n−|S|−1)!(|S|)!n!S⊆N\{i}[v(S∪{i})−v(S)]其中,v表示博弈的特征函数,N表示参与者集合。
3.3 Shapley值的应用Shapley值可以用于计算任何合作博弈的核和解决方案。
它通过计算每个参与者的贡献来获得公平的分配方案。
四、合作博弈仁的定义和性质4.1 仁的定义合作博弈中的仁是指在合作博弈中,参与者遵守协议并认为大家都会遵守协议的性质。
仁要求参与者不会违背协议并选择最佳策略。
4.2 仁的性质仁具有以下性质:1.相互信任:合作博弈中的每位参与者都相信其他参与者不会违背协议。
2.遵守协议:仁要求参与者遵守协议,并基于对其他参与者的信任而选择自己的策略。
5.1 经济领域合作博弈核仁法在经济领域有广泛的应用。
博弈论的发展历程
博弈论的发展历程虽然早在18世纪初以前便开始了对具有策略依存特点的决策问题的零星研究,但博弈论真正的发展还是在20世纪。
20世纪初期是博弈论的萌芽阶段,其研究对象主要是从竞赛与游戏中引申出来的严格竞争博弈,即二人零和博弈。
这类博弈中不存在合作或联合行为,对弈两方的利益严格对立,一方所得必意味着存在另一方的等量损失。
这符合下棋等二人室内游戏的情形,但应用在经济与政治上,则大多数情况并不合适。
此时,关于二人零和博弈理论有丰硕的研究成果,尤其是提出了博弈扩展型策略、混合策略等重要概念,为日后研究对象范围的拓展与研究的深化奠定了基础。
这一阶段最重要的成就是泽梅罗定理(1913)与冯·诺伊曼的最小最大定理(1928),后者为二人零和博弈提供了解法,同时对博弈论的发展产生了重大影响,例如非合作几人博弈中的基本概念——纳什均衡就是最小最大定理的延伸与推广。
1944年,美国数学家冯·诺伊曼(Von Neumann)和摩根斯坦(Morgensien)合著的《博弈论与经济行为》一书的出版,标志着系统的博弈理论的初步形成。
该巨著汇集了当时博弈论的研究成果,将其框架首次完整而清晰地表述出来,使其作为一门学科获得了应有的地位。
同时身为经济学家的摩根斯顿首先清楚而全面地确认,经济行为者在决策时应考虑到经济学上的利益冲突性质。
该书详尽地讨论了二人零和博弈,并对合作博弈作了深入探讨,开辟了一些新的研究领域。
更重要的是将博弈论加以空前广泛的应用,尤其是在经济学上,由于博弈论数学上的严整性与经济学应用上的广泛性,一些经济学家将该巨著的出版视为数理经济学确立的里程碑。
接下来的一段时期对合作博弈的研究有了长足进步。
按豪尔绍尼(1966)的观点,如果一博弈中意愿表示——协议、承诺、威胁——具有完全的约束力并可强制执行,则该博弈是合作的。
如意愿表示不可强制执行,则为非合作博弈。
非合作博弈随后发展起来,纳什、泽尔滕和豪尔绍尼因此而获奖,但当时注意力主要集中在合作博弈上。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
作者简介:阮宇,女,(1990.8-),汉族,现为云南师范大学哲学与政法学院硕士研究生,研究方向为法律社会学。
摘要:本文通过对非合作博弈与合作博弈两种形式的特征比较,以及在当今社会所出现的社会问题中如何运用两种博弈理论来进行分析,并且结合现实生活当中的微观社会关系来深入探讨从合作博弈走向合作博弈的条件和后果关键词:非合作博弈合作博弈集体理性中图分类号:f301.22 文献标识码:a 文章编号:1006-026x(2013)07-0000-02一、文献综述非合作博弈与合作博弈这两种博弈方式都是研究个体的微观决策是如何做出来的,也就是在受限条件下怎样做出最优的决策,决策的时候会受到其他参与人的影响和总用,也就是说在博弈的过程当中,行动者所能得到的利益做不仅取决于自己的决策和主观偏好还受到其他参与人的决策和偏好。
那么在博弈当中有两种博弈方式倍受广大学者的青睐并且做出了探讨,从这两种类型的名称来看都并不是称得上完美的决策,所以必定有因为条件的不同而做出相对的最优选择,给人们提供一种思维方式从而能够至少降低人们做出系统性错误决策的概率。
非合作博弈关心的是策略,研究参与人在博弈中怎样做出决策,这是一种微观类型的理论,它涉及准确描述发生了什么;而合作博弈关心我们期望得到怎样的结果,往往不管过程如何,不关心该合作过程是否符合理性,人们认为合作博弈的发生主要是靠各方参与人共同达成的一直承诺来保证共同的得益并能够分配各方的得益。
从以上的描述来看,非合作和合作博弈的最大不同点在于行为层次的不同,是微观与宏观的区别,是个体和集体的区别,是信息不对称与制度设置约束的区别。
那么用抽象理论分析现实社会现象,人们是怎样从微观的个体层次的非合作的博弈走向了宏观集体主义的合作博弈呢,在现实生活当中,我们最常看到由于这两种决策行为的摇摆不定所出现的冲突,比如说群体外部的压力促使内部的矛盾重新得到消解走向了凝聚一体,虽然依然存在小矛盾但依然能抛弃冲突转向外部的侵犯,这种有问题的凝结在外人看来被认为是很不理性的,在个体微观层次来看同样是不可取的。
笔者认为,这关键的前提就是人们所提出来的制度设置具有的约束力,这种制度设置让合作博弈参与各方都获取了完全的信息,从而能够形成联盟,在这种格局当中强调的是集体理性,在这种集体理性当中各方获取各方的利益达成目标。
非合作博弈与合作博弈不同在于没有协议的存在,并且彼此之间信息不对称,所以需要时时刻刻保持对决策的准确把握,用微观的理性行为相互作用达成合作的目的。
张湛彬以博彩行为从非合作博弈走向合作博弈的政府选择偏好来说明由于博彩主体追求的主要是自身的利益而忽略了集体的利益,在没有约束力的规则下最优选择就是去参与赌博,假设政府也不出面干涉,私人的利益熏心就会鼠目寸光,制造很多骗局给社会带来消极影响,最终受害的依然是个体的利益,政府如果能够全面禁止博彩行为,全社会都会遵守就形成了那是均衡。
但是对于博彩活动来说那是均衡很难形成,因为由于政府的打击,赌徒的疯狂,双方信息不对称,政府可能受到各方面的条件限制打击不力,而赌徒因为有机可乘而更加猖狂,双方的较量最终无法落下帷幕,所以政府会一直完善对于赌博行为的规定从而能够对其进行制度化管制。
该作者认为政府的选择偏好能够对这种局势形成影响从而能走向合作博弈(虽然人们认为某些手段是不理性的),比如对某些地区或者某些赌博合法化。
该例子更具体揭示出非合作博弈和合作博弈的特征并展现出二者转化的条件,即制度设置的保证促成。
同样是对社会问题当中的博弈分析,周仲秋,何静以中国拆迁困局为例,说明如何从非合作博弈走向共商共赢,该文认为拆迁困局是中国城市化发展进程中多次非合作博弈结果积聚的集中爆发与呈现,拆迁成困难是在于博弈标准的缺失,过程中助推力及博弈的非合作化,基于博弈通常是非合作化的,因此,共商是达成双赢的较好的选择,拆迁不是必然的对抗性问题,拆迁为了更大的财富增长完全可以走向共商共赢,文中提到为达到此目标需要四个条件。
由此可以看出,在对社会问题当中的博弈分析,学者都会提出问题的基本解决逻辑,而这些逻辑无非与行为主体决策与偏好有关。
从一个社会现象转向一个群体的特征,任修霞、余素梅对一个群体――农民群体合作难的现象进行研究。
早在二十世纪二三十年代,乡村建设学派的学者晏阳初就提出中国人尤其是农民身上存在着四大缺陷,这就是“愚”、“穷”、“弱”、“私”。
所谓“愚”,即是指中国最大多数的农民,不但缺乏知识,简直是目不识丁;所谓穷,是指中国最大多数人民的生活,简直就是在生与死的夹缝里挣扎着,根本谈不到什么生活程度。
所谓弱,是指中国最大多数人民无庸讳言简直就是病夫,现代科学医疗,公共卫生等,根本谈不上。
所谓私,是指中国最大多数人民不能团结,不知合作,缺乏道德陶冶以及现代公民知识的训练。
人们会经常看到在发生突发事件时候出现“挤门口”这种行为被人们认为是很不理性的,因为你想挤出去摆脱困境,别人也想挤出去摆脱困境,在这种博弈的情况下,核心概念就应该是关于信任和可预期性。
人们如果是家人,他们有足够的自信去相信大家能够有序的走出那个狭窄的门,而不至于自己不能安全走出,但是在陌生人之间,人们不能够确认他人是不是能够顺利出去从而自己也有机会出去,如果不能,则自己所付出的代价就大了,导致大家惊慌失措、推挤出门。
有人认为这也是一种理性行为。
二、现实背景和意义我国处于社会的转型期,是一个经济的理性选择的大发展时代,人们要兼顾经济发展和社会发展。
在一个流动的陌生人的社会,人与人的社会关系出现颠覆血缘和地缘关系为主的社会关系代之以弱关系为主的特征,那么对于人与人之间的博弈的研究更适合这是时代的问题,个体已经被迫成自己生活的主体,那么他就将成为风险社会中各种活动的主体,人们会在各种错综复杂的关系当中产生迷茫和漂浮不定,对于自身的利益立场,是采取非合作博弈还是采取合作博弈策略产生更多的困惑,笔者转而走向以人为单位的研究,较之以上综述的以社会问题社会群体为研究对象的不同就在于此。
中国社会还是被认为是一个嵌入“权”和“利”的人情社会,人们还是不能摆脱一种人情的网络。
三个维度之间的争夺,已经不是单一的人情社会,从社会关系的角度来看,人们之间长期的交往与合作,在一定程度上提供给人们一种确定性,除非人们之间的关系受到震荡,比如欺诈。
“坚实的信任和可怕的欺诈都来自人际关系。
”因为人们认为在信任的基础上作出的行动可谓是一种可预期的理性的行为,是一种确认“信息对等”的情况下的行为,所要要付出的代价相对于在“黑箱”条件下所要付出的代价较小,对于这样的社会背景,必定在博弈当中有所不同,人情网络的存在会导致一种集体情绪的渲染,但也免不了乌合之众的产生,对于博弈过程当中的决策和偏好都会产生影响。
三、案例的提出现实生活当中最紧要的是社会关系的存在,要对社会关系进行较好的处理并不是一件易事比如生活中的是非关系,站错队伍或者并无队伍可言,人们都是在不断的动荡当中来选择最优的决策。
如a、b、c三者,在互相都没有完全信息对等的时候,互相之间的关系往往是采取策略来形成,在没有固定集体联盟的情况下,a也许会和b对抗,但也会在特定的情况下与b形成力量对抗c,处处为削弱对方的力量,三者两两较量有时候两败俱伤。
当有一种情况发生,即a与b之间有了不可分隔的共同利益,可以互相依赖的资源存在,合作的收益大于对抗的收益的时候,彼此的对抗就会停止,他们取消了互相之间的对抗,转向一种理性结果,即结盟,从而能够资源共享,内部分配得益,最典型的例子就是寡头市场上的竞争与合作,如果两个寡头进行竞争,那么,他们都是以最大化自己的利润为目标,而不管对方的利润怎样,但是如果两寡头认为合作得益更多,必定会签订协议,从而形成垄断,共同最大化垄断利润,然后将合作所带来的总利润在两寡头之间进行分配。
如果对抗是对双方的消损。
此时二者就完成了从非合作博弈走向合作博弈。
当他们完成该过程会转而形成怎样的格局呢?力量与资源相对较小的c此时面对的是两股力量的共同冲击,那么,a与b在认识到联盟所产生的力量的时候,就会处处与弱者对抗,甚至产生狂妄的集体意识,即使在该集体理性并不符合公平与正义的情况下依然如此。
集体意识和情感产生、发展后所造成的极端后果――集体欢腾。
集体欢腾被极端化为一种群体的狂热现象,以史为鉴,能举例出社会历史事件铁铮铮的事实,如我国文化大革命的极右的阶级斗争扩大化的社会局面,集体意识的高度的强化导致大范围的渲染和升温,对社会造成的破坏;在二战希特勒纳粹主义煽动下的种族主义的热潮,致使人性的毁灭和人类的苦难。
美国社会学家布劳曾说过,当一个群体以一种不可实现的理想主义至上作为这个群体斗争的动力和口号的时候,这个群体所具有的力量是不可低估的。
这被黎朋认为是一群“乌合之众”,是英国托克维尔笔下的“多数暴民”,具有人性关怀的社会学家、哲学家汉娜?阿伦特认为“以某种原因需要政治组织的地方就会有可能出现集权主义”,“而这类制度如此残暴,如此灭绝人性,以至于当它们在面对一种坚定的,团结一致的抵抗时,很容易在内部垮台,其原因就在于它那种古怪的无本质性。
微小的三方关系,扩大之后对照历史就能发现,当从非合作博弈走向合作博弈的时候,所产生的区别就是理性的立足点不同,合作博弈的过程相较于个体来说是非理性,这种个体非理性的集体理性会走向一种可悲的极端。
中国的人情背景更是应该提防这样的联盟出现,这种无本质的情绪的宣泄时常只是博取痛快,从而组成一个小集体,在小集体以外的东西都要排斥,并且会在无意识当中要求小集体成员必须要如此,那么在此时,小集体以外的c就是孤军一人,c 处于弱势会处处避免与该集体冲撞或者想法子决胜,该小集体也处处需要找到宣泄的出口并且c必定就是宣泄的替罪羊。
为了不让对方得逞,互相之间必定有所策略,即释放信息的手段要考虑个体决策最优。
四、小结本文以理论为线索,以现实生活中的例子来阐释理论含义,当从非合作博弈走向合作博弈时必定需要一个稳定有约束力的协议作为前提,在强调集体理性的合作博弈当中如果二者存在冲突时,不同的合作博弈会强调公平或者效率的不同侧面,那么,是不是说只有合作博弈才研究合作,而非合作博弈就无法解释人与人之间的合作了呢?其实,非合作博弈是在这样的背景当中存在的,即当无法达成有约束力的合作协议时,参与人之间如何通过理性行为的相互作用达成合作目的的过程。
但合作博弈也不是那么稳定牢靠的,当参与人之间组成联盟的行为会对其他参与人的得益产生外部性时,大联盟不一定能够形成。
如文所述,合作博弈组成的联盟内部也有矛盾,并且会产生集体主义情感。