博弈论的相关策略
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录
事实上,上述博弈中存在两个均衡状态,即(电影,电影),(音乐会, 音乐会),这种均衡叫纳什均衡。纳什均衡是这样一种状态,在对手策略选 定的条件下,各个对局者所选择的策略都是最好的。上策均衡是纳什均衡的 一种特殊情况。
在市场竞争中,同样存在与性别之战类似的情况。 在公共标准的争夺。90年代初,日本企业的高清晰度电视(HDTV)的 发展方面居于领先地位。高清晰度电视技术将极大地改善电视图象的质量, 并将成为未来的互动式电视传播方式的基础。但高清晰度电视的发展面临一 个重大的战略问题,即如何确定世界范围的技术标准?
目录
在这一对局中,有两个纳什均衡点,即(日本标准、日本标准),(欧洲 标准,欧洲标准)。但实际情况是,日本与欧洲至今未达成有关HDTV技术标 准的协议。同时,美国也在发展自己的HDTV技术标准,这个标准即不同于日 本标准,又不同欧洲标准,美国人的态度使HDTV技术标准问题进一步复杂化 了。
第二节 重复博弈与序列博弈 一、重复博弈
在这样一个对局中,最可能出现的是什么结局?显然,是两个都坦白,即(坦 白,坦白)的结局。 二、上策与上策均衡
在市场竞争中,有许多情况与囚犯的困境是完全类似的,其中十分典型的是 价格竞争的策略选择。
目录
假设一个市场中仅有A、B两家企业,每家企业可采取的定价10元或15元,我们 可用下面的得益矩阵来说明每种策略组合的结果。现在矩阵中每一对数字,前 一数字表示企业A可获得的利润,后一数字表示企业B能获得的利润,单位为万 元。 表7.2
目录
实际上,无论对企业A还是企业B来说,低价的策略都是他们的上策。 所谓上策是指这样一种策略,即不管对手采取什么策略,这种策略都是最优 的。当对局者在所有策略中存在一个上策的时候,这个上策就是他们的最优 策略。
当对局者选择的都是上策的时候,在博弈论中,把这种均衡叫作上策均 稀。博弈论中的所谓均稀是一种稳定的结局,当这种结局出现的时候,所有 对局者都不想再改变他们所选择的策略。上策均衡是均衡中的一种特殊状态 。这进而所说的均衡与前几章中所讨论的均衡概念有所不同,比如完全竞争 市场结构中最终实现的均衡状态,都假定企业是追求最大利润的,而企业在 均衡也实现了最大利润。
分析一下上述矩阵,可以发生囚犯A和B都面临一种两难境地。如果他们都听 从检察官的劝告而坦白的话,他们将
目录
被判入狱5年;如果他们都选择不坦白的策略,他们都将只被判2年。入狱2年 当然比入狱5年要好得多,但问题是,即使他们曾经订立攻守同盟,在背靠背后地 被审讯的情况下,同伙人还是可信任的吗?此时他们都将面临同伙人背叛的风险 ,也就是面临被判8年的风险。特别是,如果检察官:“他已经坦白了你还不坦白 吗?”这两个囚犯谁还能守口如瓶呢?
目录
日本企业已经有了他们的标准,这种标准被称为MUSE,而欧洲企业也 在开发他们自己的技术标准。假定这两类企业的技术标准的策略选择将使他 们得到如表9.4所示的得益矩阵。
日本企业
日本标准 欧洲标准
欧洲企业
日本标准
欧洲标准
100, 50 0, 0
30,20 60,90
目录
由上述得益矩阵可见,对日本企业来说,如果日本企业的欧洲企业都采用日 本标准,他们获得最大得益;同样地,对欧洲企业来说,他们的最大得益也要 求双方都采用欧洲标准。由此可见,协调对方都非常重要,如果他们各种采用 自己的标准,他们的得益都将远远低于采用同一种标准的情况。
上一节讨论的博弈都是一次性的,不再重复进行。但在现实中,企业之间 的竞争一般都持续一个较长时期,在对局可以多次重复的情况下,竞争的结局 是否有所改变呢?对博弈的参与者来说,此时是否存在一种最好的策略?
0,0 1,2
目录
从上述得益矩阵中可以看出,分开将使他们俩从得不到任何满足,只要 在一起,不管是看电影还是听音乐会,两人都会得到一定的满足。但音乐 会将使男的得到更大满足,看电影则使女的得到更大的满足。
在这样一个对局中,男的和女的都没有上策。实际上,他们最优策略依 赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动 就是最好的策略。因此,如果男的已经买好了音乐会的门票,女的当然就 不再反对;反之,如果女的已经买好了电影票,男的也就会与她一起去看 电影。
企业A
10元 15元
企业B
10元
15元
100, 80 50, 170
180,30 150,120
目录
比较一下表7.2与表7.1,可以发现它内部的结构是十分相似的。如果两家企 业都采取低价竞争的策略,他们的利润状况都将远远不如都采取高价策略的 结局。但如果企业A和B能够了解这一矩阵所示各种结果,并能采取一种相互 合作的态度,那末,他们都采取定价15元的策略就能获得更高的利润。这两 种两难境况与囚犯的困境是一样的。合作能够产生更高利润,但只要任何一 方(例如企业A)采取不合作的态度(定价10元),它就可能获得对它更有利 的结果,而另一方(企业B)则会受损(即此时A可盈利180万元,而B则仅获 利30万元)。
博弈论的相关策略
现在,对A和B来说,他们面临怎样的选择呢?博弈论采用所谓的得益矩隈来 描述这种对局,它列出对局者可以采取的各种策略,并估计出与每种策略的组合 相对应的结果。本便量度种最简单的情况,即只有两个对局者,每年对局都都只 有两种策略可供选择。囚犯A和B的得益矩阵如表7.1所示。
囚犯A
坦白 不坦白
囚犯B
坦白
-5, -5 -8, -1
不坦白
-1,-8 -2,-2
目录
在本例中,两个对局者A和B都可选择坦白或不坦白两种策略,他们所有选择 的不同组合可能得到四种结局。我们可将这四种结局依次表示为(坦白,坦白) ,(坦白,不坦白),(不坦白,坦白)和(不坦白,不坦白,)括号中前后两 种策略分别为对局者A和B所选择的策略。矩阵中的数字表明在不同结局下他们 各自的得益,前一数字是对局都A的得益。后一数字则是对局者B的得益。在本 例中,囚犯得到的是惩罚,因而他们的得益是负的。
目录
三、纳什均衡
现实中大量存在没有上策的情况,此时是否还存在对局的均衡状态呢?
性别之战。两个谈恋爱的人准备在周末晚上一起出去男的喜欢听音乐会, 但女比较喜欢看电影。当然,两个人都不愿意分开活动。不同的选择给他们带 来的满足由表9.3表示。表9.3 性别之战
男
音乐会
电影
源自文库
女
音乐会
2, 1 0, 0
电影
事实上,上述博弈中存在两个均衡状态,即(电影,电影),(音乐会, 音乐会),这种均衡叫纳什均衡。纳什均衡是这样一种状态,在对手策略选 定的条件下,各个对局者所选择的策略都是最好的。上策均衡是纳什均衡的 一种特殊情况。
在市场竞争中,同样存在与性别之战类似的情况。 在公共标准的争夺。90年代初,日本企业的高清晰度电视(HDTV)的 发展方面居于领先地位。高清晰度电视技术将极大地改善电视图象的质量, 并将成为未来的互动式电视传播方式的基础。但高清晰度电视的发展面临一 个重大的战略问题,即如何确定世界范围的技术标准?
目录
在这一对局中,有两个纳什均衡点,即(日本标准、日本标准),(欧洲 标准,欧洲标准)。但实际情况是,日本与欧洲至今未达成有关HDTV技术标 准的协议。同时,美国也在发展自己的HDTV技术标准,这个标准即不同于日 本标准,又不同欧洲标准,美国人的态度使HDTV技术标准问题进一步复杂化 了。
第二节 重复博弈与序列博弈 一、重复博弈
在这样一个对局中,最可能出现的是什么结局?显然,是两个都坦白,即(坦 白,坦白)的结局。 二、上策与上策均衡
在市场竞争中,有许多情况与囚犯的困境是完全类似的,其中十分典型的是 价格竞争的策略选择。
目录
假设一个市场中仅有A、B两家企业,每家企业可采取的定价10元或15元,我们 可用下面的得益矩阵来说明每种策略组合的结果。现在矩阵中每一对数字,前 一数字表示企业A可获得的利润,后一数字表示企业B能获得的利润,单位为万 元。 表7.2
目录
实际上,无论对企业A还是企业B来说,低价的策略都是他们的上策。 所谓上策是指这样一种策略,即不管对手采取什么策略,这种策略都是最优 的。当对局者在所有策略中存在一个上策的时候,这个上策就是他们的最优 策略。
当对局者选择的都是上策的时候,在博弈论中,把这种均衡叫作上策均 稀。博弈论中的所谓均稀是一种稳定的结局,当这种结局出现的时候,所有 对局者都不想再改变他们所选择的策略。上策均衡是均衡中的一种特殊状态 。这进而所说的均衡与前几章中所讨论的均衡概念有所不同,比如完全竞争 市场结构中最终实现的均衡状态,都假定企业是追求最大利润的,而企业在 均衡也实现了最大利润。
分析一下上述矩阵,可以发生囚犯A和B都面临一种两难境地。如果他们都听 从检察官的劝告而坦白的话,他们将
目录
被判入狱5年;如果他们都选择不坦白的策略,他们都将只被判2年。入狱2年 当然比入狱5年要好得多,但问题是,即使他们曾经订立攻守同盟,在背靠背后地 被审讯的情况下,同伙人还是可信任的吗?此时他们都将面临同伙人背叛的风险 ,也就是面临被判8年的风险。特别是,如果检察官:“他已经坦白了你还不坦白 吗?”这两个囚犯谁还能守口如瓶呢?
目录
日本企业已经有了他们的标准,这种标准被称为MUSE,而欧洲企业也 在开发他们自己的技术标准。假定这两类企业的技术标准的策略选择将使他 们得到如表9.4所示的得益矩阵。
日本企业
日本标准 欧洲标准
欧洲企业
日本标准
欧洲标准
100, 50 0, 0
30,20 60,90
目录
由上述得益矩阵可见,对日本企业来说,如果日本企业的欧洲企业都采用日 本标准,他们获得最大得益;同样地,对欧洲企业来说,他们的最大得益也要 求双方都采用欧洲标准。由此可见,协调对方都非常重要,如果他们各种采用 自己的标准,他们的得益都将远远低于采用同一种标准的情况。
上一节讨论的博弈都是一次性的,不再重复进行。但在现实中,企业之间 的竞争一般都持续一个较长时期,在对局可以多次重复的情况下,竞争的结局 是否有所改变呢?对博弈的参与者来说,此时是否存在一种最好的策略?
0,0 1,2
目录
从上述得益矩阵中可以看出,分开将使他们俩从得不到任何满足,只要 在一起,不管是看电影还是听音乐会,两人都会得到一定的满足。但音乐 会将使男的得到更大满足,看电影则使女的得到更大的满足。
在这样一个对局中,男的和女的都没有上策。实际上,他们最优策略依 赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动 就是最好的策略。因此,如果男的已经买好了音乐会的门票,女的当然就 不再反对;反之,如果女的已经买好了电影票,男的也就会与她一起去看 电影。
企业A
10元 15元
企业B
10元
15元
100, 80 50, 170
180,30 150,120
目录
比较一下表7.2与表7.1,可以发现它内部的结构是十分相似的。如果两家企 业都采取低价竞争的策略,他们的利润状况都将远远不如都采取高价策略的 结局。但如果企业A和B能够了解这一矩阵所示各种结果,并能采取一种相互 合作的态度,那末,他们都采取定价15元的策略就能获得更高的利润。这两 种两难境况与囚犯的困境是一样的。合作能够产生更高利润,但只要任何一 方(例如企业A)采取不合作的态度(定价10元),它就可能获得对它更有利 的结果,而另一方(企业B)则会受损(即此时A可盈利180万元,而B则仅获 利30万元)。
博弈论的相关策略
现在,对A和B来说,他们面临怎样的选择呢?博弈论采用所谓的得益矩隈来 描述这种对局,它列出对局者可以采取的各种策略,并估计出与每种策略的组合 相对应的结果。本便量度种最简单的情况,即只有两个对局者,每年对局都都只 有两种策略可供选择。囚犯A和B的得益矩阵如表7.1所示。
囚犯A
坦白 不坦白
囚犯B
坦白
-5, -5 -8, -1
不坦白
-1,-8 -2,-2
目录
在本例中,两个对局者A和B都可选择坦白或不坦白两种策略,他们所有选择 的不同组合可能得到四种结局。我们可将这四种结局依次表示为(坦白,坦白) ,(坦白,不坦白),(不坦白,坦白)和(不坦白,不坦白,)括号中前后两 种策略分别为对局者A和B所选择的策略。矩阵中的数字表明在不同结局下他们 各自的得益,前一数字是对局都A的得益。后一数字则是对局者B的得益。在本 例中,囚犯得到的是惩罚,因而他们的得益是负的。
目录
三、纳什均衡
现实中大量存在没有上策的情况,此时是否还存在对局的均衡状态呢?
性别之战。两个谈恋爱的人准备在周末晚上一起出去男的喜欢听音乐会, 但女比较喜欢看电影。当然,两个人都不愿意分开活动。不同的选择给他们带 来的满足由表9.3表示。表9.3 性别之战
男
音乐会
电影
源自文库
女
音乐会
2, 1 0, 0
电影