博弈论
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论
1 引言
博弈论包括局中人,策略和支付函数三个要素。有n个局中人参入的博弈称为n人博弈, n≥ 2。每个局中人有个支付函数,其收益或损失由所有局中人的策略按照该支付函数计算。每个局中人采用的策略可以是其多个策略中的某一个,或者是策略的某种概率分布。前者称为纯策略博弈,后者称为混合策略博弈。纯策略可以看作是混合策略的特殊情形。根据局中人之间的关系,博弈分为合作博弈和非合作博弈。每个局中人都希望使自己的利益最大化。但是在非合作博弈中,由于局中人的利益是互相冲突的,只能寻求一组策略使每个局中人较为满意。一组策略是指由每个局中人的一种策略构成的策略组合。如果存在一个策略组合,无论那个局中人单方面地改变其策略,不会使其收益增加,只可能使其收益减少,这个策略组合就叫做納什均衡(或納什均衡解、納什均衡点)。以下是关于納什均衡的正式定义及其存在性定理(见[1])。
Formal definition
Let (S,f) be a game with n players, where S i is the strategy set for player i, S = S1⨯S2⨯…⨯S n is the set of strategy profiles and f = (f1(x), f2(x), … , f n(x)) is the payoff function for x∈S. Let x i be a strategy profile of player i and x-i be a strategy profile of all players except for player i. When each player i∈ {1, 2, … , n} chooses strategy x i resulting in strategy profile x = (x1, x2, … , x n) then player i obtains payoff f i(x). Note that the payoff depends on the strategy profile chosen, i.e., on the strategy chosen by play i as well as the strategies chosen by all the other players. A strategy profile x*∈S is a Nash Equilibrium (NE) if no unilateral deviation in strategy by any single player is profitable for the player, that is
∀i, x i∈S i: f i(x i*, x-i*) ≥f i(x i, x-i*).
Nash’s Existence Theorem
If we allow mixed strategies, then every game with a finite many pure strategies has at least one Nash Equilibrium.(有限策略的非合作n人博弈至少有一个納什均衡)
2 二人博弈
2.1 纯策略博弈
局中人I有m个策略A1, A2, … , A m,局中人II有n个策略B1, B2, … ,B n,不同策略下双方的收益如表2.1所示([2]p72)。
表2.1 二人博弈的收益表
由每个单元格中前一个数字构成的矩阵A = (a ij)m⨯n是局中人I的收益矩阵,由后一个数
字构成的矩阵B = (b ij )m ⨯n 是局中人II 的收益矩阵。
当局中人II 采用某策略B j 时,如果局中人I 采用其m 个策略中的策略A i 可以获得最大收益,称A i 是对B j 的最优反应。同样,当局中人I 采用某策略A i 时,如果局中人II 采用其n 个策略中的策略B j 可以获得最大收益,称B j 是对A i 的最优反应。当A i 和B j 互为最优反应时,称(A i , B j )为该博弈的纯策略納什均衡点。纯策略博弈问题可能有一个,多个或没有納什均衡点。
下面介绍计算纯策略納什均衡点的一种方法。
在局中人I 收益矩阵A = (a ij )m ⨯n 每一列的最大数字上标上*号,在局中人II 收益矩阵B = (b ij )m ⨯n 每一行的最大数字上标上*号。如果同一位置有两个*号,那么其相应的两个策略是納什均衡点。
例2.1 某博弈问题的博弈表为表2.2。求其纯策略納什均衡点。
表2.2 某博弈问题的收益表
解 在甲方收益矩阵每一列的最大数字上标上*号,在乙方收益矩阵每一行的最大数字上标上*号。单元格(3, 3)有两个*号,所以策略(A 3, B 3)是此博弈问题的納什均衡点。
2.2混合策略博弈
如果没有纯策略納什均衡,可考虑求混合策略納什均衡解。设局中人I 策略的分布为(x 1, x 2, … ,x m ), 局中人II 策略的分布为(y 1, y 2, … ,y n )。那么
x 1 + x 2 +… + x m = 1, x 1, x 2, … ,x m ≥ 0,
y 1 + y 2 + … + y n = 1, y 1, y 2, … ,y n ≥ 0. 局中人I 的期望收益为
E 1(X , Y ) =
∑∑==m i n
j j i ij y x a 11
= X T AY .
局中人II 的期望收益为
E 2(X , Y ) =
∑∑==m i n
j j i ij y x b 11
= X T BY .
其中X = (x 1, x 2, … ,x m )T , Y = (y 1, y 2, … ,y n )T 。
例2.2 (现价折扣促销博弈[2]p73) 考虑销售商与消费者之间的博弈。销售商有“明天打折销售”和“今天打折销售”两个策略,消费者有“明天购买”和“今天购买”两个策略。双方的收益见表2.3,求混合納什均衡解。